대학원 석사, 박사 논문을 쓰기 위해서는
어떤 분야든 막론하고,
"질적 연구 / 양적 연구"를 한다.
하지만 내 연구가 다른 사람에게 더욱 믿음직한(신뢰성이 있는) 연구로 다가가려면
통계를 사용하여 신뢰성 검증을 해야 한다.
통계를 사용하는 검증 방법에는
1) 엑셀
2) SPSS
가 있는데 주로 논문에서는 'SPSS 통계'를 사용한다.
엑셀을 이용한 통계에는 제한점이 있기 때문에
엑셀 파일로 정리한 것을 다시 SPSS로 옮겨서 통계를 내는 경우도 있다.
나는 공대생도 아니고, 이공 계열도 아닌
순수 인문 학문 외길만 걸어 온 사람이기 때문에 통계가 조금 낯설었다.
숫자를 이용해서 인문학적인 가치를 증명하라고?
하지만 정말 100% 순수 인문이 아니라,
인문을 접목시킨 사회 과학이나 교육학 쪽에서도 SPSS 통계가 널리 쓰이고 있는 추세이기 떄문에 통계 공부를 안 할 수가 없었다.
먼저 논문 작성에 필요한 SPSS 통계 알짜배기를 포스팅하지 전에
SPSS 용어에 대해 정리하고 넘어가겠다.
참고로,
SPSS 무료체험판(트라이얼) 버전은 여기에서 다운 받을 수 있다.
https://myibm.ibm.com/dashboard/
먼저 SPSS를 켜면 이 화면이 나온다.
'행'은 변수로 되어 있는데 이 변수에는 '이름, 설문조사 질문 내용 등'을 넣을 수 있다.
'열'은 CASE로 '설문 응답자의 수 등'을 넣을 수 있다.
하단 탭에 '데이터 보기'와 '변수 보기'가 있는데
'데이터 보기'에는 1,2,3,4, .... 변수 로만 나와 있었던 것이
'변수 보기'에 들어가면 '이름, 유형,.... ' 으로 나와있다는 것을 알 수 있다.
여기에서 중요한 용어들을 정리하면,
이것만 알면 웬만한 SPSS 통계 용어는 다 알았다고 생각한다.
왜냐,
시작이 반이니까:)
이미 반이나 했다!
그렇다면 플러스 스텝으로 하나만 더 공부해 보자.
내가 3개 질문이 있는 설문지를 돌렸는데
어떤 사람이 2개만 대답을 했다?
그럼 이 사람의 평균은 3개를 대답한 사람보다 훨씬 낮아진다.
왜냐 무응답이 0으로 표시되니까.
그렇다고 이 사람의 케이스를 버리기에는 아깝고.
유효한 2개 문항에 대해서는 평균을 내고 싶은데 어떻게 하지?
그럼 이 무응답의 값은 '결측값'으로 표시를 해야 한다.
그래서 결측값을 제외한 합계와 평균을 구할 수 있다.
예를 들면 다음과 같다.
2번 케이스 사람이
업무만족1에는 응답을 하지 않았고
업무만족2에는 5점의 점수를 주었고
업무만족3에도 5점의 점수를 주었다.
이 사람의 평균은? 0+5+5 = 3.33 이다.
하지만 업무만족1은 무응답이기 떄문에 이것은 0과 같진 않다.
따라서 무응답은 0이 아니라 결측값으로 보고 이 응답은 제외하고 평균을 구하겠다.
그렇다면
SPSS에서
변환->변수계산 들어가서
목표변수에는 '평균함수'라 쓰고 (아무거나 써도 된다. 그런데 식별 용이하게 이렇게 써 둠.)
숫자표현식에 'MEAN(?,?,?)'을 쓰면 된다.
여기에서 ?은 구하려고 하는 값인데
MEAN(업무만족1,업무만족2,업무만족3)
이렇게 쓰면 되는 것이다.
그러면 위의 표처럼
'평균함수'에는 5점이 나오게 된다.
이건 앞서 '평균' 3.33점과 다른 점수이다.
이정도만 알아도 SPSS는 쉽게 따라올 수 있는 것같다.
다음 시간에는 논문 작성의 기초라고 할 수 있는
"실험집단, 통제집단"의 동질성 검증 독립표본 T검정 에 대해서 이야기하고,
논문을 같이 읽어볼까 한다.
어떤 분야든 막론하고,
"질적 연구 / 양적 연구"를 한다.
하지만 내 연구가 다른 사람에게 더욱 믿음직한(신뢰성이 있는) 연구로 다가가려면
통계를 사용하여 신뢰성 검증을 해야 한다.
통계를 사용하는 검증 방법에는
1) 엑셀
2) SPSS
가 있는데 주로 논문에서는 'SPSS 통계'를 사용한다.
엑셀을 이용한 통계에는 제한점이 있기 때문에
엑셀 파일로 정리한 것을 다시 SPSS로 옮겨서 통계를 내는 경우도 있다.
나는 공대생도 아니고, 이공 계열도 아닌
순수 인문 학문 외길만 걸어 온 사람이기 때문에 통계가 조금 낯설었다.
숫자를 이용해서 인문학적인 가치를 증명하라고?
하지만 정말 100% 순수 인문이 아니라,
인문을 접목시킨 사회 과학이나 교육학 쪽에서도 SPSS 통계가 널리 쓰이고 있는 추세이기 떄문에 통계 공부를 안 할 수가 없었다.
먼저 논문 작성에 필요한 SPSS 통계 알짜배기를 포스팅하지 전에
SPSS 용어에 대해 정리하고 넘어가겠다.
참고로,
SPSS 무료체험판(트라이얼) 버전은 여기에서 다운 받을 수 있다.
https://myibm.ibm.com/dashboard/
먼저 SPSS를 켜면 이 화면이 나온다.
(출처: 통계교육원)
'행'은 변수로 되어 있는데 이 변수에는 '이름, 설문조사 질문 내용 등'을 넣을 수 있다.
'열'은 CASE로 '설문 응답자의 수 등'을 넣을 수 있다.
하단 탭에 '데이터 보기'와 '변수 보기'가 있는데
'데이터 보기'에는 1,2,3,4, .... 변수 로만 나와 있었던 것이
'변수 보기'에 들어가면 '이름, 유형,.... ' 으로 나와있다는 것을 알 수 있다.
여기에서 중요한 용어들을 정리하면,
유형: 숫자, 문자 (← 이 두 개가 제일 많이 쓰임)
너비: 화면에 보이는 문자 길이 (한글은 3byte이기 때문에 2글자를 쓰려면 6이라고 써야 함)
소수점이하자리: 유형을 숫자로 했을 때 말그대로 소수점 이하 자리
레이블: 이름에 대해서 설명해 주는 것 (결과물에는 안 나옴)
값: 값에 대한 설명. 값은 자세히 써 주는 게 좋음
ex. 1=남자, 2=여자 로 값을 지정해 줘야지 나중에 결과물에서 응답자 수 남자:20명, 여자:20명 이렇게 분석이 된다. 값을 지정하지 않으면 1:20명, 2:20명 이렇게 된다.
결측값: 무응답값, 무효값
ex. 설문지 시 응답을 하지 않은 무효값. 결측값을 지정않음으로 하면 . 으로 나온다. 하지만 결측값도 9(예를 들어)라고 지정해 두면 편하다. 결과물에 결측값이 반영될 수 있도록 값과 잘 구분하자.
열: 화면에 보이는 너비
맞춤: 화면에 보이는 정렬 상태. 문자는 자동 오른쪽, 숫자는 자동 왼쪽
들어가면 '이름, 유형,.... ' 으로 나와있다는 것을 알 수 있다.
정도이다.이것만 알면 웬만한 SPSS 통계 용어는 다 알았다고 생각한다.
왜냐,
시작이 반이니까:)
이미 반이나 했다!
그렇다면 플러스 스텝으로 하나만 더 공부해 보자.
내가 3개 질문이 있는 설문지를 돌렸는데
어떤 사람이 2개만 대답을 했다?
그럼 이 사람의 평균은 3개를 대답한 사람보다 훨씬 낮아진다.
왜냐 무응답이 0으로 표시되니까.
그렇다고 이 사람의 케이스를 버리기에는 아깝고.
유효한 2개 문항에 대해서는 평균을 내고 싶은데 어떻게 하지?
그럼 이 무응답의 값은 '결측값'으로 표시를 해야 한다.
그래서 결측값을 제외한 합계와 평균을 구할 수 있다.
예를 들면 다음과 같다.
2번 케이스 사람이
업무만족1에는 응답을 하지 않았고
업무만족2에는 5점의 점수를 주었고
업무만족3에도 5점의 점수를 주었다.
이 사람의 평균은? 0+5+5 = 3.33 이다.
하지만 업무만족1은 무응답이기 떄문에 이것은 0과 같진 않다.
따라서 무응답은 0이 아니라 결측값으로 보고 이 응답은 제외하고 평균을 구하겠다.
그렇다면
SPSS에서
변환->변수계산 들어가서
목표변수에는 '평균함수'라 쓰고 (아무거나 써도 된다. 그런데 식별 용이하게 이렇게 써 둠.)
숫자표현식에 'MEAN(?,?,?)'을 쓰면 된다.
여기에서 ?은 구하려고 하는 값인데
MEAN(업무만족1,업무만족2,업무만족3)
이렇게 쓰면 되는 것이다.
그러면 위의 표처럼
'평균함수'에는 5점이 나오게 된다.
이건 앞서 '평균' 3.33점과 다른 점수이다.
이정도만 알아도 SPSS는 쉽게 따라올 수 있는 것같다.
다음 시간에는 논문 작성의 기초라고 할 수 있는
"실험집단, 통제집단"의 동질성 검증 독립표본 T검정 에 대해서 이야기하고,
논문을 같이 읽어볼까 한다.
댓글
댓글 쓰기