• 최초 작성일: 2007-08-17
  • 최종 수정일: 2007-08-17
  • 조회수: 11,630 회
  • 작성자: 무지개타고
  • 강의 제목: 통계로 세상보기 ㅡ 숫자라고 해서 다 같은 건 아니다

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

많은 분야에서 우리는 숫자를 사용한다.

  • 좋아하는 운동선수 백넘버 기억할 때
  • '디워'가 예매율 1위라고 할 때
  • 고층 아파트에 산다고 할 때
  • 설악산 높이는 1708m라고 할 때
  • 만족도가 얼마라고 할 때

그럼 뜬금 없는 질문 하나.

이게 숫자라는 건 알겠는데 이 숫자는 우리에게 뭘 말해 주는 것인가?

박찬호를 좋아하는 사람은 '61' 이라는 숫자를 기억하고 있을 것이다.
차범근을 좋아하는 사람은 '11' 이라는 숫자도 기억할 것이다.
그런데 그 61, 11의 의미는?

아무 의미 없다. 단지 차범근, 박찬호를 구분하기 위해 '11', '61' 이라는 숫자를 따온 것 밖에 없다. 이렇게 어떤 식별을 위해 부여한 수를 '명목척도'라 한다. 엉뚱한 상상력을 발휘해서 차범근에 박찬호를 더하면, 즉 11 + 61 = 72 라는 백넘버를 달고 있는 선수는 슈퍼스타 인가? 이렇듯 명목척도는 산술연산을 할 수 없다.

'디워'가 예매율 1위고 '화려한 휴가'가 2위란다. 이렇게 순위를 나타낼 때 사용되는 수를 '순위척도'라 한다. 이 순위척도는 우리에게 디워 예매율이 화려한 휴가보다 높다는 정보를 알려준다. 그렇지만 1위가 2위보다 얼마나 차이 나는 지는 모른다. 그래서 순위척도 또한 산술연산을 할 수 없다(어찌보면 당연한 걸 멋적게 되풀이 하고 있는 중인지도 모르겠다).

길동이는 6층에 살고 순애는 14층에 산다. 여기서 층이란 정해진 높이 만큼을 쌓아 올린 것이다. 즉 일정한 간격을 기준으로 하는 숫자를 '등간척도'라 한다. 그리고 2층에서 3층 오를 때에 노력은 29층에서 30층에 오를 때의 노력과 같다. 또한 6층에 14층을 쌓으면 20층과 같다고 할 수 있다(6 + 14 = 20). 그러나 25℃에 10℃를 더하면 35℃라고 말할 수는 없다(25 + 10 ≠ 35). 그래서 등간척도의 산술연산 적용은 그때그때 다르다.

그럼 이쯤에서... 설악산 높이는 해발 1708m이고 해수면은 0m다. 여기서 숫자 0만 놓고 본다면 해수면이란 자체가 존재할 수 없지만 존재한다(이는 당연하다. 해수면의 높이를 0m 라고 정의했기 때문이다). 그런데 동일한 단위인 m를 사용하는 길이는 어떨까?

1000m, 100m, 10m, 1m, 0.1m, 0.001m, 0m

여기서 0m의 의미는 단순히 길이가 0m 라는 정보뿐만 아니라 존재하지 않는다는 정보도 내포하고 있다. 확률도 그렇다. 확률은 0 과 1 사이에 존재하는데, 확률이 0 이면 그 사건은 발생되지 않는 것이다. 이렇듯 등간척도이면서 존재 여부를 판단할 수 있는 수를 '비율척도'라 한다. 그리고 비율척도는 산술연산에 대해 자유롭다.

척도의 종류에 대해서 어수선하게 나열해 봤는데 이거 모른다고 일상생활 하는데 하등 지장 없지만 그래도 복습 차원에서 숙제를 하나 내보자.

문) ○○님은 Excel 2007의 기능에 대해 어느 정도 만족하십니까?
① 매우 만족한다.
② 만족한다.
③ 보통이다
④ 불만족한다
⑤ 매우 불만족한다
⑨ 모름/ 무응답

라고 질문 했을 때 어느 척도에 해당하는가? 그리고 6명이 각각에 응답했다면 평균은 얼마인가?

위 문항은 엑셀 사용 경험자들의 만족도를 구하고자 하는 의도로서 가운데를 중립적인 의견으로 하여 양 끝에 긍정과 부정으로 대립각을 세우고 일정한 간격(?)으로 나누는 것을 통상 5점척도(리커트척도)라 한다. 그리고 처리 작업 시 각 응답의 대표치는 '매우만족한다'는 5점, '보통이다'는 3점, '매우불만족한다'는 1점으로 대표치를 부여한다.

그리고 '모름/무응답'은 문항의 의도와는 동떨어진 응답으로 처리에서 제외한다. 응답번호를 ⑥이 아닌 ⑨를 준 건 개인적 취향으로, 연속된 번호 ⑥을 부여했을 때 매번 확인해야 하는 불편이 있어서이다.

로딩 중...

자, 그럼 위 5점척도는 앞에서 살펴본 척도 중 어느 척도에 해당될까?

대표치의 의미는 만족도를 가리키고 숫자가 높을수록 만족도가 높고 숫자가 낮을수록 만족도는 낮다는 의미이다. 그래서 5점척도는 순위척도에 해당된다. 그렇다면 평균은? 순위척도는 산술연산을 할 수 없다고 얘기했으므로 당연히 평균을 구할 수 없다.

하지만 도저히 납득되지 않는 이유로 사회과학에서는 5점척도를 등간척도로 구분하여 평균뿐만 아니라 분산을 만들어 내고 더 나아가 통계적 분석 방법을 적용한다. 내 분야도 아니기에 찾아보진 않았지만 아마도 각 응답 내용은 등간격을 유지한다는 전제 하에 출발하는 것 같은데, '만족한다'와 '보통이다'의 차이가 '불만족한다'와 '보통이다'의 차이와 같다고 말할 수 있나?(기본적으로 순위척도에 기반하고 있기 때문에 같다고 할 수 없다). 또는 '매우만족한다'면 '보통이다' 보다 2배 더 만족감을 느끼고 있는 것인가? 그리고 '매우불만족한다'는건 만족하지 않는 것과 같은 건가 다른 건가?(어찌 보니 말장난 같아 보이는군)

그리고 아무리 이산형자료 discrete distribution라지만 위의 응답 내용의 범주는 응답자의 의견을 강제하고 있다. 즉 100점 만점으로 응답할 때는 79점의 만족점수를 줄 수 있지만 5점 척도에서는 '만족한다'고만 응답해야 한다. 이러한 제약 때문에 5점척도는 100점 만점보다 자료의 흩어짐이 작다. 이게 뭔 소린가 하면,

로딩 중...

등간격이라고 가정하고 5점척도를 100점만점으로 재구성해 보면 위와 같다. 이 때 자료의 크기가 현격하게 다르므로 변동계수를 이용해 자료의 흩어진 정도를 표준화시켜 살펴보면 5점척도가 100점만점보다 작다는 것을 알 수 있다. 물론 위의 계산 과정은 단편적인 계산이라는 한계를 안고 있으나 자료(변수)의 변환으로 인해 의도하지 않은 결과를 초래할 수 있다는 것을 보여주고 있다. 즉 분산이 상대적으로 작다면 귀무가설을 기각하고 대립가설을 채택할 가능성이 높아진다.

이는 부적절한 척도 사용으로 인해 '제1종오류' 발생 가능성을 높일 수 있는 개연성을 안고 있다는 문제점을 발생시킨다. 제1종오류는 '사실'을 사실이 아니라고 잘못 결정하는 오류를 일컫는다. 이에 반해 '거짓'을 사실이라고 잘 못 결정하는 오류를 '제2종오류'라 하고, 두 오류는 언제나 공존하기에 통계는 제1종오류를 줄이는데 주안점을 둔다. 그래서 95% 신뢰수준은 들어봤어도 70%, 80% 신뢰수준은 못 들어본 이유가 이 때문이다.

그리고 다른 얘기지만, 우리가 통상 100점만점이라고 했을 때 '보통'이라면 몇점을 줄까? 적어도 60점 이상 줄 것이다. 왜냐하면 60점 미만은 F학점으로 재수강 해야 될 정도로 낮은 점수이기 때문이다. 그런데 위에서처럼 50점을 배정한다는 것은 전혀 현실성이 떨어진다. 이러니 노무현 정부가 언론과 대립각을 세우지 않을래야 않을 수가 없는 것이다.

  • 주요정책 국민만족도에 대한 오해와 진실 (연결 정보 손실)

아마도 사회과학 쪽에서도 5점척도에 대한 논의는 해봤을 것으로 미루어 짐작한다. 그리고 어떻게 물을 지는 연구자의 선택이지만 적어도 5점척도를 굳이 등간척도라 우기며 분산분석, 요인분석 등 통계적 분석 방법을 적용할 게 아니라 빈도분석을 적용하던지 아니면 애초부터 100점 만점으로 응답을 받는 게 옳을 것이다.

문) ○○님은 Excel 2007의 기능에 대해 어느 정도 만족하십니까?
긍정일 경우 100점 만점으로 응답해 주십시오.

이렇게 쉬운 방법을 놔두고 왜 굳이 5점척도를 사용하는지 알다가도 모를 일이다. 그리고 몇번을 떠들어도 업계에서는 알아듣는 이도 없다. 말로는 별 차이가 없어서 쓴다고 하는 것 같은데 차이가 없긴 왜 없나? 벌써 분산이 작아지고 있으며 인식되는 점수가 다른데. ㅉㅉㅉ