Exceller's Home > 사용자 제공 자료

'무지개타고'님의 통계강좌

- 최초 작성일 : 2008-08-12
- 최종 수정일 : 2008-08-12

- 강좌 읽음수 : 3,097회
- 자료 작성자 : 무지개타고 (조석현님)

- 자료 편집자 :

강좌 제목 : 통계로 세상보기 - (70) 가 = 나 = 다

 

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(http://instatistics.officetutor.org/)를 운영하고 있기도 합니다. 위트와 재미가 있는 통계강좌에 빠져보시기 바랍니다.


예제 파일 내려받기


'가=나' 이고 '나=다' 이면, '가=다' 이다. 무나 당연한 명제라 민망할 정도다. 그런데 이는 수학에서나 그렇다는 것이다. 통계에서라면 답은... "그때그때 달라요~~~"

11 

아래 예제를 보자.

12  13



 

만약 각각의 집단이 정규분포를 각각 따른다고 가정하면...

14 15

위의 그림처럼 가와 나, 나와 다 간에는 평균과 분산이 서로 다름에도 불구하고 겹쳐지는 부분이 상당히 넓다는 것을 알 수 있다. 그리고 각각의 T-검정 또한 유의수준 0.05에서 귀무가설을 기각할 수 없는 것으로 나왔다.

16

그럼 '가=나' 이고 '나=다' 라고 통계적으로 검증됐으니 '가=다' 이겠네? 가와 다를 비교해 보면 알겠지...

17  18




 


유의수준 0.05에서 귀무가설을 기각한다고 나왔다. 그러므로 '가=나' 이고 '나=다' 이라도, "'반드시 가=다' 이다"고 할 수 없다. 그런데 위의 검증 방식에는 통계적인 문제가 있다. 좀 어려운 내용이 있는데 그건 다행히(?) 벌써 잊어버렸고... 동시성에 문제가 생긴다.

19

각각의 집단이 서로 차이가 없다고 가정한다면, 즉 단일한 분포 '전체'의 일부분이었다면 각각의 집단은 '전체'와 동일한 분포를 보여줘야 한다. 그러므로 '가=나=다' 인가를 동시에 검증할 필요성이 생긴다.

20

그래서 두집단 일때는 T-검정을 이용하고 다집단 일 때는 분산분석(ANOVA)을 이용하는 것이다(물론 두집단 일 때도 양측검정에 한해 분산분석을 이용할 수 있다).


Previous

Next

Copyright ⓒ Since 2008 아이엑셀러 닷컴. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.

본 강좌의 내용은 필자 개인의 견해이며, 아이엑셀러 닷컴의 공식 견해와 일치하지 않을 수도 있습니다.