Exceller's Home > 사용자 제공 자료

'무지개타고'님의 통계강좌

- 최초 작성일 : 2008-01-06
- 최종 수정일 : 2008-01-10

- 강좌 읽음수 : 3,635회
- 자료 작성자 : 무지개타고 (조석현님)

- 자료 편집자 : Exceller (권현욱, exceller@amorepacific.com)

강좌 제목 : 통계로 세상보기 - (40) 일 방문자 수

 

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(http://instatistics.officetutor.org/)를 운영하고 있기도 합니다. 위트와 재미가 있는 통계강좌에 빠져보시기 바랍니다.


예제 파일 내려받기


어느덧 블로그 개설한지도 반년 되어가고, 허접한 글이지만 불특정 다수(?)가 찾아와서 봐준다는 것에 고맙게 생각하며... 이에 그동안 일 방문자수를 집계, 분석해볼까 한다. 자료는 최근 3개월(9월~11월) 동안 내 블로그에 기록된 일 방문자수다. 분석방법은 적합도검정을 이용하겠다(적합도검정에 대해서는 별도 확인 바람).

우선적으로 자료의 대략적인 윤곽을 먼저 검토하는 차원에서 돗수분포표를 작성해야 되는데, 귀찮으니 차트를 이용해본다.

 01

음... 모르겠다. -_-;;

변수는 "날짜", "방문자수" 달랑 두 개다. 그런데 "날짜"를 이용해서 몇 가지 정보를 끄집어 낼 수 있으므로 추가로 "요일" 및 "월" 변수를 새로 생성할 수 있겠다. 그럼 간단하게 "요일" 변수를 기준으로 간략한 집계를 하자.

 02

음... 뭔가 하나 건질 수 있는 분위기 같군...

그럼 통계적 분석을 위해서 가설을 먼저 설정해야 하는데, 귀무가설을 이렇게 세워볼까?

Ho : 요일간 방문자 점유율에 차이는 없다.
(이를 달리 말하면, '요일간 방문자수는 같다'와 동격이 된다.)

이를 통계적 표현으로 나타내면...

03

좀 부연 설명을 한다면...

만약에 1주일 동안에 700명이 방문했다고 하자. 각각의 요일에 100명 씩 방문했다면, 각각의 요일은 1/7 씩을 점유한다. 그런데 월요일이 주간 방문자 수에 1/4를 점유한다면, 다른 요일은 남은 3/4 의 점유율을 다시 6으로 나눈 (3/4)/6 ⇒ 1/8 로 줄어들게 된다. 즉 요일간 점유율에 차이가 발생되게 된다. 그래서 자료를 정리하면...

 04

그럼 이제 귀무가설이 의미 있는지 없는지, 즉 귀무가설을 채택할 것인지 기각할 것인지를 결정한다. 적합도 검정 결과 P값이 4.1546×10^(-37) 로 매우 작은 값이다. 유의수준이 0.05라고 할때, 유의수준>P값 이므로 귀무가설은 기각된다(물론 유의수준 0.01에서 귀무가설은 기각된다).

그렇다면 이 차이가 발생하는 원인은 뭘까? 간단히 위에 요일별 평균 자료을 봤을때, 월요일과 일요일에 점유율이 가장 동떨어진 수치를 나타내는 것으로 봐서... 내 블로그를 찾는 이들의 성향이 다른 요일에 비해, 월요일과 일요일에 가장 뚜렷한 차별성을 보인 결과라 하겠다.

그럼 그 차별성은 왜 생긴 것일까? 그런데 자료도 부족할 뿐만 아니라, '인과관계적' 원인을 밝히는 것은 통계의 범주가 아니다. 통계는 변수들간 관계를 이용해 귀납적으로 추론하는 학문이기에, 인과관계를 규명할 수는 없기에, 위에서처럼 월요일, 일요일 자료가 튀었다라고 밖에, 그 이상 얘기할 수 없다.

그러나 실질적 원인은 아마도... 라이프스타일을 고려했을 때, 일요일 인터넷 이용률 자체가 낮기에 일요일 방문자수 또한 낮게 나왔을 것이다. 그리고 오피스튜터에서 발송하는 메일에 소개된 글 제목에 낚여서(?) 월요일 방문자수가 높게 나오는 것이라고 본다.

물론 오튜 메일에 대한 가정을 검증하기 위해서는 별도에 실험을 수행해야 한다.
- 내용은 지금에 허접 수준을 유지하면서, 낚시성 제목을 계속 단다
- 내용은 더 허접하게 작성하면서, 낚시성 제목은 달지 않는다
- 지금에 허접 수준과 낚시성을 유지하되, 오튜측 메일 발송일을 목요일로 조정한다
- 기타 등등

처럼 해야 하는데, 계속 허접해 왔지만 그래도 내 블로그를 찾는 방문자에게 차마 하지 못할, 윤리적 책임을 져야 하는 문제가 발생되기에 이런 실험은 어렵겠다. 얘기가 곁다리로 많이 빠졌는데...

자 그럼 위에서는 요일간에 방문자수 차이를 검토했다면, 이번엔 조금 다른 시각으로 다시 접근해 보자.

Ho : 평일 내 요일간 방문자 점유율에 차이는 없다.

 05

06

유의수준 0.05 일때, 유의수준>P값 이므로 귀무가설을 기각한다. 역시나 평일이라도 월요일에 점유율이 높게 나왔다. 위에서 말한 심증이 좀더 굳어져 간다고 할까나...

여하튼 낚였든, 낚이지 않았든 고맙게 생각한다.


Previous

Next

ⓒ Since 2007 Exceller Corporation. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.

본 강좌의 내용은 필자 개인의 견해이며, 아이엑셀러 닷컴의 공식 견해와 일치하지 않을 수도 있습니다.