Exceller's Home > 사용자 제공 자료

'무지개타고'님의 통계강좌

- 최초 작성일 : 2008-04-05
- 최종 수정일 : 2008-04-05

- 강좌 읽음수 : 3,186회
- 자료 작성자 : 무지개타고 (조석현님)

- 자료 편집자 : Exceller (권현욱, exceller@amorepacific.com)

강좌 제목 : 통계로 세상보기 - (44) 당신은 무슨 기사를 읽었습니까?

 

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(http://instatistics.officetutor.org/)를 운영하고 있기도 합니다. 위트와 재미가 있는 통계강좌에 빠져보시기 바랍니다.


예제 파일 내려받기


- '빅뱅' 급류…심상정 '사퇴', 평당원 '탈당 러시'

기사 내용은 언제나처럼 알아서 판단하시기 바라고... 위의 기사 하단에 보면 '이 기사, 누가 봤을까?' 라는 단추가 하나 있다.

01

이를 눌러보면 아래와 같은 화면이 나타난다.

021 

022

여기에 여러 수치들이 기재되어 있는데 뭐가 뭔지 모르겠다.

- '이 기사, 누가 봤을까?' 서비스 공지

Daum 측의 소개 내용을 참고로 내 맘대로(?) 정리해보면...(이후의 내용은 개인적 해석이므로 Daum의 목적 및 사실과 다를 수 있습니다)

- 조사 대상 : Daum 서비스 (로그인) 접속자(?)
- 조사 방법 : 인터넷 메타데이터 분석(?)
- 분석 대상 : 6,772명

위 그래프에서 가장 헷갈렸던게 '평균'이라는 것이었는데, Daum의 소개를 보면...

개별 기사의 관심도를 알아보기 위해 평균과 개별 기사를 비교합니다. 이때 기준이 되는 평균값이란 지난 한달 간 미디어다음의 모든 기사를 종합하여 산출된 값입니다.

아마도 최근 한달 동안 Daum에 로그인한 접속자들 중 기사 서비스를 이용한 회원들의 성별, 연령별 기사 구독 비중이 될 가능성이 높다. 즉 Daum 회원들에 일종의 기사 구독 성향을 알려주는 것이라고 생각된다.

그렇다고 했을 때, 평균 수치가 없어 정확하지는 않지만,
여성은 20대 > 30대 > 40대 > 10대 > 50대 순,
남성은 30대 > 20대 > 40대 > 50대 > 10대 순으로

기사 서비스를 이용하고 있다. 이 정보는 별거 아닌 것 같지만 적어도 이를 통해 성&연령별 비중이 다르다는 것을 유추할 수 있다. 그리고 제한적일지라도 서비스의 주 이용자가 누군지에 좀더 접근 할 수 있게 된다. 이번엔 해당 기사를 기준으로 살펴보면, 기사 접촉자 중 여성이 17.6%, 남성이 82.4% 로 차이가 많이 난다. 그리고 이를 성별로 정리하면,

03
※ 단, 평균 보다 높으면 ▲, 낮으면 ▼

여성의 연령별 비중은 30대 > 40대 > 20대 > 50대 > 10대 의 순으로 이 기사를 이용했는데, 앞서 여성평균과 다른 순위를 보여주고 있다. 물론 남성의 연령별 비중도 순위에 변화가 있다(30대 > 40대 > 20대 > 50대 > 10대). 즉, 기사 내용에 따라 접촉하는 이용자의 특성이 다르다는 것을 눈치챌 수 있다(제한된 자료라 일반화 하기는 어려우나, 아마도...). 젊은 세대의 정치 무관심과 고연령대의 낮은 인터넷 이용률이 반영된 결과가 아닐까 한다.

그럼 다른 기사는 어떨까?

- 신해철 "국무회의부터 영어로 해라"

참고로 앞서 기사가 정치면으로 분류된 반면, 이 기사는 사회면도 아닌 방송/연예로 분류되어 있다. 그래서인가? 일단 분석대상 크기에 압도당한다. -_-;

- 분석 대상 : 127,648명

041

042

그리고 성별 비중이 여성 47%, 남성 53%로 비등하게 나타난다. 이는 앞서 기사의 성별 비중과는 많은 차이를 보여준다.

05

또한 성&연령 비중 또한 차이를 보여준다.
여성 20대 > 30대 > 40대 > 10대 > 50대
남성 30대 > 20대 > 40대 > 50대 > 10대

이것으로 짐작컨대, 차이는 있지만 평균적인 비중과 조금은 유사한 분포 형태를 보여주고 있다(그래프만으로 판단했을 때).

- 여성의 경우, 여성평균 보다 높은 연령대가 하나도 없다는 것
- 남성의 경우는 수치들을 합한다고 했을 때 평균의 합 보다 더 높아 보인다는 것이 눈에 띄는데 이 얘긴 건너뛰겠다)

서로 다른 두개의 기사를 통해 이런 가정을 설정해 보는건 어떨까.
- 기사 내용에 따라 성별 구독 성향에 차이가 있다.
- 기사 내용에 따라 연령별 구독 성향에 차이가 있다.
- 기사 내용에 따라 성&연령별 구독 성향에 차이가 있다.

그러나 이 자료는 제한된 자료이기에 이 결과를 일반화 할 수는 없다. 여기서 다시 Daum 측의 소개 자료를 보면...

통계청에서 실시하는 인구주택총조사처럼 전체 인구를 대상으로 한 조사가 아니며, 모집단과 표본을 갖춘 여론조사와도 다른 방식입니다. 이에 분석 결과값에 오차가 크게 발생할 수 있어 해당 서비스를 통계적으로 인용 할 수 없습니다.

Daum도 밝히고 있는 것처럼, 이 자료는 대표성이 부족하기 때문에 이를 통해 모수를 추정할 수 없다. 그러나 그러할지라도 적어도 사전조사의 성격을 갖는다고 나는 생각한다. 네티즌의 관심 분야 파악 및 광고 효율 극대화 등등을 위해서, 아무리 표본의 대표성이 미흡할지라도 Daum 이용자들이 네티즌의 성향을 대변할 수 없다고 해도 충분히 참고 가능한 자료라고 감히 생각하는데 여러분들은 어떻게 생각하는지 궁금하다.


Previous

Next

ⓒ Since 2008 Exceller Corporation. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.

본 강좌의 내용은 필자 개인의 견해이며, 아이엑셀러 닷컴의 공식 견해와 일치하지 않을 수도 있습니다.