HOME > 사용자 제공 자료 > 통계로 세상보기

'무지개타고'님의 통계강좌

- 최초 작성일 : 2008-12-16
- 최종 수정일 : 2008-12-16

- 강좌 읽음수 : 3,434회
- 자료 작성자 : 무지개타고 (조석현님)

- 자료 편집자 :

강좌 제목 : 통계로 세상보기 - (98) 이게 그건가 - 네번째

 

'무지개 타고'님의 통계 강좌를 시작한 지도 1년이 넘었군요. 우리 주변의 친숙한 주제를 통계와 접목하여 좋은 강의를 하고 계시는 무지개 타고(조석현)님께 다시 한번 감사드립니다. '통계로 세상보기' 블로그에 들르셔서 감사의 인사를 남기는 센스를 발휘하셔도 좋겠지요? ^^

통계로 세상보기 블로그


예제 파일 내려받기


배구협회의 자료를 보다가 뭔가 재미있을 것같은 생각이 들어서 언제나처럼 내 맘대로 살펴본다(※주의 : 이후 자료는 인용 및 분석 과정에 오류가 있을 수 있습니다).

V리그 여자 1라운드 결과 팀별 공격점유율이 높은 상위 2명의 평균 공격점유율 및 평균 공격성공률이다.

01 02

그림이 작게 붙여져 있는데, 아무래도 스카웃 한 만큼 외국인 선수의 공격점유율 및 공격 성공률이 내국인 선수보다 높게 나타나고 있다. 그리고 전체적으로 공격점유율이 높을수록 공격성공률 또한 높다.(슈퍼우먼인가? 둘 다 높게...) 그러나 내외국인 선수를 따로 떼 놓고 보면 외국인 선수는 약한 음의 상관관계, 내국인 선수는 양의 상관관계를 보여준다(이해가 안 되네...).

여기서 엉뚱한 생각이 고개를 쳐든다. 외국인, 내국인 그 둘을 나누자! 판별분석이 아니라 로지스틱 회귀분석으로(로지스틱 회귀분석에 대한 자세한 내용은 별도 확인 바람). 이 때 종속변수는 국적이 되며 이진변수로 나타냈다. '0' 이면 내국인, '1' 이면 외국인. 그리고 독립변수는 공격점유율과 공격성공률.

03
04

이렇게 밑그림을 대충 그려 놓고...

F3 셀 :
=EXP($J$3+MMULT($C3:$D3,$J$4:$J$5))/(1+EXP($J$3+MMULT($C3:$D3,$J$4:$J$5)))

J6 셀 :
=SUMXMY2(E3:E12,F3:F12)

J7 셀 :
=SUMPRODUCT(N(E3:E12-F3:F12))

해당 셀에 수식 입력을 마쳤다면 엑셀에서 '해 찾기' 기능을 불러온다. 정상적인 방법은 아니나 통계분석용 프로그램이 없다면 꼼수로...

05 

이 때 옵션을 좀 손봐줘야 하는데, 엑셀의 해 찾기 기능에서 옵션이 뭘 어떻게 하는건지 도무지 모르겠다.(-_-) 어쨌든 수렴도를 0.9에서 시작해 점차 작은 값으로 바꾸기를 수차례...

06 

그 결과 추정국적은 국적과 마찬가지로 '1'에 가까우면 외국인, '0'에 가까우면 내국인이다(만약 0.5 라면 무국적자?).

07
08 09

로지스틱 회귀분석 결과 내국인 선수 한명의 기량은 외국인 선수에 가까운 것으로 추정되었다. 이를 그래프에 나타내면,

10 11

판별선 삽입을 위해 공격점유율에 임으로 값을 입력한 후, 공격성공률은 아래와 같이 계산한다.

J20 셀 :
=-($J$3+I20*$J$4)/$J$5

앞서 얘기한 상관관계로 돌아가서, 슈퍼우먼을 외국인이라 분류하면, 외국인 선수는 좀더 약한 음의 상관관계, 내국인 선수는 강한 음의 상관관계로 바뀐다. 슈퍼우먼 한 명의 영향력이 대단하다. 상관계수의 방향을 바꿀 정도라니 말이다.


Previous

Next

Copyright ⓒ Since 2008 아이엑셀러 닷컴. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.

본 강좌의 내용은 필자 개인의 견해이며, 아이엑셀러 닷컴의 공식 견해와 일치하지 않을 수도 있습니다.