• 최초 작성일: 2009-02-11
  • 최종 수정일: 2009-02-11
  • 조회수: 7,774 회
  • 작성자: 무지개타고
  • 강의 제목: 통계로 세상보기 ㅡ 긴 휴식은 공격성공률에 어떤 영향을 줄까?

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

얼마 전 배구장에 다녀왔다. 배구장 가본 지 10년은 족히 넘은 것 같다.

로딩 중...

연습 중인 모습을 하나 찍었는데 찍사가 신통치 않다. (-_-)

어떤 선수의 3라운드와 4라운드의 공격성공률을 보자. 굳이 3, 4 라운드를 선정한 것은 3라운드와 4라운드 사이엔 열흘 정도의 휴식기간이 있는데, 휴식기간이 그 선수의 '공격성공률'에 영향을 주었는 지를 보기 위해서였다.

그러나 여기서 간과할 수 없는 것은 다른 선수도 쉰다는 것. 즉 '공격성공률'이라는 척도가 어떤 선수의 공격력 차이를 합리적으로 보여주기엔 미흡한 면이 없지 않지만 이 부분은 그냥 그러려니 하자.

로딩 중...

집단 간 차이 비교이니 T-검정이나 일원배치법을 이용하면 되는데, '공격점유율'이라는 변수를 더 추가해 본다.

로딩 중...
로딩 중...

벌써부터 골이 띵~ 해진다(어쩐담?). 선학자들이 이럴 걸 궁리해서 만든 분석 방법이 있는데, 공분산분석ANCOVA이란 걸 써먹자(공분산분석에 대한 자세한 내용은 별도 확인 바람). 공분산분석은 대충 '회귀분석 + 분산분석'이라고 보면 된다. 계산의 편리를 위해서 자료 배치를 조금 수정한 후 회귀분석을 돌린다.

로딩 중...

간단모형과 완전모형에 대한 잔차제곱합은 아래와 같이 구하면 된다.

S11: =INDEX(LINEST(R3:R10, S3:S10, TRUE, TRUE), 5, 2)
V11: =INDEX(LINEST(U3:U10,V3:X10, FALSE, TRUE), 5, 2)

여기서 간단모형과 완전모형의 독립변수를 보면 '공격점유율'이 공통적으로 존재한다.

로딩 중...

따라서 완전모형에서 간단모형을 제하면 '라운드'(집단)의 변동만 남게 된다. 단, 잔차제곱합을 이용해야 되므로 계산은 '간단_잔차제곱합 - 완전_잔차제곱합'으로 한다.

앞에서 계산된 각각의 잔차제곱합을 보면, 완전모형에는 가변수로 '라운드' 변수가 두 개나 추가됐음에도 간단모형에 비해 잔차제곱합는 높게 나오지 않았다. 즉 종속변수인 '공격성공률'을 설명하기엔 '라운드'의 변동이 힘이 딸려 보이는 양상이다. 위에서 공분산분석은 회귀분석과 분산분석을 합체(?)한 것이라 하였다. 회귀분석은 진행했으니 분산분석만 처리하면 결과를 얻을 수 있겠다.

로딩 중...

그 결과, '공격점유율'의 영향력을 제거했을 때 유의확률은 0.918이므로 유의수준 0.1에서 '공격성공률'은 '라운드' 간 차이는 없다. 즉 '공격점유율'이 '공격성공률'에 어떤 영향을 주든지 상관 없이 '라운드' 간에 '공격성공률'은 동일하다는 것이다. 이것은 어떤 선수의 공격성공률은 일정 수준을 꾸준히 유지하고 있다는 얘기가 된다.

로딩 중...

공분산분석을 사용할 때 가정을 만족하지 못한다면 이 분석방법은 아쉽지만 무용지물이 된다.

언제나 말하듯, 숫자가 거짓말을 하는 게 아니라 사람이 거짓말을 하는 것이다.