• 최초 작성일: 2014-01-24
  • 최종 수정일: 2014-01-24
  • 조회수: 4,361 회
  • 작성자: 무지개타고
  • 강의 제목: 통계로 세상보기 ㅡ 회귀모형은 수학 방정식이 아니다

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

간단한 예제를 이용해 엑셀에서 단순회귀모형을 구해보자.

로딩 중...

LinEst 함수로 회귀계수를 추정해야겠지만 이번엔 분산형 차트 그린 후 추세선을 이용해 단순회귀모형을 구하고자 한다. 단, 추세선으로 추정된 회귀계수는 정밀도가 떨어져 정확하지 않다. 그래서 LinEst 함수로 구해야 한다.

로딩 중...

창조적 발상(?)으로 중학교 때인가 배웠던 방정식을 떠올리며 X를 추정한답시고 역함수 구하는 이들이 있다.

로딩 중...

결론을 먼저 얘기하면, 틀렸다. 다르다가 아니라 틀렸다. 그들이 떠올린 것은 수학에서는 맞을 지 모르지만 통계학에서 단연코 틀렸다. 나부터도 회귀모형, 즉 회귀방정식을 Y = b0 + b1X라고 간단히 써버리는 습관이 있지만 정확하게는 Y = b0 + b1X + ε이다. 이 때 오차항 ε ~ i.i.d N(0,σ²)으로 가정한다.

로딩 중...

때문에 창조적 발상으로 방정식을 떠올리며 역함수 구해봤자 틀린 답만 구하게 된다.

로딩 중...

그럼 X를 추정해야 될 땐 어쩌라고? 간단하다. 독립변수와 종속변수를 바꿔서 구하면 된다.

로딩 중...

아직도 수학과 통계학의 차이를 못 느끼겠다면 앞서 구한 추세선의 계수를 가지고 X에 대한 역함수를 구해 나중에 구한 추세선의 회귀계수와 비교해 보시기 바란다. 그리고 어느 방식이 잔차제곱합이 더 작은지 비교해 보시라.

로딩 중...