HOME > 사용자 제공 자료 > 통계로 세상보기

'무지개타고'님의 통계강좌

- 최초 작성일 : 2012-07-19
- 최종 수정일 : 2012-07-19

- 강좌 읽음수 : 5,453회
- 자료 작성자 : 무지개타고 (조석현님)

- 자료 편집자 : Exceller (권현욱)

강좌 제목 : 통계로 세상보기 - '근사식'이 아니라 '회귀식'이에요

 

'무지개 타고' 님의 통계 강좌를 재개합니다. '무지개 타고' 님은 그동안 블로깅을 계속 해오셨으나 Exceller의 게으름으로 제때 게재하지 못했습니다. 우리 주변의 친숙한 주제를 통계와 접목하여 강의하고 계시는 '무지개 타고' 님에게 감사의 말씀을 드립니다.

'무지개 타고'님의 블로그


예제 파일 내려받기


지식iN에 올라온 질문이다. 예제는 아래와 같다.

엑셀에서 분산형 차트를 선택한 후 추세선을 구한다.

이렇게 구한 회귀계수를 이용해 추정치를 계산한다.

그런데 그래프로 나타내니 추정치가 관찰값과 너무 동떨어져 나타났단다.

뭐가 문제일까?

계산된 회귀계수와 차트에 나타난 회귀계수 간에 차이가 있으나 이는 엑셀의 오류라기 보단 표시형식의 제약 때문이다. 회귀계수가 길게 나왔다고 해서 제한된 영역에 모두 표기할 수는 없기에 회귀계수의 표시형식을 지수로 나타낸 것 뿐이다. 때문에 정확한 결과를 얻고자 한다면 반드시 함수를 이용해 회귀계수나 추정치를 계산해야 한다.

그런데 어느 분이 올린 답변을 보니, 뭐라뭐라 하며 이는 "근사식"이라고 한다. 훨~~~ 아마도 비전공자에게 쉽게 말하기 위해 그랬을 수 있지만, 통계에 대한 인식의 한 단면을 보는 것 같아 씁쓸하다.

회귀분석은 종속변수와 독립변수의 관계를 함수로 나타낸 것이다. 이때 관찰값과 추정치의 차이, 즉 오차는 평균이 0 이고 분산이 σ² 이며 서로 독립이며
등분산인 정규분포를 따른다고 가정한다.

그리고 회귀모형은 무한대로 존재 가능 하지만, 그 중 가장 작은 오차제곱합을 갖는 유의미한 최적의 회귀모형은 분석자가 찾아내야 한다. 때문에 이는 고된 작업이고, 통계 프로그램도 처리할 수 없는 분석자 고유의 영역이다. 그런데 이를 "회귀식"이 아닌 "근사식"이라고 하니... 뭐라 얘기해줘야 할지 좀 당황스럽다. -_-;;

어쨌든 예제에서의 회귀계수와 추정치는 아래와 같다.

h2 셀 (LinEst_Y, b0)
=EXP(INDEX(LINEST(LN($B$2:$B$9),$A$2:$A$9,TRUE,FALSE),1,2))

h3 셀 (LinEst_Y, b1)
=INDEX(LINEST(LN($B$2:$B$9),$A$2:$A$9,TRUE,FALSE),1,1)

d2 셀 (LinEst_Y)
=EXP(SUMPRODUCT(LINEST(LN($B$2:$B$9),$A$2:$A$9,TRUE,FALSE),A2^{1,0}))

 


Previous

Next

Copyright ⓒ Since 2012 아이엑셀러 닷컴. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.

본 강좌의 내용은 필자 개인의 견해이며, 아이엑셀러 닷컴의 공식 견해와 일치하지 않을 수도 있습니다.