Exceller's Home > 사용자 제공 자료

'무지개타고'님의 통계강좌

- 최초 작성일 : 2007-08-25
- 최종 수정일 : 2007-08-25

- 강좌 읽음수 : 4,910회
- 자료 작성자 : 무지개타고

- 자료 편집자 : Exceller (권현욱, exceller@amorepacific.com)

강좌 제목 : 통계로 세상보기 - (15) 딱히 몰라도 되는 산 이야기

 

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(http://instatistics.officetutor.org/)를 운영하고 있기도 합니다. 위트와 재미가 있는 통계강좌에 빠져보시기 바랍니다.


예제 파일 내려받기


우리나라 면적의 65% 가량이 산림이라 할 정도로 산이 많은데, 산 좋아하는 사람이라면 모두 알고 있을 한국의 산하 사이트를 참고하여 정리 좀 해봤다. 들어가기에 앞서 잠깐 확인할 사항 중 하나가 산의 위치인데, 지리산 같은 경우 전라남북도, 경상남도 등 3개의 도에 걸쳐있지만 자료 정리의 편리상 경상남도로 구분하였다. 즉 행정구역이 여러 도에 걸쳐있는 산의 경우 임의로 행정구역을 정리하였다(지리산을 경상도로 표기했다고 하여 섭섭해 하지 마시기를 바란다). 그리고 산 이름이 산(山)'으로 끝나는 경우만 반영했다. 즉 '봉(峰)'은 처리 대상에서 제외했다는 거~~~

우리나라에서 가장 높은 산은?
아마 이건 대부분 알고 있을 것이다. 이렇게 높은 순으로 다섯 산을 골라보면...

01

그럼 가장 낮은 산은?
가본 산 중에서는 유달산이 가장 낮았던 것으로 기억되는데 어디 보자...

02

제황산이란 산이 있는 줄도 몰랐지만, 높이가 28m라고 하니 솔직히 저 산은 산으로 여겨지지 않는다. 언제 기회가 되면 한번 가봐야 되겠다. 그런데 많이 멀다. 그건 그렇고 자료 정리하면서 보니 동명이산이 여럿 보이기에 동명이산 목록을 구성해봤다.

03

봉우리가 다섯개라서 오봉산일텐데 좀 많아 보인다. 산에 별 관심없는 이들은 잘 모르고 있을텐데, 위에서 보듯 봉우리 갯수로 이름을 지어도 삼봉, 오봉, 구봉 이렇게 홀수로 나가지 짝수로 나가는 경우는 없다는거.

그런데 예외가 있다. 팔봉산이라고 홍천에 하나 있고 서산에 하나 있는데, 홍천에 팔봉산은 필히 가볼만한 산으로 강추다. 산은 302m로 나즈막한데 반해 봉우리 여덟개를 오르락내리락 하다보면 힘이 들어 결국 8봉은 밟지 못했다. 그러나 산은 아기자기 하면서 무척 재밌는 산이다(특히 해산굴은 필수 코스니 도전해 보기 바란다. 물론 난 통과했다. *^^*). 그리고 홍천강과 유원지를 끼고 있어 산행 후 쉬기도 편리하고 전망 또한 멋진 산이다.

재미삼아 숫자로 된 산만 구성해 봤는데...(단, 한자까지는 확인하진 않았음)

04

위 자료에서 팔봉산이 조금 어긋났으나, 대체적으로 봉우리 수가 많을수록 평균높이가 낮아지는 재밌는 경향이 보인다(어째 그럴까나?).

자 이번엔 전국 산 높이 자료를 정리하기 위해 히스토그램을 먼저 보자.

05

히스토그램 작성을 위해 기초가 되는 도수분포표의 구간은 50m 단위로 나눴다. 그림상으로는 평균선(파랑) 왼쪽으로 막대들이 치우쳤고 오른쪽으로는 길게 늘어선 모양이 흡사 이항분포와 비슷해 보인다. 누적(%)자료에 대해 권역별로 나눠 그려보면...

06

역시 강원도에 위치한 산들이 월등히 높아 보이고, 그 다음으로 경상도 지역 산들이 높다고 볼 수 있겠다. 지역별 평균 높이를 구해보면...

07

경상도에 산이 이렇게 많이 있었나? 전국의 1/3에 해당하는 산이 경상도 지역에 위치하고 있고 평균 높이도 전국 평균과 비슷하지만, 역시나 강원도의 평균 높이가 상당히 높은 걸 알 수 있다. 그리고 전체적으로 표준편차가 250 내외인데 반해 유독 제주도의 표준편차가 높게 나오는 것은 한라산 영향이 컸을 것으로 미루어 짐작할 수 있겠다.

08

그럼 이쯤에서 강원도의 산이 타도에 비해 높다고 말하고는 싶은데 뭘 근거로 들이밀까? 설마... 강원도가 평균선을 뚫고 올라와서라고 할 건가?

09

아니면 강원도가 삐죽 빠져 나와서? 내 언제나 말하지만 차트로 판단하지 말지어다. 이 때는 통계적 분석 방법 중 하나인 일원배치법이라는 걸 적용하면 된다(일원배치법에 대해서는 별도 확인 바람).

10

이 결과 유의수준 0.05에서 지역간 평균에 차이가 없다(귀무가설)고 말할 수 없다(기각)는 결론을 얻었으니, 강원도의 평균 높이가 가장 높다고 할 수 있겠다. 참고로 엑셀2003 에서 도구->추가기능에 '분석도구'가 선택되어져 있다면, 도구->데이터분석->분산분석:일원배치법 으로도 처리 가능하다. 단 자료 배치구조를 조금 손봐야 한다.

이렇게 대충 우리나라 산 분포에 대해 어설프게 훑어봤는데... 칠월칠석날 비 좀 안 왔으면 좋겠다. 몇번을 칠석날 산에 올랐지만 비가 오는 바람에 은하수 빛나는 맑은 밤하늘 본적이 없었는데, 이번에는 제발 하늘 좀 보자. 응?

견우 직녀야~~~
만약에 울고싶걸랑 설악산만 피해다오.


Previous

Next

ⓒ Since 2007 Exceller Corporation. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.