• 최초 작성일: 2007-08-25
  • 최종 수정일: 2007-08-25
  • 조회수: 8,035 회
  • 작성자: 무지개타고
  • 강의 제목: 통계로 세상보기 ㅡ 딱히 몰라도 되는 산 이야기

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

우리나라 면적의 65% 가량이 산림이라 할 정도로 산이 많은데, 산 좋아하는 사람이라면 모두 알고 있을 한국의 산하 사이트를 참고하여 정리를 좀 해봤다.

들어가기에 앞서 잠깐 확인할 사항 중 하나가 산의 위치인데, 지리산 같은 경우 전라남북도, 경상남도 등 3개의 도에 걸쳐 있지만 자료 정리의 편리상 경상남도로 구분하였다. 즉 행정구역이 여러 도에 걸쳐있는 산의 경우 임의로 행정구역을 정리하였다(지리산을 경상도로 표기했다고 하여 섭섭해 하지 마시기 바란다). 그리고 산 이름이 '산(山)'으로 끝나는 경우만 반영했다. 즉 '봉(峰)'은 대상에서 제외했다는 거.

우리나라에서 가장 높은 산은?
아마 이건 대부분 알고 있을 것이다. 높은 순으로 다섯 산을 골라 보면,

로딩 중...

그럼 가장 낮은 산은?
가본 산 중에서는 유달산이 가장 낮았던 것으로 기억되는데 어디 보자.

로딩 중...

제황산이란 산이 있는 줄도 몰랐지만 높이가 28m라고 하니 솔직히 저 산은 산으로 여겨지지 않는다. 언제 기회가 되면 한번 가봐야 되겠다. 그런데 많이 멀다. 그건 그렇고 자료 정리하면서 보니 동명이산이 여럿 보이기에 동명이산 목록을 구성해 봤다.

로딩 중...

봉우리가 다섯 개라서 오봉산일텐데 좀 많아 보인다. 산에 별 관심없는 이들은 잘 모르고 있을 텐데, 위에서 보듯 봉우리 갯수로 이름을 지어도 삼봉, 오봉, 구봉 이렇게 홀수로 나가지 짝수로 나가는 경우는 없다는 거.

예외가 있다. 팔봉산이라고 홍천에 하나 있고 서산에 하나 있는데, 홍천 팔봉산은 필히 가볼만 한 산으로 강추다. 산은 302m로 나즈막한데 반해 봉우리 여덟 개를 오르락내리락 하다 보니 힘이 들어 결국 8봉은 밟지 못했다. 그러나 산은 아기자기 하면서 무척 재밌는 산이다. 특히 해산굴은 필수 코스니 도전해 보기 바란다(물론 난 통과했다 ^^). 그리고 홍천강과 유원지를 끼고 있어 산행 후 쉬기도 편하고 전망 또한 멋진 산이다.

재미삼아 숫자로 된 산만 구성해 보았다(단, 한자까지는 확인하진 않았음).

로딩 중...

위 자료에서 팔봉산이 조금 어긋났으나 대체로 봉우리 수가 많을수록 평균높이가 낮아지는 재밌는 경향이 보인다(어째서 그럴까?).

자, 이번엔 전국 산 높이 자료를 정리하기 위해 히스토그램을 먼저 보자.

로딩 중...

히스토그램 작성을 위해 기초가 되는 도수분포표의 구간은 50m 단위로 나눴다. 그림상으로는 평균선(파랑) 왼쪽으로 막대들이 치우쳤고 오른쪽으로는 길게 늘어선 모양이 흡사 이항분포와 비슷해 보인다. 누적(%)자료에 대해 권역별로 나눠 그려보면

로딩 중...

역시 강원도에 위치한 산들이 월등히 높고 그 다음으로 경상도 지역 산들이 높다고 볼 수 있겠다. 지역별 평균 높이를 구해보면

로딩 중...

경상도에 산이 이렇게 많이 있었나? 전국의 1/3에 해당하는 산이 경상도 지역에 위치하고 있고 평균 높이도 전국 평균과 비슷하지만, 역시나 강원도의 평균 높이가 상당히 높은 걸 알 수 있다. 그리고 전체적으로 표준편차가 250 내외인데 반해 유독 제주도의 표준편차가 높게 나오는 것은 한라산 영향이 컸을 것으로 짐작할 수 있겠다.

로딩 중...

그럼 이쯤에서 강원도의 산이 타 도에 비해 높다고 말하고는 싶은데 뭘 근거로 들이밀까? 설마 강원도가 평균선을 뚫고 올라와서라고 할 건가?

로딩 중...

아니면 강원도가 삐죽 빠져 나와서? 늘 말하지만 차트로 판단하지 말지어다. 이 때는 통계적 분석 방법 중 하나인 일원배치법이라는 걸 적용하면 된다(일원배치법에 대해서는 별도 확인 바람).

로딩 중...

이 결과 유의수준 0.05에서 지역간 평균에 차이가 없다(귀무가설)고 말할 수 없다(기각)는 결론을 얻었으니, 강원도의 평균 높이가 가장 높다고 할 수 있겠다. 참고로 엑셀2003에서 [도구] - [추가 기능] - [분석도구]가 선택되어 있다면, [도구] - [데이터 분석] - [분산분석:일원배치법]으로도 처리 가능하다. 단 자료 배치구조를 조금 손봐야 한다.

이렇게 우리나라 산 분포에 대해 어설프게 훑어봤는데... 칠월칠석날 비 좀 안 왔으면 좋겠다. 몇 번을 칠석날 산에 올랐지만 비가 오는 바람에 은하수 빛나는 맑은 밤하늘 본적이 없었는데 이번에는 제발 하늘 좀 보자. 응?

견우 직녀야~ 만약에 울고싶걸랑 설악산만은 피해다오.