Exceller's Home > 사용자 제공 자료

'무지개타고'님의 통계강좌

- 최초 작성일 : 2007-10-23
- 최종 수정일 : 2007-10-23

- 강좌 읽음수 : 3,778회
- 자료 작성자 : 무지개타고

- 자료 편집자 : Exceller (권현욱, exceller@amorepacific.com)

강좌 제목 : 통계로 세상보기 - (20) 조금 덜 매운 고추장이 좋아

 

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(http://instatistics.officetutor.org/)를 운영하고 있기도 합니다. 위트와 재미가 있는 통계강좌에 빠져보시기 바랍니다.


예제 파일 내려받기


요새 직접 담궈 먹는 집은 거의 없을거 같으니, 고추장을 얼마나 사먹을까?
통계청 자료 중 가계조사(전국)을 참고해보면...

(단위: 원, 월평균)
01
※주의:해당자료는 인용과정에 오류가 있을 수 있습니다.

표본조사를 통해 구해진 평균적인 가구의 월평균 지출금액을 알았으니 이쯤되면 전국 시장규모 추정이 가능하겠다.

 시장규모 = 전체 가구수 × 가구당 월 평균 지출액 × 12개월

위 방식으로 시장규모를 추정한다면, 이번엔 전국의 가구수를 얻기 위해 추계자료를 참고해보자.

02
※주의:해당자료는 인용과정에 오류가 있을 수 있습니다(단, '일반가구'는 자의적 분류)

가구를 여러 종류로 구분해놔서 헷갈린다. 그렇다면 앞서 가계조사에서 정의한 '가구'가 뭔지를 확인해야겠다.

03

통계청에서는 조사 마다 조사설계 정보를 제공해준다. 위의 그림은 가계조사에 해당되는 조사설계(메타정보)다. 대상객체는 표본이 뭔지를 가리키는데 전국에 거주하는 가구가 조사 대상인 것은 알겠는데, 그런데 '단'이라고 해놓은게 또 사람 헷갈리게 만든다. 그렇다면 추계자료의 가구 중 어느 항목일까?

확실한 건 통계청 홈페이지에 올려진 자료만으로는 정확하게 파악할 수 없다는 것이다. 일반가구가 보다 근접하겠지만 가구주의 직업자료가 공개되지 않아서다. 이를 확인하려면 담당자에게 확인하는 방법밖에 없겠다. 그런데 그 정도 성의가 내겐 없으니, 무리수가 있지만 '일반가구' 중 '2인 이상 가구'와 동일한 것으로 간주하겠다.

참고로 '일반가구'로 하지않고 굳이 '일반가구' 중 '2인이상가구'인 것은 가계조사의 조사대상분류 체계에 '1인이상 전가구'라는 항목이 별도 존재하지만 '1인 이상  전가구'에 해당하는 장류 세부 지출금액 자료가 공개되지 않아서다. 그리고 항목이 별도로 존재한다는 것은 역으로 1인가구를 제외한 자료가 존재한다는 것이고, 이는 위에 자료가 2인 이상일 가능성이 높을 것으로 예상할 수 있으며 또한 '가계조사(도시)'의  경우도 '2인 이상 가구'를 기준으로 하기 때문이다.
 

이렇게 대충 얼렁뚱땅 넘겨짚어 품목별 시장규모를 추정해 보면...

04
※주의:계산과정에 오류가 있을 수 있습니다.

고추장의 경우 약 1,446억 이라는 계산이 나오는데 업계는 어떻게 파악하는지 알기 위해 기사를 검색해보니...

- 전통장류 ‘냉장바람’ 솔솔 - 시장규모 : 3000억
- 대상 청정원 `장맛 통일` - 시장규모 : 2400억
- ‘내가 맛짱’ 장류업계 장맛 대결 - 시장규모 : 3180억

작성시기에 따라, 내용에 따라 차이가 크지만 대약 2500~3000억 시장 정도라 하는데, 앞서 계산한 수치와 차이가 클 뿐만 아니라 추계가구 전체를 적용해도 2000억이 채 안된다. 왜일까? 내 계산방식이 엉터리라서? 그리고 기자는 어떻게 시장규모를 알았을까?

고추장 시장규모 추정 얘기를 계속해보면, 고추장을 소비하는 소비자는 누구일까? 앞에서 표본을 '전국에 거주하는 가구'라고 했고 '단'도 붙였다. 즉 가계조사로는 ('단'이 붙었지만) 가구가 소비하는 고추장만 추정할 수 있다는 얘기다.

여기서 잠깐... 앞 글에는 덧붙이지 않았지만 가계조사는 모집단을 "전국(읍면지역포함)의 비농어가"라 했다. 그렇다면 모집단과 표본집단 간에 미세한 차이가 생긴다. 왜냐하면 표본집단은 모집단에서 추출하는 것인데 모집단에서는 비농어가라고만 했기 때문이다. 이것이 단순히 어감상 차이인지 아니면 실질적인 차이인지는 확인해봐야겠지만 여기선 어감상 차이로만 보고 넘어가겠다. 그런데 이 차이에 대해 왜 확인이 필요하냐면 앞 글에서 처럼 시장규모 추정 시 어떤 가구 항목을 이용할 것이냐의 문제가 발생되기 때문이다(그래서 모집단 설정의 중요성을 누차 얘기하는거다).

다시 돌아와서...
고추장은 가정에서만 소비하나? 왠 뚱딴지 같은 물음 같지만 사실이 그렇다. 수 많은 식당에서 사용되는 고추장이 모두 직접 담근거라 하기엔 유아틱한 발상일 것이다. 그리고 기업체나 모임 등의 야유회 때 먹는 고추장은 집에서 가져온걸까? 즉 고추장을 소비하는 소비주체는 가구만이 아니라는 얘기다.

이렇듯 가계조사는 고추장 소비액(량)을 조사하기 위한 조사가 아니므로 전체 고추장 시장규모 추정에 이용하기에는 한계를 안고 있다는 것을 고려해야 한다. 그럼 기사에서 이용된 시장규모는 어떻게 나온 것일까? 설마 기자가 신이라서?

확실한건 기자한테 확인하는 수 밖에 없지만 대략 유추하기로는... 시장조사 자료도 참고하겠지만 통상 업계에서 말하는 수치를 이용했을 가능성이 높다. 보통 업계자료라 통칭하는거 같던데... 이 자료는 동종업계 종사자들이 모여서 '난 얼마 팔았는데, 너네는 얼마 팔았냐?'라는 식으로 판매자료를 취합해 만든거다(여기서 좀더 발전(?)하면 카르텔이 형성되겠지만...)

그런데 (생산자와 판매자는 같다고 할 수 없지만 같다고 치고) 동종업계의 모든 회사가 참여해 판매액을 밝히면 진짜(?) 시장규모가 파악된다고 믿는다면... 다시 생각 바란다. 왜냐?

보따리상들이 짊어지고 들여와 암암리에 내다파는게 빠졌고, 개인이 입소문으로 소량생산해 파는게 빠졌다. 그리고 아직도 못 고치고 있는 무자료거래 및 물량 밀어내기의 허수가 또한 도사리고 있다. 즉 모든 유통구조가 파악되기 어렵기 때문이다.

이쯤 되면 통계 조사에 대한 회의가 막~ 몰려올 것이다. 난 그랬다. 어느 하나 제대로 된 자료가 없으니... (이럴 땐 통계가 오차를 인정한다는게 싫어진다)

그러나 모든 소비주체 및 유통구조가 포함된 조사란 현실적으로 불가능하므로 제한된 범위 내지만 그리고 약간의 오차를 이용해 할 수 있는데 까지는 해봐야지 마냥 손 놓고 있을 수 만은 없는 일이다. 그래야 신한일어업협정 때 처럼 말 같지도 않은 통계 자료를 들고 협상장에 나가지 않을 수 있고 또 국익도 지킬 수 있다.

그리고 통계 이용자 또한 오차라는 이름 뒤에 숨어 있는 한계를 항시 유념해야 한다. 통계는 높은 가능성을 얘기하는거지 그것이 사실이라고 말하지 않는다.


Previous

Next

ⓒ Since 2007 Exceller Corporation. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.