Exceller's Home > 사용자 제공 자료

'무지개타고'님의 통계강좌

- 최초 작성일 : 2008-06-02
- 최종 수정일 : 2008-06-02

- 강좌 읽음수 : 4,351회
- 자료 작성자 : 무지개타고 (조석현님)

- 자료 편집자 :

강좌 제목 : 통계로 세상보기 - (59) 가격은 빠졌네

 

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(http://instatistics.officetutor.org/)를 운영하고 있기도 합니다. 위트와 재미가 있는 통계강좌에 빠져보시기 바랍니다.


예제 파일 내려받기


우연히(?) 눈에 띈 기사인데 재밌는 자료라 여겨 붙잡아봤다.

- [파워 브랜드] (26) 생리대, "그날엔 바디피트" 이구동성

예전 다루던 자료에 생리대 자료가 있었다. 그 조사는 주부가 포함된 생필품 조사라 생리대 침투율은 100%에 근접하게 나와야 한다. 그런데 한 달이 가고 분기가 가고 반년이 흘러도 구입을 안하네? 그래서 구입 자료가 없는 대상자들을 선별해 별도 조사를 했더니...

직접 만들어 쓴답니다
옆집거 빌려써요
축하해주세요 임신/출산했어요
지금 젖 매기는 중이라서
애기 기저귀가 남았는데 아깝잖아요~

참고로 검색해보니 상업용 생리대의 시발점은 전쟁 때문이란다. 그리고 생리대 시장규모는 약 3200억.

- 1회용 생리대의 기원은 1차 세계대전
- 생리대는 비싼 웰빙상품? 여성건강 필수품!

자 다시... 위의 기사는 특정 온라인 쇼핑몰 회사 직원 20명을 대상으로 1개월 가량, 신세대 여성 기호를 고려하여 '코튼라인'(?)의 제품을 선별해 나눠주고 조사한 것이라 한다(신세대 여성의 취향은 '코튼라인' 이라는건가?).

01

생리대 제품의 속성을 5개로 분류해 평점을 구했더니 '바디피트볼록마춤'의 점수가 가장 높게 나왔단다. 흡수력, 새지 않는 정도(누수방지), 피부에 닿는 느낌(피부감촉), 착용감, 소취력

그런데 이 항목들이 생리대라는 제품이 갖춰야 할 속성을 대변할 수 있는 건진 모르겠다. 그리고 남자이다보니 헷갈린다. -_-; 흡수력과 누수방지가 왜 다른 항목일까? 착용감과 피부감촉 서로 같은거 아닌가?(예전에 비흡연 여직원이 담배조사 담당하면서 담배맛이 어떻게 다른건지 물어본 것과 비슷하겠다) 이는 자료에서도 나타나고 있다.

02

흡수력과 누수방지 그리고 착용감과 피부감촉 간에는 양에 상관관계를 보여주듯이 이들 속성(변수)들은 서로 비슷한(?) 연관성을 갖고 있어 보인다. 그런데 의외로 서로 다른 속성인 흡수력과 소취력에 약하지만 음의 상관관계를 보여준다. 두 마리 토끼를 한번에 잡기가 버거웠던 것일까?

아무튼... 위의 5개 속성(변수)을 포괄하는 변수를 만들어봤다. 물론 '합'은 아니다.

03
※주의 : 분석 과정에 오류가 있을 수 있습니다.

이같이 여러 변수를 포괄하여 나타내는 분석 방법을 통계에서는 주성분분석(Principal Component Analysis)이라 하는데...

04

얼핏 보면 모형이 회귀분석과 비슷해 보이지만 전혀 다른 것이다. 회귀분석은 종속변수와 독립변수 간에 관계를 찾아내는 것이지만, 주성분분석은 종속과 독립에 구분 없이 기존 변수 모두를 포괄하는 새로운 변수를 만들어 내는 것이라 서로 다르다(주성분분석에 대해선 별도 확인 바람).

그럼 위의 결과를 어떻게 해석하냐 하면...(잘... -_-;;)

일전에 얘기 했듯이 다변량분석이 다 그렇듯, 주성분분석 또한 5개 변수를 포괄하는 변수를 만드는 것이라 만만치 않다. 그나마 다른 다변량분석에 비해 그래도 조금 용이해 보여 엑셀로 만들어 봤는데 어째 불안불안하다. 통계프로그램을 이용해 보니, 고유치는 같으나 고유벡터에서 차이점이 있었다. 왜지? 보정 과정을 거치는게 있나... 즉 분석에 오류가 있을 수 있으니 주의하시기 바란다.

위의 주성분분석 표에서, 제1주성분의 고유치(Eigenvalue)가 2.5231 정도로 기여율이 50.5% 이고, 제2주성분의 고유치는 2.2507 로 기여율은 45.0%이다. 이 둘을 합치면 누적기여율이 95.5%로 5개 변수의 변동 대부분을 설명할 수 있어 보인다. 그래서 이 제1,2주성분 두개를 선택.

그리고 제1주성분의 고유벡터(Eigenvector)를 보면, 흡수력 > 누수방지 > 착용감 > 피부감촉 > 소취력 순으로 크다.

그런데 여기서... 값이 크다는 것은 무엇을 의미하는걸까? 그리고 작다면 이는 또 무엇을 의미하는걸까?

이 판단을 위해서는 조사 대상 즉 생리대에 대한 상당한 지식을 먼저 갖춰야 하는데 내가 사기치던(?) 분야는 아니기에 멋대로 의미를 부여해봤다(이를 전문용어로 '예술'이라고 한다).

값이 커진다는 것은 생리대가 갖춰야 할 기본(?)에 충실하다고 보고, 값이 작아진다는 것은 그외 기능에 충실한 쪽이라 의미를 부여하겠다. 즉 값이 작다고해서 부정적으로 보는게 아니라 다른 의미를 갖게 되는 것이다(노파심에서 얘긴데, 처리하려는 자료는 조사 자료이지 실험 자료가 아니라는 것, 즉 사용자에 '생각'을 그렇게 해석하겠다는 것이지, '제품'이 그렇다는 것은 아니니 혼동하지 마시기 바란다).

위에서 두 개를 선택한다고 했으니, 제2주성분의 고유벡터를 보면, 피부감촉 > 착용감 > 소취력 > 누수방지 > 흡수력 순으로 크다.

그래서 또 한번 예술(?)해 보면... 값이 클수록 무형인 감성에, 그리고 작을수록 유형인 실체에 가까운 것으로 의미를 부여한다(음... 뭐라고 입안에서만 맴돌뿐 나오지를 않네...).

그 후 주성분 득점을 각각 계산하고, 생성한 주성분 변수가 2개므로 이를 그래프로 나타내면,

05 
※ 주의 : 실선(타원)은 임의로 설정한 것임.

주성분 득점은 원점에서 멀수록 그리고 축에 가까울수록 부여한 의미를 강하게 반영한다.

제한된 자료로, 무식하게 분석한 결과이나 바디피트볼록맞춤은 이미지와 기능의 조화가 돋보인다(이 녀석 때문에 제1주성분의 기여율이 그리 높지 않았군...). 그리고 좋은느낌은 기능면에서 경쟁력이 있어 보인다. 그리고 위스퍼센서티브는 아쉽게도 소비자의 감성을 끌어내는데 소홀해 보인다. 그런데 매직스코튼은 그냥(?) 제품만 열심히 만든다랄까...

그런데 만약에...  조사가 특정 집단을 대상으로 한 게 아니라, 실제 소비자를 대상으로 한 조사였다면 과연 가격이라는 요소는 어떻게 반영되어 나타날까? 그러던 차에 슈퍼 가는 김에 가격이라도 훑어볼까 했으나 매대 앞에 서보지도 못하고 그냥 왔다.


Previous

Next

Copyright ⓒ Since 2008 아이엑셀러 닷컴. All rights reserved.

이 페이지의 저작권은 컨텐츠 제공자에게 있습니다.

본 강좌의 내용은 필자 개인의 견해이며, 아이엑셀러 닷컴의 공식 견해와 일치하지 않을 수도 있습니다.