• 최초 작성일: 2008-06-02
  • 최종 수정일: 2008-06-02
  • 조회수: 7,523 회
  • 작성자: 무지개타고
  • 강의 제목: 남자는 절대 알 수 없는 것 ㅡ 가격은 빠졌네

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

우연히 눈에 띈 기사인데 재밌는 자료라 여겨 붙잡아 보았다.

예전에 다루었던 자료에 생리대 자료가 있었다. 그 조사는 주부가 포함된 생필품 조사라 생리대 침투율은 100%에 근접하게 나와야 한다. 그런데 한 달이 가고 분기가 가고 반년이 흘러도 구입을 안 하네? 그래서 구입 자료가 없는 대상자들을 선별해 별도 조사를 했더니 답변이 이랬다.

  • 직접 만들어 쓴답니다.
  • 옆집 거 빌려 써요.
  • 축하해 주세요. 임신/출산했어요.
  • 지금 젖 먹이는 중이라서요.
  • 애기 기저귀가 남았는데 아깝잖아요~

검색해 보니 상업용 생리대의 시발점은 전쟁 때문이란다. 그리고 2007년 현재 우리나라 생리대 시장 규모는 연간 3200억 원 규모라고 한다.

위의 기사는 특정 온라인 쇼핑몰 회사 직원 20명을 대상으로 1개월 가량, 신세대 여성 기호를 고려하여 '코튼라인'(?)의 제품을 선별해 나눠주고 조사한 것이라 한다.

로딩 중...

생리대 제품의 속성을 5개로 분류해 평점을 구했더니 '바디피트볼록마춤'의 점수가 가장 높게 나왔단다. 5개 평가 항목은 흡수력, 새지 않는 정도(누수방지), 피부에 닿는 느낌(피부감촉), 착용감, 소취력이다.

이 항목들이 생리대라는 제품이 갖춰야 할 속성을 대변할 수 있는 것인지는 모르겠다. 그리고 남자이다보니 헷갈린다.(-_-;) 흡수력과 누수방지가 왜 다른 항목일까? 착용감과 피부감촉은 같은 거 아닌가?(예전에 비흡연 여직원이 담배조사 담당하면서 담배맛이 어떻게 다른 건지 물어본 것과 비슷한 심정이겠다) 이는 자료에서도 나타나고 있다.

로딩 중...

흡수력과 누수방지 그리고 착용감과 피부감촉 간에는 양의 상관관계를 보여주듯이 이들 속성(변수)들은 서로 연관성을 갖고 있는 것으로 보인다. 그런데 의외로 서로 다른 속성인 흡수력과 소취력은 약하지만 음의 상관관계를 보여준다. 두 마리 토끼를 한 번에 잡기가 버거웠던 것일까?

아무튼 위의 5개 속성(변수)을 포괄하는 변수를 만들어 보았다. 물론 '합'은 아니다.

로딩 중...
(주의: 분석 과정에서 오류가 있을 수 있음.

이와 같이 여러 변수를 포괄하여 나타내는 분석 방법을 통계에서는 주성분분석 Principal Component Analysis이라고 한다.

로딩 중...

얼핏 보면 모형이 회귀분석과 비슷해 보이지만 전혀 다른 것이다. 회귀분석은 종속변수와 독립변수 간의 관계를 찾아내는 것이지만 주성분분석은 종속과 독립에 구분 없이 기존 변수 모두를 포괄하는 새로운 변수를 만들어 내는 것이다.

다변량분석이 다 그렇듯, 주성분분석 또한 5개 변수를 포괄하는 변수를 만드는 것이라 만만치 않다. 그나마 다른 다변량분석에 비해 그래도 조금 용이해 보여 엑셀로 만들어 봤는데 어째 불안불안하다. 통계프로그램을 이용해 보니, 고유치는 같으나 고유벡터에서 차이점이 있었다. 왜지? 보정 과정을 거치는게 있나... 즉 분석에 오류가 있을 수 있으니 주의하시기 바란다.

위의 주성분분석 표에서, 제1주성분의 고유치 Eigenvalue가 2.5231 정도로 기여율이 50.5% 이고, 제2주성분의 고유치는 2.2507로 기여율은 45.0%이다. 이 둘을 합치면 누적기여율이 95.5%로 5개 변수의 변동 대부분을 설명할 수 있어 보인다. 그래서 이 제1, 2주성분 두개를 선택한다.

그리고 제1주성분의 고유벡터 Eigenvector를 보면, 흡수력 > 누수방지 > 착용감 > 피부감촉 > 소취력 순으로 크다.

그런데 여기서, 값이 크다는 것은 무엇을 의미하는 걸까? 그리고 작다면 이는 또 무엇을 의미하는 걸까?

이 판단을 위해서는 조사 대상, 즉 생리대에 대한 상당한 지식을 먼저 갖춰야 하는데 내가 사기치던(?) 분야는 아니기에 멋대로 의미를 부여해봤다(이를 전문용어로 '예술'이라고 한다).

값이 커진다는 것은 생리대가 갖춰야 할 기본(?)에 충실하다고 보고, 값이 작아진다는 것은 그 외 기능에 충실한 쪽이라고 의미를 부여하겠다. 즉 값이 작다고 해서 부정적으로 보는 게 아니라 다른 의미를 갖게 되는 것이다(노파심에서 하는 얘긴데, 처리하려는 자료는 조사 자료이지 실험 자료가 아니다. 즉 사용자의 '생각'을 그렇게 해석하겠다는 것이지, '제품'이 그렇다는 것은 아니니 혼동하지 마시길).

위에서 두 개를 선택한다고 했으니 제2주성분의 고유벡터를 보면, 피부감촉 > 착용감 > 소취력 > 누수방지 > 흡수력 순으로 크다.

그래서 또 한번 예술(?)을 해 보면, 값이 클수록 무형인 감성에, 그리고 작을수록 유형인 실체에 가까운 것으로 의미를 부여한다. 그 후 주성분 득점을 각각 계산하고 생성한 주성분 변수가 2개므로 이를 그래프로 나타내면 이렇게 된다.

로딩 중...
(주의) 실선(타원)은 임의로 설정한 것임.

주성분 득점은 원점에서 멀수록, 그리고 축에 가까울수록 부여한 의미를 강하게 반영한다.

제한된 자료를 이용하여 무식하게 분석한 결과이나 바디피트볼록맞춤은 이미지와 기능의 조화가 돋보인다(이 녀석 때문에 제1주성분의 기여율이 그리 높지 않았군). 그리고 좋은느낌은 기능면에서 경쟁력이 있어 보인다. 그리고 위스퍼센서티브는 아쉽게도 소비자의 감성을 끌어내는 데 소홀해 보인다. 그런데 매직스코튼은 그냥(?) 제품만 열심히 만든다 랄까...

그런데 만약에 조사가 특정 집단을 대상으로 한 게 아니라 실제 소비자를 대상으로 한 조사였다면 과연 가격이라는 요소는 어떻게 반영되어 나타날까? 그러던 차에 슈퍼 가는 김에 가격이라도 훑어볼까 했으나 매대 앞에 서보지도 못하고 그냥 왔다.