• 최초 작성일: 2020-01-06
  • 최종 수정일: 2020-01-06
  • 조회수: 3,978 회
  • 작성자: 무지개타고
  • 강의 제목: 통계로 세상보기 ㅡ 로또 '당첨확률' 이렇게 계산한다

엑셀러 권현욱

들어가기 전에

'통계'라고 하면 여러분은 어떤 생각이 드시나요? 저는 개인적으로 좋은 기억보다 그렇지 않은 기억이 많습니다만, 최근 들어 통계를 좀 더 공부해야겠다는 생각을 많이 하고 있습니다.

이번 시간에 함께 할 주제는 '무지개타고'님의 재미있는 통계이야기입니다. '무지개타고'님은 '통계로 세상보기'라는 블로그(https://onrainbow.tistory.com/)를 운영하고 있기도 합니다. 특유의 위트와 재미가 있는 통계 강의에 빠져보시기 바랍니다.


  • 이 페이지의 저작권은 콘텐츠 제공자에게 있습니다.
  • 본문 내용은 필자 개인의 견해이며 아이엑셀러 닷컴 공식 의견과 일치하지 않을 수도 있습니다.

유튜브 추천 목록에 '로또 번호 추출' 관련 영상이 올라와 있어서 '또 누가 사기치고 있구나' 생각하며, 도대체 어떻게 사기치는지 궁금해 몇몇 영상들을 봤다.

결론은? 별 얘기 없더라. 어떤 사람은 "지난 회차에 회원 누구누구가 추천한 번호가 각각 몇 개 맞았습니다", 딴 사람은 "분석을 이렇게 이렇게 했습니다"라는 걸로 장황하게 한참 얘기하다가 결론은, "로또 맞을 때까지 열심히 연구합시다."

로또의 당첨 갯수는 초기하분포 HyperGeometric distribution를 따른다. 뭔지는 모르지만 앞에 '초'자가 붙어 있는 걸로 봐서 뭔가 아주 특별한 경우에 해당될 것 같다는 느낌이 들지 않으시는지?

로또 용지 뒷면을 보자.

'당첨확률'이라고 하면서 숫자가 나열되어 있다. 엑셀에서 위와 똑같은 결과값을 쉽게 구할 수 있다. 아주 간단하다. HypGeomDist 함수만 알면 100% 같은 숫자를 구할 수 있다. 참고로 2, 3등 확률은 계산이 좀 복잡하니 이건 직접 생각해 보시기 바란다.

로딩 중...

로또 용지에 기재된 숫자와 함수로 계산한 숫자가 똑같다. 즉 로또 당첨 갯수는 초기하분포를 따른다는 말이다. 갑자기 초기하분포를 왜 말했느냐 하면, 확률변수 X가 초기하분포를 따른다면 그 평균을 구하는 공식이 있다. 이 공식만 알면 내가 찍은 번호에서 몇 개나 맞는지 평균을 구할 수 있다.

로딩 중...

위에서 빨간색으로 칠한 공식을 이용해 평균을 구한 게 위 위의 그림에 있다. 몇 개? 0.8개!

동행복권 사이트에 가면 1회부터 최근까지 이 당첨 번호 목록을 엑셀 파일로 제공한다. 이것을 가지고 거꾸로(?) 계산한 결과를 보자. 당첨번호를 가지고 내 번호와 비교하는 것과, 내 번호를 가지고 당첨번호와 비교하는 것의 논리는 같다.

로딩 중...
W4:
=SUMPRODUCT(COUNTIF(N4:S4,$X$4:$X$9))

직접 임의의 숫자를 찍어서 그동안 추출된 번호와 맞춰보니 몇 개?

0.799775 개 ≒ 0.8개!

위에서 공식으로 계산한 평균과 똑같다.

만약 내가 열심히 연구(?)해서 0.8개를 2개까지 끌어올렸다고 하자. 그럼 이게 의미가 있나? 학문적으로는 당연히 의미가 있지만 우리같은 범인들에겐 하등 의미가 없다. 왜? 어차피 당첨금은 빵 원이니까.

그리고 많이들 혼동하는데, 로또는 갯수를 맞추는 게임이 아니라 조합을 맞추는 게임이다. 그런데 그 확률이 아주 아주 작아서 못 맞춘다. 즉 맞추지 못하라고 만든 게 로또다.

따라서 공식 만들어서 로또를 맞춘다고 설레발 치는 건 무조건 사기다. '독립사건'이란 전문용어를 쓸 필요도 없이 무조건 사기다. 그러니 제발 재미로 하자. 도파민 팍팍 쏟아내서 괜히 중독되지 말고.