책 리뷰

[리뷰] 좋은 선택, 나쁜 선택(데이터가 말하는 것과 말하지 않는 것)

seungdols 2019. 4. 14. 03:44

이 책에서 말하는 좋은 선택과 나쁜 선택에는 무엇이 있을까? 표지만 보고는 뭔가 떠올리기 힘들었다.

책은 전반적으로 통계와 관련된 이야기를 하는데, 사실 이런 류와 비슷한 책을 고등학교때 많이 읽어보기도 했다.

그래서 낯설지 않았고, 그렇게 막 계산법을 유심히 보면서 읽지 않았고, 왜 이렇게 나왔고, 그래서 어느 정도의 확률인지 나오기 때문에 그러한 결과론적이긴 하지만, 결과를 곱씹으면서 읽었다.

이 책의 전반적인 내용이 사실, 어떤 사례 기반에서의 확률을 소개하는데, 어떤 이에게는 재미가 있는 이야기가 되거나 어떤 이에게는 지루한 느낌으로 다가 올 것 같다는 생각이 들었다. 어느 정도 요약하면, 카지노의 룰렛 게임은 게임 참가자가 이익을 얻을 확률은 47.4%였던가? 그리고 나머지 확률로 딜러가 이긴다.

그럼 결국, 카지노는 대량의 돈을 이용해 큰수의 법칙을 이용하는 셈이다. 막대한 부를 창출하는 카지노가 고작 5.2%의 이익률을 기반으로 많은 돈을 번다는 사실이다. 아 물론, 다른 카지노 게임들은 딜러가 이길 확률이 대개 높긴 하다. 아마 블랙잭 같은 경우도 딜러가 이길 가능성이 훨씬 높은 걸로 알고 있다. 그런데, 천재들의 무리들이 카드 카운팅이라는 기억력 기반으로 이기는 것도 가능하다. 그럼에도 결국 막대한 부를 가진 카지노를 상대로 완전히 이기는 것은 불가능하다. 그 이유는 큰 수의 법칙이 작용하기 때문인데, 이는 책에서도 나오지만 내가 이해한 바는 불완전하다고 이해를 했다.

그리고 또 하나 재밌던 점은 로또 복권의 관한 이야기인데, 이 이야기는 진짜 재밌게 읽었다. 그래서 다른 사람들도 이 부분은 재밌게 읽지 않을까? 하는 생각이 들었다.

물론, 제목은 좋은 선택, 나쁜 선택인데, 내용과는 좀 먼 제목이지 않았나?라는 생각을 했다. 그래서 어떻게 데이터를 올바르게 선정을 해야 하는가? 라는 질문이 남았다. 책에 나온 수 많은 사례들이 아, 그렇구나 하면서도 이렇게 하면 되는걸까? 어떻게 해야 하는 걸까? 라는 고민을 남기게 했다.

아니면, 내가 이 책을 전부 이해하지 못한 탓도 있을 거라는 생각을 하게 됐다. 나는 얼마나 이해를 했는지 모르지만, 중요한 점은 이 책에서 말하는 데이터의 좋은 선택과 나쁜 선택은 데이터를 선정하는 사람도 고민을 해야 하는 문제이지만, 데이터를 바라보는 사람들도 해당 데이터가 정말 맞는 것인지? 한 번쯤은 의심해보는 것도 유익하다는 생각을 하게 해준 책이었다.

귀무가설, 블랙-숄즈 방정식등 신기한 내용들이 많아서 통계학을 들어 보았거나, 전공한 사람들은 정말 재밌게 읽을 수 있을 것 같았다.

인상 깊은 구절

  • 우리가 수집할 수 있는 데이터만을 대상으로 판단하기 때문에 발생하는 문제는 우리 주변에서 의외로 흔히 찾아볼 수 있다.

  • 우리는 수집한 데이터가 상당히 크기만 하면 전체 데이터를 충분히 대표할 수 있다고 간주 하는 경향이 있다.

  • 굉장히 자세하고, 정밀한 결과값은 정확하지 않다는 것이다.

  • 결과값이 자세하게 계산되어 있으니 아마도 맞을 것이라는 오해를 주기 위함, 더 이상의 의미는 없다.

반응형