서울대 통계학과 정성규 교수가
자신의 생각 상자에서 하나씩 꺼내 알려주는 합리적인 선택과 결정의 도구 58
데이터 정글에서 살아남기 위해 알아야 할 것들
서울대학교 자연과학대 우수교수상과 연구상을 수상한 서울대 통계학과 정성규 교수가 자신의 생각 상자에서 합리적인 선택과 결정의 도구를 하나씩 꺼내 알려준다. 데이터 정글에서 살아가야 할 지금 여기 우리 세대를 위한 ‘첫 번째 데이터 문해력 수업’으로 손색이 없다.
『수학보다 데이터 문해력』은 통계의 핵심은 ‘계산’이 아니라 ‘생각’임을 일깨우며, 데이터를 제대로 읽고, 해석하고, 사용하는 ‘데이터 문해력’을 높이는 방법을 소개한다. 직장에서, 학교에서, 뉴스에서, 시장에서 데이터가 넘쳐나는 요즈음 우리에게 너무나도 요긴한 지식이다. 계산은 전문가에게 맡겨두자. 컴퓨터가 대신 계산해줄 것이다. 우리에게 필요한 것은 이 계산을 언제 쓰고, 그 결과를 어떻게 해석해야 하는지 아는 능력, 즉 데이터 문해력이다.
Contents
프롤로그 - 통계학의 세계로 여러분을 초대하며
Part 1. 통계학의 기초: 모래밭에 숨은 바늘 찾기
확률의 정의 / 도박, 동전 던지기, 그리고 라플라스
확률의 탄생 / 한 도박사의 판돈 나누기
조건부 예측 / 점술가의 데이터 사용법
가공된 정보 / 데이터 없이는 통계도 없다
신호와 소음 / 데이터는 어떻게 정보가 되는가? 036
데이터 시각화 / 백의의 천사 나이팅게일의 장미 그림을 아시나요?
표본 조사 / 라플라스가 18세기 프랑스 전체 인구를 계산한 방법
무작위의 패턴과 푸아송 분포 / 프로이센 기병대의 병사 사망 사건의 전모
불확실성과 확률분포 / 랜덤의 패턴을 파악하면 의사결정이 쉬워진다
확률밀도 / 피아노 조율사의 오묘한 확률 이야기
베이즈의 법칙 / 목사의, 목사에 의한, 목사를 위한 통계
베이즈 두뇌 가설 / 고인돌 가족 이야기, 내일도 해는 동쪽에서 뜰까?
Part 2. 통계학자의 사고법: 감별사와 낚시꾼, 어쩌면…
통계적 가설검정 / 홍차 감별사와 현대 통계학의 태동
통계학자의 생각법 / 데이터는 변덕이 심하다
표본과 회귀분석 / 오늘을 무한히 반복해 살기
신뢰 수준 / 여론조사는 왜 틀릴까?
귀무가설과 대립가설 / 검사는 유죄 증명, 과학자는 가설 증명
평균과 중앙값 / 어떤 낚싯대로 물고기를 잡을 것인가?
통계적 가설검정 딜레마 / 잘못된 선택의 선택에 관하여
유의수준 / p〈0.05를 넘어
큰 수의 법칙 / 통계적 사실과 실체적 진실
베이즈 추론 / 신은 주사위 놀이를 할까?
편견의 통계학 / 결국에는 데이터가 이긴다
Part 3. 통계의 도구들: 세상을 읽는 기준
표준편차 / 90은 큰 수인가, 작은 수인가?
중심극한정리 / 우연을 설명하는 필연
파레토의 법칙 / 이 불평등을 어떻게 설명할 것인가?
평균 인간 / 특성의 개수가 많을수록 관측값은 평균에서 멀어진다
복권의 기댓값 / 손해를 사는 행운
우생학 / 평범으로의 회귀
독립 / 보이지 않는 관계를 파악하는 힘
상관관계 / 단순해서 강력한, 단순해서 놓치는
인과관계 / 숨어 있는 진짜 원인을 알아야 정확하게 처방할 수 있다
회귀 / 콩기계는 부모, 자식의 키를 예측할 수 있을까?
다중회귀분석 / 식구가 늘어날수록 저축도 늘어날까?
부트스트랩 / 작은 멀티버스를 소환하는 방법
Part 4. 통계학의 현재: 인공지능과 새벽 배송 사이
스팸 Vs 햄 / 인공지능에 통계학이 스며들다
고차원 데이터 / 유전자와 질병의 함수
인공지능 / 왜 IBM은 의료 분야 인공지능 개발을 중단했을까?
큰 수의 법칙 / 새벽 배송은 어느 지역까지 가능할까?
예측의 원칙 / 달성하기 가장 어려운 임무
랜덤 워크와 정상성 / 나는 왜 주식으로 돈을 벌지 못할까?
팬데믹과 SIR 모형 / 코로나-19 대유행의 정점은 언제일까?
임상시험 / 2020년의 가장 아름다운 그래프
민감도와 정밀도 / 범죄 예측 프로그램의 원리
예측의 트레이드오프 / 소음에 둔감한 예측 방법이 더 좋을 수 있다
제곱근의 법칙 / 분석의 정확도를 2배 높이려면 4배 돈을 써라
Part 5. 통계의 거짓말: 데이터, 신호, 소음
데이터 그래픽 / 정보 디자이너 에드워드 터프티의 거짓말 지수
파이 차트 / 스티브 잡스, 블랙베리를 따라잡기 위해 정보를 왜곡하다
자료 Vs 데이터 / 21세기에 20세기의 유물이 유효한 이유
데이터 편향 / 웹 스크래핑과 리포트 마이닝, 진실은 어디에 있을까?
필연성의 법칙 / 미스 아메리카와 뜨거운 살인 사건
심슨의 역설 / 어느 직장에 취직해야 더 많은 연봉을 받을 수 있을까?
중도절단의 오류 / 공무원연금과 국민연금을 둘러싼 논쟁에 관하여
사례 증거 / 내 친구가 그러는데 말이야…
외삽&내삽 / 2156년 올림픽 100미터 달리기, 여성이 남성보다 빠르다?
사후확신편향 / 정말로 개와 고양이는 사람보다 먼저 지진을 느낄까?
여론조사의 함정 / 사람들의 의견은 숫자가 아니다
통계와 분석 / 쓰레기가 들어가면 쓰레기가 나온다
에필로그 - 더 근사한 우리의 삶을 위하여
주석
Author
정성규
자연과학 중에 과학과 가장 멀어 보이는 통계학을 골라 서울대학교 자연과학부에 입학, 통계학을 전공으로 학부를 졸업하고, 잠시 학교를 떠나 여러 회사에서 인턴 생활을 했다. 그러다 먼저 유학길에 오른 아내를 좇아 미국 노스캐롤라이나대학교에서 공부하여 역시 통계학으로 박사 학위를 받았다.
2011년부터 7년 동안 미국 피츠버그대학교에서 통계학과 교수로 재직하다, 오랜 외국 생활을 청산하고 한국으로 돌아와 2018년부터 서울대학교 통계학과 교수로 재직하며 연구와 학생 지도에 힘쓰고 있다. 고차원 다변량 통계이론과 비유클리드 통계방법론을 기반으로, 기계학습이론과 데이터 프라이버시를 연구한다. 평소에 실제 숫자들을 붙잡고 데이터 분석을 하거나 통계를 내는 일을 하지는 않는다. 주로 어떤 데이터 분석 방법이 좋은 통계 방법인지를 탐구하고, 새로운 통계방법론을 궁리하고 개발한다. 2011년에는 국제생물통계학회 우수논문상, 2016년에는 국제한인통계학회의 조기경력개발상, 2019년과 2021년에는 서울대학교 자연과학대학에서 우수강의상과 연구상을 수상했다. 저서로는 대한민국학술원 우수학술도서로 선정된 <비모수통계학 with R> 등이 있다.
자연과학 중에 과학과 가장 멀어 보이는 통계학을 골라 서울대학교 자연과학부에 입학, 통계학을 전공으로 학부를 졸업하고, 잠시 학교를 떠나 여러 회사에서 인턴 생활을 했다. 그러다 먼저 유학길에 오른 아내를 좇아 미국 노스캐롤라이나대학교에서 공부하여 역시 통계학으로 박사 학위를 받았다.
2011년부터 7년 동안 미국 피츠버그대학교에서 통계학과 교수로 재직하다, 오랜 외국 생활을 청산하고 한국으로 돌아와 2018년부터 서울대학교 통계학과 교수로 재직하며 연구와 학생 지도에 힘쓰고 있다. 고차원 다변량 통계이론과 비유클리드 통계방법론을 기반으로, 기계학습이론과 데이터 프라이버시를 연구한다. 평소에 실제 숫자들을 붙잡고 데이터 분석을 하거나 통계를 내는 일을 하지는 않는다. 주로 어떤 데이터 분석 방법이 좋은 통계 방법인지를 탐구하고, 새로운 통계방법론을 궁리하고 개발한다. 2011년에는 국제생물통계학회 우수논문상, 2016년에는 국제한인통계학회의 조기경력개발상, 2019년과 2021년에는 서울대학교 자연과학대학에서 우수강의상과 연구상을 수상했다. 저서로는 대한민국학술원 우수학술도서로 선정된 <비모수통계학 with R> 등이 있다.