통계와 코딩은 이제 현대인의 기초 소양이 되었다. 이 책은 코딩 초보자, 통계 비전문가를 위한 입문서로서, 3일 만에 코딩과 통계의 감을 잡을 수 있도록 해준다. 사용하기 쉽고 통계에 최적화된 R 언어를 설치하는 것(1장)부터 차근차근 알려준다. 그리고 고등학교 때 배운 순열과 조합(2장)부터 시작해 확률(3장), 조건부확률(4장), 확률분포(5장), 통계적 추정(6장)까지 따라가며 통계를 코딩으로 함께 풀어본다. 몇 줄의 코드를 직접 입력하고 실행해보면서 통계적 개념을 명확히 알게 되고 코딩까지 자연스럽게 익힐 수 있게 될 것이다. 여기에 더해 컴퓨터 성능이 고도로 발달한 시대의 통계 기법인 부트스트랩(7장)까지 맛보고 나면, 통계와 코딩이 불가분의 관계라는 것을 더욱 실감할 것이다. 그리고 이후 더 공부해보려는 독자들을 위해서 넓고 깊은 통계학의 세계를 안내하는 지도(8장)가 마련돼 있다.
Contents
들어가며
01 R 설치 및 사용법
왜 R 언어인가 | R 설치방법
■ 어떤 도구로 통계학을 배울 것인가
02 경우의 수, 순열, 조합
코딩으로 확률과 통계 시작하기 | R에서 변수 사용하기 | 팩토리얼을 구하는 코드 짜기 | 함수 만들기 | R로 순열 구하기 | R로 조합 계산하기 | 프로그래밍으로 확률과 통계를 공부하는 이유
■ 상트페테르부르크의 역설
03 확률
확률은 경우의 수 세기 | 용어 | 수학적 확률 | 통계적 확률 | 극한의 의미 | 큰 수의 법칙 | 큰 수의 법칙은 돈이 된다 | 수학적 확률로 확률 문제 풀기 | 통계적 확률로 문제 풀기: 시뮬레이션 | R과 몬테카를로 시뮬레이션으로 확률 문제 풀기 | 몬테카를로 방법으로 원주율 계산하기 | 몬티홀 문제
■ 심슨의 역설
04 조건부확률
조건부확률이란 | 베이즈 정리 | 조건부확률 시뮬레이션하기 | 베이즈 정리 시뮬레이션하기: 코로나19 검사
■ 생일 역설: 왜 드물게 보이는 사건은 꼭 일어나곤 하는가
06 통계적 추정
통계적 추정이란 | 통계적 추정의 종류 | 모평균의 추정 | 표본평균 시뮬레이션하기 | 모평균에 대한 구간추정 | R로 95% 신뢰구간의 성질 확인하기 | 컴퓨터 시대의 무식한(?) 추정 방식
■ 예측정확도의 역설
07 부트스트랩
컴퓨터 시대의 통계학 | 부트스트랩의 원리 | 부트스트랩으로 모평균 추정하기 | 부트스트랩으로 모표준편차 추정하기 | 통계적 가설검정 | 부트스트랩 신뢰구간을 활용한 가설검정 | 다시 컴퓨터 시대의 통계학
■ 확률의 세계와 인간의 편향
08 통계학의 지도
통계학에 좀 더 관심 있는 분들을 위해 | 통계학 공부의 ‘테크트리’ | 통계학의 분야들 | 데이터과학과 통계학
■ 통계학과 기계학습, 비슷하면서도 서로 다른
나오며
찾아보기
저자 소개
Author
박준석
통계학 석사학위와 계량심리학 박사학위를 취득했다. 졸업 후에는 산업 현장으로 진출하여 미국 서부 해안에서 데이터과학자로 일하고 있다. 페이스북 페이지 〈오하이오의 낚시꾼〉을 통해 대중에 통계학과 데이터과학을 소개하고 있으며, 대중의 데이터 문해력 증진 및 통계학 대중화에 관심이 많다.
저서로는 사람들이 왜 가짜뉴스를 믿게 되는지를 심리학적으로 고찰한 『가짜뉴스의 심리학』, 관련 전문가들과 함께 데이터과학 및 산업의 현재를 조망한 공저 『데이터 과학자의 일』이 있다.
통계학 석사학위와 계량심리학 박사학위를 취득했다. 졸업 후에는 산업 현장으로 진출하여 미국 서부 해안에서 데이터과학자로 일하고 있다. 페이스북 페이지 〈오하이오의 낚시꾼〉을 통해 대중에 통계학과 데이터과학을 소개하고 있으며, 대중의 데이터 문해력 증진 및 통계학 대중화에 관심이 많다.
저서로는 사람들이 왜 가짜뉴스를 믿게 되는지를 심리학적으로 고찰한 『가짜뉴스의 심리학』, 관련 전문가들과 함께 데이터과학 및 산업의 현재를 조망한 공저 『데이터 과학자의 일』이 있다.