『기초부터 다지는 통계학 교과서 with 파이썬』은 지난 20년 동안 생물학, 금융, 마케팅, 천체물리학에 이르기까지 다양한 분야에서 등장한 방대하고 복잡한 데이터 세트를 이해하는 데 필수적인 통계적 학습 도구를 다룬다. 이 책에서는 관련 응용 분야와 더불어 가장 중요한 모델링 및 예측 기법들을 소개한다. 주요 주제로는 선형회귀, 분류, 재표집법, 축소 접근법, 나무-기반 방법, 서포트 벡터 머신, 군집화, 딥러닝, 생존분석, 다중검정 등이 포함된다. 컬러 도표와 실제 사례를 사용해 통계적 학습 방법을 군더더기 없이 명료하게 설명한다. 이 책은 최첨단 통계 학습 기법을 사용해 데이터를 분석하려는 통계학자와 비통계학자 모두를 대상으로 한다.
2013년에 쓰인 이 책의 전신인 R 버전은 베스트셀러 반열에 오른 도서로, 전 세계 유수 대학의 데이터과학, 통계학, 컴퓨터학과의 핵심 교재로 사용되고 있다. 그러나 최근 파이썬이 데이터과학 분야의 핵심 언어로 등장하면서 이를 반영한 도서에 대한 요구가 높아졌다. 이 책은 기존 실습 예제를 파이썬으로 구현함과 동시에 최신 통계 기법의 하나인 딥러닝을 추가해 새롭게 출시되었다.
Contents
1장 도입
2장 통계적 학습
2.1 통계적 학습이란 무엇인가?
2.2 모형의 정확도 평가
2.3 실습: 파이썬 기초
2.4 연습문제
3장 선형회귀
3.1 단순선형회귀
3.2 다중선형회귀
3.3 회귀모형에서 생각할 다른 문제들
3.4 마케팅 계획
3.5 선형회귀와 K-최근접이웃의 비교
3.6 실습: 선형회귀
3.7 연습문제
4장 분류
4.1 분류의 개요
4.2 왜 선형회귀를 사용하지 않는가
4.3 로지스틱 회귀
4.4 생성모형을 이용한 분류
4.5 분류 방법 비교
4.6 일반화선형모형
4.7 실습: 로지스틱 회귀, LDA, QDA, KNN
4.8 연습문제
5장 재표집법
5.1 교차검증
5.2 부트스트랩
5.3 실습: 교차검증과 부트스트랩
5.4 연습문제
6장 선형모형선택과 규제
6.1 부분집합선택
6.2 축소 방법
6.3 차원축소법
6.4 고차원에서 생각할 점
6.5 실습: 선형모형과 규제 방법들
6.6 연습문제