베이즈 규칙이 발견된 1763년부터 지금까지, 250년이 넘는 시간 동안의 수많은 알고리듬의 개발과 각 알고리듬의 정확도에 관여된 추론의 발전에 관해 설명하는 책이다. '추론'이 '단순히 알고리듬의 정확도를 말하는 것' 이상의 것임을 보여주며, 빅데이터 시대의 여러 경험적 기법을 세세히 알려준다. 또한 전통적 기법의 시대인 베이즈, 빈도주의, 피셔주의 시대와 컴퓨터가 등장한 초기 시대인 1950년에서 1990년, 그리고 그 이후부터 현재까지의 세 가지 연대를 나눠, 각 시대에 있어 알고리듬과 추론의 발전에 대해 설명한다. 각 장은 서로 연관돼 있으면서도 독립적으로 읽을 수 있도록 구성돼 있다. 학생판에는 130개의 연습문제를 추가했다. 연습문제는 문제 해결 및 책에 제시된 아이디어와 방법론의 구현을 통해 자료에 대한 이해를 향상시킬 것이다. 2019년 4월 출간한 양장본과 동일한 내용의 도서로 각 챕터 마지막에 연습문제가 추가됐다.
Contents
1부. 전통적인 통계적 추론
01장. 알고리듬과 추론
__1.1 회귀 예제
__1.2 가설 검정
__1.3 주석 및 상세 설명
__1.4 연습문제
02장. 빈도주의 추론
__2.1 실제에서의 빈도주의
__2.2 빈도주의 최적성
__2.3 주석 및 상세 설명
__2.4 연습문제
03장. 베이즈 추론
__3.1 두 가지 예제
__3.2 불충분 정보 사전 분포
__3.3 빈도주의 추론의 결함
__3.4 베이즈/빈도주의 비교 리스트
__3.5 주석 및 상세 설명
__3.6 연습문제
04장. 피셔 추론과 최대 우도 추정
__4.1 우도와 최대 우도
__4.2 피셔 정보와 MLE
__4.3 조건부 추론
__4.4 순열과 랜덤화
__4.5 주석 및 상세 설명
__4.6 연습문제
05장. 모수적 모델과 지수 패밀리
__5.1 일변량 패밀리
__5.2 다변량 정규분포
__5.3 다모수 패밀리의 피셔 정보 경계
__5.4 다항분포
__5.5 지수 패밀리
__5.6 주석 및 상세 설명
__5.7 연습문제
2부. 초기 컴퓨터 시대 기법
06장. 경험적 베이즈
__6.1 로빈의 공식
__6.2 누락된 종 문제
__6.3 의학 예제
__6.4 간접 증거 1
__6.5 주석 및 상세 설명
__6.6 연습문제
07장. 제임스-스타인 추정과 리지 회귀
__7.1 제임스-스타인 추정기
__7.2 야구 선수들
__7.3 리지 회귀
__7.4 간접 증거 2
__7.5 주석 및 상세 설명
__7.6 연습문제
08장. 일반화된 선형 모델과 회귀 트리
__8.1 로지스틱 회귀
__8.2 일반화 선형 모델
__8.3 포아송 회귀
__8.4 회귀 트리
__8.5 주석 및 상세 설명
__8.6 연습문제
09장. 생존 분석과 EM 알고리듬
__9.1 생명표와 위험률
__9.2 검열된 데이터와 카플란-마이어 추정
__9.3 로그 순위 검정
__9.4 비례적 위험 모델
__9.5 누락 데이터와 EM 알고리듬
__9.6 주석 및 상세 설명
__9.7 연습문제
10장. 잭나이프와 부트스트랩
__10.1 표준오차에 대한 잭나이프 추정
__10.2 비모수적 부트스트랩
__10.3 재표본추출 계획
____극소 잭나이프
____다표본 부트스트랩
____이동 블록 부트스트랩
____베이즈 부트스트랩
__10.4 모수적 부트스트랩
__10.5 영향 함수와 안정적 추정
__10.6 주석 및 상세 설명
____부트스트랩 패키지
__10.7 연습문제
11장. 부트스트랩 신뢰구간
__11.1 단일 모수 문제에 대한 네이만의 구성
____변환 불변성
__11.2 퍼센타일 기법
__11.3 편향 수정 신뢰구간
__11.4 2차 정확성
__11.5 부트스트랩-t 구간
__11.6 객관적 베이즈 구간과 신뢰분포
__11.7 주석 및 상세 설명
__11.8 연습문제
12장. 교차 검증과 Cp 예측 오차 추정
__12.1 예측 규칙
__12.2 교차 검증
__12.3 공분산 페널티
__12.4 훈련, 검증, 단기 예측 변수
__12.5 주석 및 상세 설명
__12.6 연습문제
13장. 객관적 베이즈 추론과 마르코프 체인 몬테 카를로
__13.1 객관적 사전 분포
____범위 매칭 사전 분포
__13.2 켤레 사전 분포
____객관적 베이즈 추론에 대한 비평
__13.3 모델 선택과 베이즈 정보 기준
__13.4 깁스 표본과 MCMC
__13.5 예제: 개체군 혼합물 모델링
__13.6 주석 및 상세 설명
__13.7 연습문제
14장. 전후 시대의 통계적 추론과 기법
3부. 21세기 주제
15장. 대규모 가설 검정과 거짓 발견율
__15.1 대규모 검정
__15.2 거짓 발견율
__15.3 경험적 베이즈 대규모 검정
__15.4 지역 거짓 발견율
__15.5 귀무분포의 선택
____경험적 귀무 추정
__15.6 연관성
____요약
__15.7 주석 및 상세 설명
__15.8 연습문제
16장. 희소 모델링과 라소
__16.1 전방 단계별 회귀
__16.2 라소
__16.3 라소 모델 적합화
__16.4 최소각 회귀
____라소와 자유도
__16.5 일반화된 라소 모델 적합화
__16.6 라소를 위한 선택-후 추론
__16.7 연결과 확장
____라소 로지스틱 회귀와 SVM
____라소와 부스팅
____라소의 확장
__16.8 주석 및 상세 설명
__16.9 연습문제
17장. 랜덤 포레스트와 부스팅
__17.1 랜덤 포레스트
____OOB 오차 추정
____표준오차
____변수 중요도 그래프
__17.2 제곱 오차 손실 함수를 사용한 부스팅
____트리 깊이와 상호작용 복잡도
____축소
__17.3 그래디언트 부스팅
__17.4 에이다부스트: 원래의 부스팅 알고리즘
__17.5 연결과 확장
____일반화 가첨 모델
____부스팅과 라소
__17.6 주석 및 상세 설명
__17.7 연습문제
18장. 신경망과 딥러닝
__18.1 신경망과 필기체 숫자 문제
__18.2 신경망 적합화
____그래디언트 계산: 역전파
____그래디언트 하강
____다른 튜닝 모수들
__18.3 오토인코더
__18.4 딥러닝
__18.5 딥 네트워크 학습
__18.6 주석 및 상세 설명
__18.7 연습문제
19장. 서포트 벡터 머신과 커널 기법
__19.1 최적 분리 초평면
__19.2 소프트 마진 분류기
__19.3 손실 플러스 페널티로서의 SVM 기준
__19.4 계산과 커널 트릭
__19.5 커널을 이용한 함수 적합화
__19.6 예제: 단백질 분류에 대한 문자열 커널
__19.7 SVM: 결론
__19.8 커널 평활화와 지역 회귀
__19.9 주석 및 상세 설명
__19.10 연습문제
20장. 모델 선택 후의 추론
__20.1 동시 신뢰구간
__20.2 모델 선택 후 정확도
__20.3 선택 편향
__20.4 병합된 베이즈-빈도주의 추정
__20.5 주석 및 상세 설명
__20.6 연습문제
21장. 경험적 베이즈 추정 전략
__21.1 베이즈 디컨볼루션
__21.2 g-모델링과 추정
__21.3 우도, 정규화, 정확도
__21.4 두 가지 예제
__21.5 일반적 선형 혼합 모델
__21.6 디컨볼루션과 f-모델링
__21.7 주석 및 상세 설명
__21.8 연습문제
Author
브래들리 에프론,트레버 해스티,이병욱
스탠퍼드 대학교의 통계학 및 생물의학 데이터 과학 교수다. 하버드, 버클리, 임페리얼 칼리지 런던의 객원 교수 직책을 맡았다. 또한 통계적 추론에 대해 심도 있는 연구를 수행했으며, 부트스트랩 표본 기법을 발명했다. 2005년 ‘국가 과학(National Medal of Science) 상’을 수상했고, 2014년 왕립통계학회(Royal Statistical Society)의 ‘가이 메달(Guy Medal) 금상’을 수상했다.
스탠퍼드 대학교의 통계학 및 생물의학 데이터 과학 교수다. 하버드, 버클리, 임페리얼 칼리지 런던의 객원 교수 직책을 맡았다. 또한 통계적 추론에 대해 심도 있는 연구를 수행했으며, 부트스트랩 표본 기법을 발명했다. 2005년 ‘국가 과학(National Medal of Science) 상’을 수상했고, 2014년 왕립통계학회(Royal Statistical Society)의 ‘가이 메달(Guy Medal) 금상’을 수상했다.