생존분석(survival analysis)은 사건사 분석(event history analysis)이라는 명명이 더 어울리는 분야인 것 같다. 생존분석 또는 실패 시간 분석(failure time analysis)의 역사는 1900년 초기 공학계열에서 기계 부품의 수명 분석, 보험학에서 사망자 수와 사고 건수에 대한 분석으로부터 시작되었다. 1980년경 위대한 통계학자인 Cox가 제안한 비례위험모형 덕분에 생존분석의 적용 범위는 다양해졌으며 이후 비례위험가정 위배 시 적용될 수 있는 다이내믹 모형이 개발되었다. 또한 Counting process와 Empirical process의 적용을 통해 추정량과 검정 통계량의 이론적 성질을 규명할 수 있게 되었다.
이 책은 생존분석의 이론을 설명하기보다 다양한 생존분석이 적용되는 자료와 분석 방법론을 소개한다. 예를 들어 일반적인 우중도절단자료(right censored data) 이외에 좌절삭(left truncation), 구간중도절단(interval censored) 등 다양한 종류의 일변량 생존자료뿐만 아니라 군집생존자료, 재발사건자료, 경쟁위험모형 자료 등 다변량 생존자료에 대해서도 논의한다. 이 책에서는 실제 적용 예를 위해 여러 통계 패키지 중 R 프로그램을 사용한다. R은 free package라는 절대적인 장점 덕분에 사용자가 급속히 확산되고 있으며 전 세계 학자들이 제안한 방법론을 패키지로 업데이트한다는 점에서 굉장히 매력적이다. 하지만 금융과 의약학에서는 여전히 SAS 프로그램을 사용하고 있으므로 SAS 프로그램과 결과를 부록에 더하였다.
이 책에서 다루어질 내용은 다음과 같다. 우선 초보자를 위해 0장에서는 R 프로그램의 사용 방법을 간략하게 공부한다. 이 단계에서 범주형 자료를 이용하여 자료의 입·출력과 처리 방법을 익히고 로지스틱 회귀분석을 복습한다. 1장에서는 생존분석의 개념을 요약해서 설명하고, 생존분석 자료에서 자주 다루는 여러 가지 유형의 중도절단자료 형태와 다변량 생존자료의 실제 예, 그리고 각 자료의 특성을 소개한다.
Contents
00. R 프로그램 소개
0.1 자료의 입력
0.2 기초 사용법
0.3 범주형 자료분석
0.4 로지스틱 회귀분석
0.5 그래픽 작성
01. 서론
1.1 용어와 기본 개념
1.2 Counting process
1.3 실제 예와 연관된 통계 문제
02. 비모수 방법을 이용한 생존함수의 추정
2.1 생명표 방법
2.2 Kaplan-Meier 추정량
2.3 누적위험함수와 여러 가지 통계량
2.4 다른 유형의 중도절단자료에 대한 생존함수추정
03. 생존함수의 비교
3.1 로그 순위검정
3.2 가중 로그 순위검정
3.3 구간중도절단자료에서 두 생존함수의 비교
04. 모수 분포를 이용한 생존함수의 추정과 회귀모형
4.1 우도함수
4.2 여러 가지 모수 분포
4.3 가속실패 시간 모형
4.4 모수모형을 이용한 회귀분석
4.5 비례 오즈 회귀모형