사회과학 연구자에게 “사건발생”은 오랫동안 관심이 있는 주제로 자리매김하고 있다. 사건발생 여부는 이항(binary) 또는 다항(multinomial) 로짓 · 프로빗 모형을 주로 사용한다. 이러한 모형은 사건발생 자체에만 관심을 가지는데 비해 생존분석 모형은 사건발생뿐 아니라 발생까지 걸린 시간(time to events)에도 초점을 맞추고 있다는 점에서 차이가 있다. 특히 사회과학 데이터가 관찰연구(observational study)라는 특징으로 인해 사건이 발생하지 않은 경우, 즉 우측절단(right-censoring) 형태의 관측치가 나타나게 된다. 우측절단까지 고려하여 the timing of events를 분석하는 것이 생존분석의 주요한 목적이다. 실업까지 걸린 시간, 출소한 범죄자가 재범으로 체포되는데 걸린 시간, 결혼한 부부가 이혼까지 걸린 시간, 네이버 부동산에 올린 아파트 매물이 거래되는데 걸리는 시간 등이 사회과학에서 생존분석 활용 예시가 될 수 있다. 광범위한 사회과학 분야에 응용될 수 있는 방법론임에도 불구하고 사회과학 연구자를 위한 생존분석 교재가 부족한 것 역시 사실이다. 본서는 최소한의 수학적 지식을 바탕으로 생존분석의 이론적 내용을 이해하고 그 응용과 데이터 실습에 초점을 맞추고 있다. 본서의 내용은 크게 연속시간 모형과 이산시간 모형으로 나누어진다. 연속시간 모형은 비모수적/준모수적/모수적 접근방법을 설명하고 단일사건/반복 사건 발생 모형도 논의하였다. 생존분석의 데이터 구성부터 각 데이터 구조에 맞는 방법 을 체계적이고 폭넓게 설명하는 것을 저서의 목적으로 삼았다. 본서에 사용된 예제 데이터파일( 표시)은 한국STATA학회 홈페이지(http://kastata.org/html/sub02-04.asp)에서 다운 로드 받아 연구자가 직접 실습할 수 있도록 하였다.
Contents
제1장|생존분석 데이터 입문
1.1 생존분석 기본 개념
1.2 생존분석 데이터 구조 및 유형
1.3 stset 명령어
1.4 Stata do file
제2장|생존분석 데이터 관리 명령어
2.1 stdescribe와 stsum 명령어
2.2 stvary과 stfill 명령어
2.3 stsplit과 stjoin 명령어
2.4 Stata do file
제3장|생존분석의 기본 함수
3.1 연속시간에서 생존함수와 해저드 함수
3.2 이산시간에서 생존함수와 해저드 함수
3.3 Stata do file
제4장|비모수적 생존분석
4.1 Kaplan-Meier 추정
4.2 관련된 가설검정
4.3 Stata 실습: Kaplan-Meier 추정
4.4 Stata 실습: 그래프 및 가설검정
4.5 Stata 실습: id가 반복되는 생존분석 데이터
4.6 Stata do file
제5장|준모수적 생존분석 (1)
5.1 Cox 회귀모형의 추정과 이해
5.2 Cox 모형 사후분석
5.3 비례적 해저드에 대한 진단
5.4 Stata 실습
5.4 Stata do file
제6장|준모수적 생존분석 (2)
6.1 시간가변 공변량을 포함한 Cox 모형
6.2 반복사건을 포함한 Cox 모형
6.3 Stata 실습
6.4 Stata do file
제7장|모수적 생존분석 (1)
7.1 비례적 해저드 모형과 AFT 모형
7.2 지수(exponential) 분포와 와이블(Weibull) 분포
7.3 Gompertz 분포
7.4 Stata 실습
7.5 Stata do file
제8장|모수적 생존분석 (2)
8.1 예측과 한계효과
8.2 그래프 작성
8.3 Stata do file
제9장|모수적 생존분석 (3)
9.1 log-normal과 log-logistic 분포
9.2 일반화 감마(Generalized Gamma) 분포
9.3 Stata 실습
9.4 Stata do file
제10장|패널 생존분석
10.1 패널 생존분석 데이터 구조
10.2 고정효과 패널 생존분석
10.3 확률효과 패널 생존분석
10.4 Stata 실습
10.5 Stata do file
제11장|멀티레벨 생존분석
11.1 멀티레벨 생존분석 데이터
11.2 2단계(two-level) AFT와 PH 모형
11.3 3단계(three-level) 모형
11.4 Stata 실습 (1) : 추정
11.5 Stata 실습 (2) : 예측 11.6 Stata do file
제12장|이산시간 생존분석 (1)
12.1 이산시간 생존분석 모형
12.2 이산시간 생존분석 데이터 구조
12.3 Stata 실습 (1): 추정
12.4 Stata 실습 (2): 생존함수와 해저드 함수
12.5 Stata do file
제13장|이산시간 생존분석 (2)
13.1 패널 이질성을 고려한 이산 생존분석 (1)
13.2 패널 이질성을 고려한 이산 생존분석 (2)
13.3 Stata 실습 (1): xtlogit and xtcloglog
13.4 Stata 실습 (2): pgmhaz8과 hshaz 13.5 Stata do file
제14장|구조방정식을 활용한 생존분석
14.1 경로모형(Path analysis model)
14.2 측정모형(Measurement Model)
14.3 멀티그룹 생존분석
14.4 Stata do file
Author
민인식
서울대학교 사회과학대학 경제학부 졸업
Texas A&M University경제학과 대학원 졸업(경제학박사)
정보통신정책연구원 책임연구원
Adjunct Professor, School of Public Health, Texas A&M University
(현) 경희대학교 정경대학 경제학과 교수
서울대학교 사회과학대학 경제학부 졸업
Texas A&M University경제학과 대학원 졸업(경제학박사)
정보통신정책연구원 책임연구원
Adjunct Professor, School of Public Health, Texas A&M University
(현) 경희대학교 정경대학 경제학과 교수