헬스케어에서 말하는 (1)건강 결과에 대한 개선 (2)비용 절감 (3)강화된 환자 경험이라는 헬스케어 3대 목표(Healthcare Triple Aim)가 있다. 여기에 한발 더 나아가 (4)헬스케어 제공자의 업무 환경 개선이라는 헬스케어 4대 목표(Quadraple Aim)를 달성할 수 있도록 이 책에서는 파이썬을 사용한 간단한 사례를 들어 인공지능(머신러닝) 활용법을 알려준다.
Contents
1장. 헬스케어 애널리틱스 개론
__헬스케어 애널리틱스란?
____헬스케어는 고급 컴퓨팅 기술을 사용한다
____헬스케어 애널리틱스는 헬스케어 산업을 다룬다(너무나 당연하게도!)
____헬스케어 애널리틱스는 의료의 질을 개선한다
______건강 결과에 대한 개선
______비용 절감
______의료의 질 보장
__헬스케어 애널리틱스의 기초
____헬스케어
____수학
____컴퓨터 과학
__헬스케어 애널리틱스의 역사
__헬스케어 애널리틱스의 응용 사례
____환자 케어를 위한 데이터 시각화
____진단과 치료에 대한 예측
____헬스케어 제공자의 질과 실적에 대한 측정
____실제 환자 치료에 응용
__소프트웨어 둘러보기
____아나콘다
______아나콘다 내비게이터
______주피터 노트북
______스파이더 통합 개발 환경
____SQLite
____커맨드라인 툴
____텍스트 에디터 설치
__요약
__참고 자료
2장. 헬스케어의 기초
__미국에서 헬스케어 서비스가 전달되는 방법
____헬스케어 산업의 기초
____보건 재정
______행위별 수가제
______가치 기반 케어
____헬스케어 정책
______환자 권리와 프라이버시 보호
______전자 의무 기록 채용 정도
______가치 기반 케어를 발전시키려는 노력
______헬스케어 애널리틱스의 진보
__환자 데이터: 환자에서 컴퓨터까지의 여정
____초진 기록지
______메타데이터와 주소
______현병력
______과거력
______약물력
______가족력
______사회력
______알러지
______계통 문진(시스템 리뷰)
______신체검사
______객관적 데이터(검사실 검사, 이미징, 기타 검사)
______평가와 계획
____경과 기록지
__표준화된 임상 코드셋
____ICD
____CPT
____LOINC
____NDC
____SNOMED-CT
__헬스케어 애널리틱스 쪼개 보기
____인구 집단
____의학적 과제
______질병 선별
______진단
______질병 결과와 예후
______치료에 대한 반응
____데이터 포맷
______정형 데이터
______비정형 데이터
______영상 기록
______기타 데이터 포맷
____질병
______급성 대 만성 질환
______암
______다른 질환들
____종합해보기 - 머신러닝의 목적을 명시적으로 표현하기
__요약
__참고 자료와 더 읽을거리
3장. 머신러닝의 기초
__의학적 의사 결정을 위한 모델 프레임워크
____나무와 비슷한 추론
______알고리즘과 나무를 사용한 카테고리 분류 추론
______대응하는 머신러닝 알고리즘 - 의사 결정 나무와 랜덤 프레스트
____확률적 추론과 베이즈 정리
______베이즈 정리를 사용해 임상적 확률 계산하기
______대응하는 머신러닝 알고리즘 - 나이브 베이즈 분류자
____기준표와 가중 합계 접근법
______기준표
______대응하는 머신러닝 알고리즘 - 선형 회귀와 로지스틱 회귀
____패턴 연관과 신경망
______복잡한 임상적 추론
______해당되는 머신러닝 알고리즘 - 신경망과 딥러닝
__머신러닝 파이프라인
____데이터 로딩
____데이터 정제와 사전 프로세싱
______데이터 집계
______데이터 파싱
______데이터 타입 변환
______결측값 다루기
____데이터 탐색과 시각화
____특징 선택
____모델 파라미터 훈련
____모델 성능 평가
______민감도
______특이도
______양성 예측도
______음성 예측도
______거짓 양성률
______정확도
______ROC 커브
______정밀도-회상 커브
______연속 타깃 변수
__정리
__참고 자료와 더 읽을거리
4장. 컴퓨팅의 기초, 데이터베이스
__데이터베이스의 개요
__SQL을 사용한 데이터 엔지니어링의 사례
__이용 사례에 대한 설명 - 심장 전문 병원을 위한 사망률 예측
____병원 데이터베이스
______PATIENT 테이블
______VISIT 테이블
______MEDICATIONS 테이블
______LABS 테이블
______VITALS 테이블
______MORT 테이블
__SQLite 세션 시작
__데이터 엔지니어링, SQL을 사용해 한 번에 하나의 테이블 다루기
____쿼리 셋 #0: 여섯 개의 테이블 생성
______쿼리 셋 #0a: PATIENT 테이블 만들기
______쿼리 셋 #0b: VISIT 테이블 만들기
______쿼리 셋 #0c: MEDICATIONS 테이블 만들기
______쿼리 셋 #0d: LABS 테이블 만들기
______쿼리 셋 #0e: VITALS 테이블 만들기
______쿼리 셋 #0f: MORT 테이블 만들기
______쿼리 셋 #0g: 테이블 보기
____쿼리 셋 #1: MORT_FINAL 테이블 만들기
____쿼리 셋 #2: MORT_FINAL 테이블에 열 추가하기
______쿼리 셋 #2a: ALTER TABLE을 사용해 열 추가하기
______쿼리 셋 #2b: JOIN을 사용해 열 추가
____쿼리 셋 #3: 데이터 조작 - 나이 계산
____쿼리 셋 #4: 진단명에 대한 비닝과 집계
______쿼리 셋 #4a: 울혈성심부전 진단에 대한 비닝
______쿼리 셋 #4b: 다른 진단명에 대한 비닝
______쿼리 셋 #4c: 합을 이용해 심장병을 하나로 모으기
______쿼리 셋 #4d: 카운트를 사용한 심장 진단의 집계
____쿼리 셋 #5 - 약물 개수 구하기
____쿼리 셋 #6: 비정상 혈액 검사 결과 비닝
____쿼리 셋 #7: 결측값 대치
______쿼리 셋 #7a: 체온 결측값을 정상 범위로 대치하기
______쿼리 셋 #7b: 체온 결측값을 평균값으로 대치하기
______쿼리 셋 #7c: 결측 BNP 값을 균일 분포를 갖는 값으로 대치하기
____쿼리 셋 #8: 타깃 변수 추가하기
____쿼리 셋 #9: 최종 MORT_FINAL_2 테이블 보기
__요약
__참고 자료와 더 읽을거리
5장. 컴퓨팅의 기초, 파이썬 언어
__변수와 데이터 타입
____문자열
____숫자형 데이터 타입
__데이터 구조와 데이터 저장소
____리스트
____튜플
____딕셔너리
____셋
__파이썬 언어를 사용한 프로그래밍 - 예시
__판다스 소개
____판다스 데이터프레임
____데이터 불러오기
______파이썬 데이터 구조에서 판다스로 데이터 불러오기
______플랫 파일에서 판다스로 데이터 불러오기
______데이터베이스에서 판다스로 데이터 불러오기
____흔히 사용되는 데이터프레임 연산
______열 추가
______열 제거
______함수를 여러 개의 열에 적용
______데이터프레임 결합시키기
______데이터프레임 열들을 리스트로 변환하기
______데이터프레임의 값을 지정하거나 접근하기
______행 필터링과 정렬
______SQL 유사 연산
__사이킷런 소개
____샘플 데이터
____데이터 전처리
______카테고리형 변수에 대한 원핫 인코딩
______스케일링과 센터링
______이진화
______결측값 대체
____특징 선택
____머신러닝 알고리즘
______일반화 선형 모델
______앙상블 방법
______추가 머신러닝 알고리즘
____성능 측정
__추가 애널리틱스 라이브러리
____넘파이와 사이파이
____맷플롯립
__요약
6장. 헬스케어 질 측정
__헬스케어 평가법에 대한 소개
__미국 메디케어의 가치 기반 프로그램
__병원 성과 기반 수가지급(HVBP) 프로그램
____도메인과 평가지표
______임상 케어 도메인
______환자 및 보호자 케어 경험 도메인
______안전 도메인
______효율성과 비용 절감 도메인
__병원 재입원 경감 프로그램(HRR)
__원내 발생 합병증 경감(HAC) 프로그램
____원내 감염 도메인
____환자 안전 도메인(PSI)
__말기 신질환 환자 질 인센티브 프로그램
__전문 요양 시설 가치 기반 프로그램
__가정 건강 가치 기반 프로그램
__MIPS
____질
____더 나은 케어 정보
____개선 활동
____비용
__기타 가치 기반 프로그램
____HEDIS
____주 정부 평가지표
__파이썬을 사용해 투석 기관 비교하기
____데이터 다운로드
____주피터 노트북 세션으로 데이터 불러오기
____데이터 행과 열 탐색
____지리적인 탐색
____총점에 기반해 투석 기관 살펴보기
____투석 기관에 대한 다른 내용 분석
__파이썬을 사용한 병원 비교
____데이터 다운로드
____주피터 노트북 세션으로 데이터 읽기
____테이블 탐색
____HVBP 테이블 머징
__요약
__참고 자료
7장. 헬스케어 예측 모델 만들기
__헬스케어 분야에서 예측적 애널리틱스에 대한 소개
__모델링 과제 - 응급실 내원 환자의 퇴원 형태 예측
__데이터셋 얻기
____NHAMCS 데이터셋이란?
____NHAMCS 데이터 다운로드
______ED2013 파일 다운로드
______body_namcsopd.pdf라는 설문 항목 리스트에 대한 설명서 다운로드
______데이터 관련 문서 doc13_ed.pdf 다운로드
__주피터 노트북 세션 시작하기
__데이터셋 임포트
____메타데이터 로딩
____ED2013 데이터 로딩
__반응 변수 만들기
__훈련셋과 테스트셋으로 데이터 나누기
__예측 변수에 대한 전처리
____방문 정보
____인구학적 정보
____응급실 중증도 분류에 대한 변수들
____재정적인 변수
____활력 징후
____방문 이유에 대한 코드
____손상에 대한 코드
____진단 코드
____약물 과거력
____검사 결과
____시술
____약물 코드
____의료 서비스 제공자 정보
____퇴실 배치 정보
____대치된 열들
____아이디 역할을 하는 변수들
____전자 의무 기록 상태에 대한 열들
____자세한 약물 정보
____기타 정보
__마지막 전처리 작업
____원핫 인코딩
____숫자형 변환
____넘파이 배열 변환
__모델 만들기
____로지스틱 회귀
____랜덤 포레스트
____신경망
__모델을 사용한 예측
__모델의 개선
__요약
__참고 자료와 더 읽을거리
8장. 헬스케어 예측 모델 리뷰
__예측 헬스케어 애널리틱스 최신 지견
__전체 심혈관 질환 위험도
____프레이밍햄 위험도
____심혈관 질환 위험도와 머신러닝
__울혈성심부전
____울혈성심부전의 진단
____머신러닝으로 울혈성 심부전 진단
____울혈성심부전에서 머신러닝의 다른 응용 사례들
__암
____암이란?
____암에 대한 머신러닝 응용
____암의 중요한 특징
______일반적인 임상 데이터
______암 특이 임상 데이터
______영상 데이터
______유전체 데이터
______프로테옴 데이터
____유방암 예측 사례
______전통적 유방암 선별
______유방암 선별과 머신러닝
__재입원 예측
____LACE 위험도와 HOSPITAL 위험도
____재입원 모델링
__기타 질환들
__요약
__참고 자료와 더 읽을거리
9장. 미래 - 헬스케어와 떠오르는 기술들
__헬스케어 애널리틱스와 인터넷
____헬스케어와 사물 인터넷
____헬스케어 애널리틱스와 소셜 미디어
______독감 감시와 예측
______머신러닝을 사용한 자살 예측
__헬스케어와 딥러닝
____딥러닝에 대한 간단한 소개
____헬스케어에서의 딥러닝
______딥 피드 포워드 네트워크
______이미지에 대한 컨볼루션 신경망
______순서를 가진 데이터에 대한 순환 신경망
__장애물, 윤리적 문제, 한계
____장애물
____윤리적 문제들
____한계점
__이 책을 마치며
__참고 자료와 더 읽을거리
Author
비카스 쿠마르,고석범
미국 뉴욕주 니스카유나(Niskayuna)에서 자랐다. 피츠버그 대학교에서 의학 박사 학위를 받았지만, 컴퓨터와 데이터 과학에 진정한 흥미를 느껴 그 분야에 뛰어들었다. 이후 조지아 공과 대학에서 컴퓨터공학 학위를 받았고 헬스케어와 비헬스케어 회사들에서 데이터 과학자로 일해왔다. 현재 조지아주 애틀란타시에 거주하고 있다.
미국 뉴욕주 니스카유나(Niskayuna)에서 자랐다. 피츠버그 대학교에서 의학 박사 학위를 받았지만, 컴퓨터와 데이터 과학에 진정한 흥미를 느껴 그 분야에 뛰어들었다. 이후 조지아 공과 대학에서 컴퓨터공학 학위를 받았고 헬스케어와 비헬스케어 회사들에서 데이터 과학자로 일해왔다. 현재 조지아주 애틀란타시에 거주하고 있다.