설명 가능한 인공지능 또는 해석 가능한 머신러닝 모델을 구축하는 다양한 방법론을 소개한다. 최근 이슈가 되고 있는 인공지능 모델의 윤리적 문제를 다루면서도 동시에 높은 성능과 견고성을 유지할 수 있는 비결을 소개한다. 먼저 해석 가능성이란 무엇인지 설명하고 머신러닝 모델의 윤리적 측면인 공정성, 책임성, 투명성이 필요한 이유 그리고 이를 달성할 방법을 설명한다. 그 다음 다양한 상황과 다양한 데이터 형태를 갖는 각 유스 케이스에서 머신러닝 해석방법론을 적용하는 과정을 실제적으로 다루고 있다. 마지막으로 모델의 복잡성을 줄이고, 편향을 완화시키고, 안정성과 견고성을 향상시키기 위해 모델을 튜닝하는 방법을 학습할 수 있다.
Contents
1부. 머신러닝 해석 소개
__1장. 해석, 해석 가능성, 설명 가능성: 왜 이 모두가 중요한가?
______기술 요구 사항
______머신러닝 해석이란?
____단순 몸무게 예측 모델의 이해
______해석 가능성과 설명 가능성의 차이점 이해
____해석 가능성이란
____설명 가능성이란
______해석 가능성에 대한 비즈니스 사례
____더 나은 의사결정
____더 신뢰받는 브랜드
____더 윤리적인
____더 많은 수익
______정리
______이미지 소스
______더 읽을거리
__2장. 해석 가능성의 주요 개념
______기술 요구 사항
______미션
____CVD에 대한 상세정보
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______해석 방법론의 종류와 범위
____모델 해석 가능성 방법론의 종류
____모델 해석 가능성의 범위
____로지스틱 회귀로 개별 예측 해석
______머신러닝 해석 가능성을 저해하는 요인
____비선형성
____상호작용성
____비단조성
______미션 완료
______정리
______더 읽을거리
__3장. 머신러닝 해석의 과제
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터의 이해 및 준비
______전통적인 모델 해석 방법론
____다양한 회귀 방법론으로 지연된 시간 예측
____다양한 분류 방법론으로 항공편 지연 여부 분류
____차원 축소 방법으로 지연된 항공편 시각화
______전통적인 모델 해석 방법론의 한계
______본질적으로 해석 가능한 화이트박스 모델
____일반화 선형 모델(GLM)
____의사결정 트리
____RuleFit
____최근접 이웃
____나이브 베이즈
______성능과 해석 가능성 사이의 균형
____특수한 모델 속성
____성능 평가
______최신의 해석 가능한 글래스박스 모델
____설명 가능한 부스팅 머신(EBM)
____Skoped Rules
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
2부. 해석 방법론 마스터하기
__4장. 피처 중요도와 피처 영향력
______기술 요구 사항
______미션
____성격과 출생 순서
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______결과에 대한 피처의 영향력 측정
____트리 기반 모델의 피처 중요도
____로지스틱 회귀의 피처 중요도
____LDA의 피처 중요도
____다층 퍼셉트론의 피처 중요도
______PFI 실습
____PFI의 단점
______PDP 해석
____상호작용 PDP
____PDP의 단점
______ICE 플롯
____ICE의 단점
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
__5장. 글로벌 모델 독립적 해석 방법론
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
____데이터 딕셔너리
______섀플리 값 소개
______SHAP 요약 플롯 및 의존도 플롯 해석
____SHAP 요약 플롯 생성
____상호작용 이해하기
____SHAP 의존도 플롯
____SHAP 영향력 플롯
______누적 지역 효과 플롯
______글로벌 대체 모델
______미션 완료
______정리
______더 읽을거리
__6장. 로컬 모델 독립적 해석 방법론
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______SHAP의 KernelExplainer 활용해 SHAP 값으로 로컬 해석
______LIME
______NLP에 LIME 사용하기
______NLP에 SHAP 사용하기
______SHAP과 LIME 비교
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
__7장. 앵커와 반사실적 설명
______기술 요구 사항
______미션
____재범 위험 평가의 부당한 편향
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______앵커 설명에 대한 이해
____alibi를 이용해 앵커 및 반사실적 설명 준비하기
____앵커 설명을 위한 로컬 해석
______반사실적 설명 탐색
____프로토타입을 통한 반사실적 설명
____What-If 도구(WIT)를 사용한 반사실적 설명
______CEM과의 비교
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
__8장. 컨볼루션 신경망 시각화
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
____전통적인 해석 방법론으로 CNN 분류기 평가
______활성화 기반 방법론으로 학습 과정을 시각화
____중간 활성화
____활성화 극대화
______그래디언트 기반 귀인 방법론으로 오분류 검증
____돌출 맵
____Grad-CAM
____통합 그래디언트
____종합
______섭동 기반 귀인 방법론으로 분류 이해
____폐쇄 민감도
____LIME의 ImageExplainer
____CEM
____종합
____보너스: SHAP의 DeepExplainer
______미션 완료
______정리
______데이터셋 및 이미지 소스
______더 읽을거리
__9장. 다변량 예측 및 민감도 분석을 위한 해석 방법론
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______전통적인 해석 방법론으로 시계열 모델 평가
______통합 그래디언트로 LSTM 속성 생성
______SHAP의 KernelExplainer로 글로벌 및 로컬 속성 계산
______인자 우선순위화로 영향력 있는 피처 식별
______인자 고정으로 불확실성 및 비용 민감도 정량화
______미션 완료
______정리
______데이터셋 및 이미지 소스
______더 읽을거리
3부. 해석 가능성을 위한 튜닝
__10장. 해석 가능성을 위한 피처 선택과 피처 엔지니어링
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______상관성 없는 피처의 효과 이해
______필터링 기반 피처 선택 방법론
____기본 필터링 기반 방법론
____상관관계 필터링 기반 방법론
____순위 필터링 기반 방법론
____필터링 기반 방법론 비교
______임베디드 피처 선택 방법론
______래퍼, 하이브리드, 고급 피처 선택 방법론
____래퍼 방법론
____하이브리드 방법
____고급 피처 선택 방법론
____모든 피처 선택 모델 평가
______피처 엔지니어링 고려
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
__11장. 편향 완화 및 인과관계 추론 방법론
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______편향 감지
____데이터셋 편향 시각화
____데이터셋 편향 정량화
____모델 편향 정량화
______편향 완화
____전처리 편향 완화 방법론
____프로세스 내 편향 완화 방법론
____후처리 편향 완화 방법론
____편향 완화 방법론 비교
______인과 모델 생성
____실험 결과 이해
____인과 모델에 대한 이해
____선형 DRL 초기화
____인과 모델 적합
______이질적 처치 효과
____정책 선택
______추정치 견고성 테스트
____무작위 공통 원인 추가
____무작위 변수로 처치 대체
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
__12장. 해석 가능성을 위한 단조성 제약조건과 모델 튜닝
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
______피처 엔지니어링으로 가드레일 배치
____서수화
____이산화
____상호작용 항과 비선형 변환
____범주화 인코딩
____다른 준비 작업
______해석 가능성을 위한 모델 튜닝
____케라스 신경망 튜닝
____인기 있는 다른 모델 클래스 튜닝
____베이지안 하이퍼파라미터 튜닝 및 사용자 정의 메트릭으로 공정성 최적화
______모델 제약조건 구현
____XGBoost에 대한 제약조건
______미션 완료
______정리
______데이터셋 소스
______더 읽을거리
__13장. 적대적 견고성
______기술 요구 사항
______미션
______접근법
______준비
____라이브러리 로드
____데이터 이해 및 준비
____CNN 기본 모델 로드
____CNN 기본 분류기 평가
______우회 공격
______전처리를 통한 표적 공격 방어
______적대적 학습을 통해 우회 공격으로부터 보호
______적대적 견고성 평가 및 인증
____모델 견고성과 공격 강도 비교
____무작위 평활화로 견고성 인증
______미션 완료
______정리
______데이터 소스
______더 읽을거리
__14장. 머신러닝 해석 가능성 그다음 단계는?
______ML 해석 가능성의 현재 상황 이해
____전체 요약
____최신 트렌드
____ML 해석 가능성의 미래에 대한 추측
____ML의 새로운 비전
____종합적인 접근
____적절한 표준화
____규제 시행
____내장된 해석으로 인한 매끄러운 머신러닝 자동화
____MLOps 엔지니어와의 긴밀한 통합
______더 읽을거리
Author
세르그 마시스,김우현
지난 20년 동안 인터넷, 애플리케이션 개발 및 분석의 교차점에 있었다. 현재 세계 식량 안보 향상의 임무를 가진 선도적인 농업 비즈니스 기업인 신젠타(Syngenta)의 기후 및 농업 데이터 과학자다. 그 전에는 클라우드 컴퓨팅과 머신러닝의 힘을 의사결정 과학의 원리와 결합해 사용자를 새로운 장소와 이벤트에 노출시키는 하버드 이노베이션 랩스(Harvard Innovation Labs)가 인큐베이팅한 스타트업을 공동 설립했다. 여가 활동이나 식물의 질병, 또는 고객 평생 가치 등 분야에 상관없이 데이터와 의사결정 사이에서 자주 놓치는 연결 고리를 제공하는 데 열정을 쏟고 있으며, 머신러닝 해석은 이런 격차를 해소하는 데 강력한 도움이 된다.
지난 20년 동안 인터넷, 애플리케이션 개발 및 분석의 교차점에 있었다. 현재 세계 식량 안보 향상의 임무를 가진 선도적인 농업 비즈니스 기업인 신젠타(Syngenta)의 기후 및 농업 데이터 과학자다. 그 전에는 클라우드 컴퓨팅과 머신러닝의 힘을 의사결정 과학의 원리와 결합해 사용자를 새로운 장소와 이벤트에 노출시키는 하버드 이노베이션 랩스(Harvard Innovation Labs)가 인큐베이팅한 스타트업을 공동 설립했다. 여가 활동이나 식물의 질병, 또는 고객 평생 가치 등 분야에 상관없이 데이터와 의사결정 사이에서 자주 놓치는 연결 고리를 제공하는 데 열정을 쏟고 있으며, 머신러닝 해석은 이런 격차를 해소하는 데 강력한 도움이 된다.