자동 특성 공학, 모델 및 하이퍼파라미터 튜닝, 그래디언트 기반 접근법 등의 기본 기술을 살펴보고 다양한 오픈소스 툴을 사용해 자동머신러닝 기술을 구현하는 방법을 배운다. 구체적으로 애저(Azure), 아미존 웹 서비스(AWS), 구글 클라우드 플랫폼(GCP)을 포함한 3대 클라우드 서비스에서 자동머신러닝(AutoML)을 구현하는 다양한 방법을 설명한다. AutoML을 사용해 머신러닝 모델을 구축해 클라우드 AutoML 플랫폼의 기능을 살펴본다. 이 책을 마치면 정확하면서도 생산성을 높이고 상호 운용성을 허용하며 특징적인 엔지니어링 작업을 최소화하는 AutoML 모델을 구축하고 배포할 수 있을 것이다.
Contents
1부. 자동머신러닝 소개
1장. 자동머신러닝 개요
__머신러닝 개발 수명 주기
__자동머신러닝
__자동화 ML의 작동법
____하이퍼파라미터
____자동머신러닝의 필요성
__데이터 과학의 민주화
__자동머신러닝 신화의 타파
____신화 #1: 데이터 과학자의 종말
____신화 #2: 자동ML은 단지 토이 문제만을 풀 수 있다
__자동머신러닝 생태계
__오픈소스 플랫폼과 도구
____마이크로소프트 NNI
____Auto - sklearn
____Auto - Weka
____auto - Keras
____TPOT
____Ludwig - 코드 없는 AutoML 툴박스
____AutoGluon: 딥러닝을 위한 AutoML 툴킷
____Featuretools
____H2O AutoML
__상업적 도구와 플랫폼
____DataRobot
____구글 클라우드 AutoML
____아마존 세이지메이커 오토파일럿
____애저 자동ML
____H2O 드라이버리스 AI
____자동ML의 미래
____자동ML 문제와 한계
____기업을 위한 입문 지침
__요약
2장. 자동머신러닝, 알고리듬 그리고 기법
__자동화된 ML - 뚜껑 열기
____자동ML 용어의 분류 체계
__자동화된 특성 공학
__하이퍼파라미터 최적화
__신경망 구조 탐색
__요약
3장. 오픈소스 툴과 라이브러리를 이용한 자동머신러닝
__기술 요구 사항
__AutoML용 오픈소스 생태계
__TPOT 소개
____TPOT는 이를 어떻게 수행하는가?
__Featuretools 소개
__마이크로소프트 NNI 소개
__auto-sklearn 소개
__Auto-Keras 소개
____Ludwig - 코드 없는 AutoML 툴박스
__AutoGluon - 딥러닝을 위한 AutoML 툴킷
__요약
2부. 클라우드 플랫폼을 이용한 AutoML
4장. Azure 머신러닝으로 시작하기
__Azure 머신러닝으로 시작하기
__Azure 머신러닝 스태킹하기
__Azure 머신러닝 서비스로 시작하기
__Azure 머신러닝으로 모델링하기
__Azure 머신러닝을 이용한 모델 배포와 테스트
__요약
5장. 마이크로소프트 Azure를 이용한 자동머신러닝
__마이크로소프트 Azure의 AutoML
__AutoML을 이용한 시계열 예측
__요약
6장. AWS를 이용한 머신러닝
__AWS 지형에서의 ML
__AWS ML로 시작하기
__AWS 세이지메이커 오토파일럿
__AWS 점프스타트
__요약
7장. 아마존 세이지메이커 오토파일럿으로 자동머신러닝 실행하기
__기술적 요구 조건
__아마존 세이지메이커 오토파일럿의 작성 - 제한된 실험
__AutoML 실험 생성
__세이지메이커 오토파일럿 실험의 수행과 모델의 배포
____세이지메이커 오토파일럿 모델 호출 및 테스트
__노트북으로부터 세이지메이커 오토파일럿 실험을 구축하고 실행하기
____모델 호스트와 호출
__요약
8장. 구글 클라우드 플랫폼을 이용한 머신러닝
__구글 클라우드 플랫폼 서비스로 시작하기
__구글 클라우드 플랫폼을 이용한 AI와 ML
__구글 클라우드 AI 플랫폼과 AI 허브
__구글 클라우드 AI 플랫폼으로 시작하기
__구글 클라우드를 이용한 자동ML
__요약
9장. 구글 클라우드 플랫폼을 이용한 자동머신러닝
__구글 클라우드 AutoML Tables로 시작하기
__AutoML Tables 실험 생성
__AutoML Tables 모델 배포 이해
__BigQuery 공용 데이터셋을 이용한 AutoML Tables
__가격 예측을 위한 자동머신러닝
__요약
3부. 자동머신러닝 응용
10장. 엔터프라이즈 자동ML
__조직이 자동ML을 필요로 하는가?
____타이탄의 충돌 - 자동ML 대 데이터 과학자
__자동ML - 엔터프라이즈 고급 분석을 위한 가속기
____인간 친숙한 통찰력을 가진 AI의 민주화
____증강된 지능
__자동ML 도전 과제와 기회
____불충분한 데이터
____모델 성능
____도메인 전문가와 특수 용도 사례
____컴퓨팅 비용
____학습 곡선의 수용
____이해관계자의 적응
__신뢰 구축 - 모델 해석 가능성과 자동ML의 투명성
____특성 중요도
____반사실 분석
____데이터 과학 모델 정확도 척도
____사전 모델 설명 가능성
____실행 중 모델 설명 가능성
____사후 모델 설명 가능성
__조직에의 자동ML 도입
____충격 흡수
____올바른 자동ML 플랫폼 선택
____데이터의 중요성
____청중의 올바른 메시지
__활용 방안 - 다음 단계는 무엇인가?
Author
아드난 마수드,이기홍
미국 스탠퍼드대학교 AI 랩 객원학자, 소프트웨어 엔지니어, 마이크로소프트 MVP(Most Vauable Professional)이자 마이크로소프트 지역 인공지능 담당 이사다. UST Global의 AI 및 머신러닝 수석 설계자로, 스탠퍼드 AI Lab 및 MIT CSAIL과 협업하고 있으며 다양한 비즈니스, 제품, 이니셔티브에 영향을 미치는 비즈니스 가치와 통찰력을 제공할 수 있는 인공지능 솔루션을 개발하는 데이터 과학자 및 엔지니어 팀을 이끌고 있다.
미국 스탠퍼드대학교 AI 랩 객원학자, 소프트웨어 엔지니어, 마이크로소프트 MVP(Most Vauable Professional)이자 마이크로소프트 지역 인공지능 담당 이사다. UST Global의 AI 및 머신러닝 수석 설계자로, 스탠퍼드 AI Lab 및 MIT CSAIL과 협업하고 있으며 다양한 비즈니스, 제품, 이니셔티브에 영향을 미치는 비즈니스 가치와 통찰력을 제공할 수 있는 인공지능 솔루션을 개발하는 데이터 과학자 및 엔지니어 팀을 이끌고 있다.