이 책은 머신러닝의 원리와 알고리즘을 파이썬으로 실습하며 배우는 입문용 교재다. 머신러닝의 개념과 실제 실습 환경을 구축하는 방법에 대해 이해하고, 기본 파이썬 패키지를 이용하여 머신러닝을 구현하는 방법을 학습한다. 다음으로 선형회귀, 로지스틱 회귀와 같은 머신러닝 회귀기법을 살펴보고, 고급 머신러닝 과정인 나이브 베이지안 분류기, 의사결정트리, 앙상블에 대해 알아본다. 이 책을 처음부터 끝까지 직접 실습하면서 따라하다 보면, 머신러닝을 처음 배우는 독자들도 데이터 과학에 익숙해질 것이다.
※ 본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.
Contents
PART 01 머신러닝의 개요
CHAPTER 01 머신러닝의 기초
1. 머신러닝이란?
2. 머신러닝의 학습 프로세스와 종류
3. 머신러닝 연대기
4. 머신러닝 환경 구축하기
요약/연습문제
CHAPTER 02 데이터의 이해
1. 피쳐란?
2. 피쳐의 종류
3. 데이터를 모델에 대입하기
요약/연습문제
PART 02 머신러닝을 위한 파이썬 패키지
CHAPTER 03 넘파이
1. 넘파이란?
2. 넘파이 배열 객체 다루기
3. 넘파이 배열 연산
4. 비교 연산과 데이터 추출
요약/연습문제
CHAPTER 04 판다스
1. 판다스란?
2. 데이터 추출
3. 그룹별 집계
4. 병합과 연결
요약/연습문제
CHAPTER 05 데이터 시각화
1. 맷플롯립
2. 시본
3. 플롯리
요약/연습문제
CHAPTER 06 데이터 전처리
1. 데이터 전처리 기초
2. 데이터 전처리 전략
3. 데이터 전처리 실습
요약/연습문제
PART 03 머신러닝 회귀기법
CHAPTER 07 선형회귀의 기초
1. 선형회귀의 이해
2. 선형회귀의 기초 수식
3. 최소자승법으로 선형회귀 풀기
4. 경사하강법으로 선형회귀 풀기
5. 선형회귀 성능 측정하기
6. 코드로 선형회귀 구현하기
요약/연습문제
CHAPTER 08 선형회귀의 심화
1. 경사하강법의 종류
2. 과대적합과 정규화
3. 사이킷런을 이용한 선형회귀
요약/연습문제
CHAPTER 09 로지스틱 회귀의 기초
1. 로지스틱 회귀란?
2. 분류 문제의 성능지표
3. 로지스틱 회귀 구현하기
요약/연습문제
1. 베이즈 정리의 이해
2. 베이즈 분류기 구현하기
3. 나이브 베이지안 분류기 구현하기
4. 20newsgroup으로 분류 연습하기
요약/연습문제
CHAPTER 12 의사결정트리
1. 의사결정트리의 이해
2. 의사결정트리 알고리즘
3. 의사결정트리의 확장
4. 의사결정트리 알고리즘의 다양한 변형
5. 의사결정트리의 구현
요약/연습문제
CHAPTER 13 앙상블
1. 앙상블의 이해
2. 투표 분류기
3. 배깅과 랜덤 포레스트
4. 부스팅
요약/연습문제
Author
최성철
한동대학교 경영학·전산학 학사, 포항공과대학교 산업경영공학과 Technology Intelligence 박사 학위를 받았다. 삼성전자 종합기술원의 CTO 전략팀에서 기술 전략과 R&D 정보시스템 개선 업무를 맡았으며, 현재 가천대학교 산업경영공학과 교수로 재직 중이다. 주요 연구 분야로 머신러닝을 활용한 Scholarly Big Data를 다루며, 데이터로 할 수 있는 다양한 분야에 관심을 두고 있다. 국내 프로그래밍 관련 MOOC 개발 1세대 경험자로, K-MOOC에서 ‘데이터 과학을 위한 파이썬’과 ‘Operations Research with Python’을 강의하였고, 인프런(https://www.inflearn.com)에서 ‘데이터 과학을 위한 파이썬 입문’, ‘밑바닥부터 시작하는 머신러닝 입문’ 등을 강의하였다. 가천대학교 데이터 과학 연구센터 TEAMLAB(http://theteamlab.io)의 리더이며, ‘Human Knowledge Belongs to the World’라는 좌우명을 가지고 있다.
한동대학교 경영학·전산학 학사, 포항공과대학교 산업경영공학과 Technology Intelligence 박사 학위를 받았다. 삼성전자 종합기술원의 CTO 전략팀에서 기술 전략과 R&D 정보시스템 개선 업무를 맡았으며, 현재 가천대학교 산업경영공학과 교수로 재직 중이다. 주요 연구 분야로 머신러닝을 활용한 Scholarly Big Data를 다루며, 데이터로 할 수 있는 다양한 분야에 관심을 두고 있다. 국내 프로그래밍 관련 MOOC 개발 1세대 경험자로, K-MOOC에서 ‘데이터 과학을 위한 파이썬’과 ‘Operations Research with Python’을 강의하였고, 인프런(https://www.inflearn.com)에서 ‘데이터 과학을 위한 파이썬 입문’, ‘밑바닥부터 시작하는 머신러닝 입문’ 등을 강의하였다. 가천대학교 데이터 과학 연구센터 TEAMLAB(http://theteamlab.io)의 리더이며, ‘Human Knowledge Belongs to the World’라는 좌우명을 가지고 있다.