실제 이론을 코드로 구현하는 데에는 많은 현실적인 격차가 존재하고, 이론을 완벽히 이해한다고 해도 코드로 구현한다는 건 또 다른 문제이다. 그래서 이 책에서는 비지도 학습의 이론을 간단하게 살펴본 후에 알고리즘의 이론과 수식을 여러 단계로 나누고 파이썬 코드로 단계별 결과들을 최대한 상세하게 다루었다. 또한 텐서플로 2의 오토 인코더와 함께 사용하는 주요 딥러닝 이론들을 실습하고 딥러닝의 활성화 함수, 손실 함수, RNN, CNN, LSTM 등을 소개한다. 마지막으로 다양한 예제 데이터와 함께 그동안 배웠던 이론을 적용하고 머신러닝으로 직접 코딩하면서 결과물을 완성할 수 있도록 했다. 이 책을 통해 여러분도 머신러닝에서 비지도 학습이 갖는 역할을 익혀 나가길 바란다.
Contents
서문
저자 소개
베타 리더 리뷰
Chapter 01 비지도 학습 개요
1.1 비지도 학습이란?
1.2 주요 주제 소개
1.3 비지도 학습의 장단점
1.4 비지도 학습의 시작
Chapter 02 차원 축소
2.1 주성분분석
2.2. 특이값 분해
2.3 차원 축소의 성능 평가를 위한 재구축 오차
2.4 다른 차원 축소 기법들
Chapter 03 이상치 탐지
3.1 데이터 불러오기
3.2 데이터 표준화와 분할
3.3 주성분분석의 적용과 해석
3.4 마할라노비스 거리 측정법
3.5 재구축 오차
3.6 답을 안다는 가정에서 성능 평가하기
3.7 데이터 탐색과 이상치 탐지
3.8 지도 학습을 이용한 최적화와 결과 해석
3.9 그 외 sklearn 내장된 이상치 탐지
Chapter 04 군집화
4.1 군집화 과정
4.2 희소행렬(Sparse Matrix) 만들기
4.3 거리 측정법의 소개
4.4 군집화 알고리즘
Chapter 05 군집화의 응용
5.1 상위 군집 만들기
5.2 군집별 등급 지정하기
5.3 군집별 중요도 구하기
5.4 텍스트 데이터를 이용한 군집 특성 이해하기
5.5 군집화 결과 해석하기
Chapter 06 텐서플로 2 소개
6.1 텐서플로2의 장점과 강점
6.2 케라스 소개(Keras API)
6.3 합성곱 신경망(CNN) 소개
6.4 순환 신경망(RNN)과 장단기 기억 모델(LSTM) 소개
6.5 모델의 시각화, 저장, 불러오기
Chapter 07 오토 인코더(Auto Encoder)
7.1 바닐라 오토 인코더(with keras)
7.2 다양한 오토 인코더의 구조
Chapter 08 오토 인코더의 응용
8.1 오토 인코더 은닉층을 이용한 군집화 예제
8.2 오토 인코더의 이상치 탐지
8.3 오토 인코더에 범주형 변수 추가
8.4 변분 오토 인코더
8.5 앙상블 결과
찾아보기
Author
송동근
한림대학교 학사부터 중앙대학교 석사까지 통계학을 전공하였고, 위메프를 거쳐 현재는 버즈니에서 데이터 분석가로 활동 중이다. 파이썬을 주 코드로 사용하고 있으며 개발에도 참여 중이다. 주로 커머스 계열의 데이터를 많이 다루었고 추천과 고객 세그먼트, 카테고리 분류, 빅데이터 처리 등의 경력을 갖고 있다.
한림대학교 학사부터 중앙대학교 석사까지 통계학을 전공하였고, 위메프를 거쳐 현재는 버즈니에서 데이터 분석가로 활동 중이다. 파이썬을 주 코드로 사용하고 있으며 개발에도 참여 중이다. 주로 커머스 계열의 데이터를 많이 다루었고 추천과 고객 세그먼트, 카테고리 분류, 빅데이터 처리 등의 경력을 갖고 있다.