딥러닝은 인공지능의 넓은 연구 영역 중에서 기계학습을 탐구하는 분야에 속하며, 그중에서도 특히 많은 층으로 구성되는 심층 신경망을 훈련하기 위한 이론 및 알고리즘을 연구하는 분야이다. 신경망은 두뇌의 신경구조에 착안한 모델로서, 인공 뉴런으로 구성되는 층을 여러 개 연결한 구조이다. 초기의 단순한 모델에서 시작하여 현재의 심층 신 경망을 성공적으로 학습하여 다양한 영역에 실용적으로 활용할 수 있게 되기까지 여러 차례의 부침이 있었다. 현시점에서 딥러닝은 컴퓨터 비전, 자연어 처리, 음성인식 등 다 양한 영역에서 놀랄 만한 성과를 보이고 있으며, 앞으로의 가능성에 대해서도 큰 관심을 가지고 연구하고 있는 분야이다.
이 교재에서는 딥러닝을 이해하는 데 기초가 되는 기본적인 신경망 구조 및 학습 방법을 바탕으로 다양한 유형의 심층망 모델을 소개한다.
Contents
CHAPTER 1 신경망의 개요
1.1 인공 신경망의 개념
1.2 신경망의 기본 구조
1.3 단층 피드포워드 신경망
CHAPTER 2 다층 퍼셉트론과 역전파
2.1 다층 퍼셉트론
2.2 역전파 학습
2.3 실습: 역전파를 이용한 다층 퍼셉트론 학습
2.4 다중 클래스 분류를 위한 MLP의 학습
CHAPTER 3 딥러닝 프레임워크
3.1 딥러닝 프레임워크와 텐서플로
3.2 텐 서
3.3 자동 미분
3.4 Keras를 이용한 모델의 구현
CHAPTER 4 딥러닝의 학습 기술
4.1 경사 하강법
4.2 심층 신경망의 학습 문제
4.3 가중치의 초기화
4.4 최적화기의 개선
4.5 과적합과 규제
4.6 배치 정규화
CHAPTER 5 합성곱 신경망
5.1 합성곱의 이해
5.2 합성곱 신경망의 구조
CHAPTER 6 심층 합성곱 신경망
6.1 LeNet-5
6.2 AlexNet
6.3 VGGNet
6.4 GoogLeNet
6.5 ResNet
CHAPTER 7 오토인코더와 적대적 생성 신경망
7.1 오토인코더
7.2 적대적 생성 신경망
CHAPTER 8 RNN
8.1 RNN의 개념
8.2 LSTM & GRU
8.3 실습: RNN을 이용한 텍스트 생성
8.4 인코더-디코더
CHAPTER 9 트랜스포머
9.1 트랜스포머 모델의 구조
9.2 실습: 트랜스포머를 이용한 번역 모델
CHAPTER 10 초거대 언어 모델
10.1 언어 모델
10.2 GPT
10.3 GPT-2
10.4 GPT-3
10.5 ChatGPT
10.6 실습: 트랜스포머 기반 모델의 사용
Author
이병래,우호성,유찬우
연세대학교 공과대학 전자공학과(공학사)
연세대학교 대학원 전자공학과(공학석사, 공학박사)
미국 North Carolina State University 방문교수
한국방송통신대학교 정보전산원장 역임
현재: 한국방송통신대학교 자연과학대학 컴퓨터과학과 교수
연세대학교 공과대학 전자공학과(공학사)
연세대학교 대학원 전자공학과(공학석사, 공학박사)
미국 North Carolina State University 방문교수
한국방송통신대학교 정보전산원장 역임
현재: 한국방송통신대학교 자연과학대학 컴퓨터과학과 교수