메타러닝(Meta-Learning)은 기계가 ‘학습하는 방법을 학습하는 것(Learning-to-Learn)’을 의미하며, 이는 일반 AI의 범주에서 유래된 개념이다. 메타러닝은 기계가 인간을 대신해 더 지능적이고 복잡하며 변화 가능한 작업을 수행할 수 있도록 돕는다. 최근 MAML(Model-Agnostic Meta-Learning)의 부상으로 메타러닝 개념이 주목받고 있다. MAML은 메타러닝을 딥러닝 모델의 보완 수단으로 활용하여, MAML 모듈을 도입해 적절한 조합 및 디버깅을 통해 딥러닝 모델의 일반화 능력을 향상 시킨다. 이를 통해 딥러닝 모델의 정확도를 유지하면서 과적합 문제를 방지하고, 다양한 비분산 작업에서도 모델의 정확도를 향상시킬 수 있다. 이 책은 메타 러닝의 기본 개념을 이해하고, 이를 실제 문제 해결에 적용하고자 하는 독자들에게 적합하다. 특히, 금융 분야에서 표본 외 예측 작업을 자주 수행하거나, 변화무쌍한 환경에 적응해야 하는 로봇 연구, 그리고 소규모 표본 이미지 분류 작업에 종사하는 독자들에게 유용할 것이다. 기존 모델의 효율성을 개선하고, 더 깊은 수준의 자동화를 달성할 수 있도록 해당 분야의 독자들에게 도움이 되기를 바란다.
Contents
역자 서문
저자 서문
1장. 메타 러닝 개요
1.1 연구 배경 10
1.1.1 메타 러닝과 딥러닝의 차이점과 공통점 13
1.1.2 메타 러닝 응용의 예 19
1.2 메타 러닝의 기원 22
1.2.1 1987년 Jurgen Schmidhuber 23
1.2.2 1990년 Stuart Russell와 Eric H. Wefald 28
1.3 최근 개발 사항 31
1.3.1 1997 장단기 메모리 신경망 33
1.3.2 2001년의 장단기 메모리 신경망 메타 러닝 시스템 34
1.3.3 2017년의 MAML 알고리즘 35
1.3.4 2019년 장단기 메모리 신경망 기반 메타 모델 37
1.3.5 2019년 효율적인 기본 모델 기반 메타 러닝 38
1.4 참고문헌 40
2장. 메타 러닝 프레임워크
2.1 메타 러닝 연구를 위한 상용 데이터 세트 44
2.2 작업의 정의 49
2.2.1 메타 러닝 작업의 정의 51
2.2.2 메타 강화 학습 작업의 정의 52
2.2.3 작업 분해 53
2.3 메타 러닝 학습 프레임워크 54
2.4 메타 러닝 방법의 분류 58
2.4.1 신경망 적응법 58
2.4.2 메트릭 기반 적응법 59
2.4.3 기본 러너 및 메타 러너 적응법 60
2.4.4 베이지안 메타 러닝 적응법 61
2.4.5 메타 러닝과 다양한 학습 프레임워크의 결합 63
2.5 메타 러닝 방법의 비교 65
2.6 참고문헌 68
3장. 메타 러닝 신경망 적응법
3.1 신경망 72
3.1.1 뉴런 73
3.1.2 가중치, 편향, 활성화 함수 74
3.1.3 역전파 알고리즘 76
3.1.4 학습률, 배치 크기, 운동량 및 가중치 감쇠 79
3.1.5 신경망 모델의 정규화 81
3.1.6 배치 정규화 83
3.1.7 드롭아웃 86
3.2 합성곱 신경망 87
3.2.1 합성곱 층 및 필터 87
3.2.2 풀링 층 및 다운샘플링 90
3.2.3 완전 연결 층 및 업샘플링 92
3.2.4 고전적인 합성곱 신경망 94
3.3 잔차 신경망 96
3.3.1 잔차 신경망 모듈 96
3.3.2 하이웨이 신경망 97
3.3.3 넓은 잔차 신경망 98
3.4 메타 러닝 신경망 모델 99
3.4.1 메타 러닝 신경망 모델 100
3.4.2 사전 학습된 심층 신경망의 적응 102
3.4.3 적응형 뉴런 설계 105
3.5 자동화된 머신 러닝 111
3.5.1 하이퍼파라미터 최적화 112
3.5.2 메타 러닝과 자동화된 머신러닝 114
3.5.3 자동화된 머신 러닝 가속 117
3.5.4 의사결정 자동화 머신러닝 123
3.5.5 점진적 자동화된 머신 러닝 127
3.6 결론 134
3.7 참고문헌 135
4장. 메트릭 기반 메타 러닝
4.1 메트릭 기반 학습 140
4.1.1 메트릭의 정의 141
4.1.2 메트릭 학습의 적용 143
4.1.3 지도 메트릭 학습 145
4.1.4 준지도 메트릭 학습 149
4.1.5 비지도 메트릭 학습 151
4.2 어텐션 메커니즘 152
4.3 메모리 모듈 153
4.4 스네일 알고리즘 160
4.5 관계 신경망 알고리즘 162
4.6 프로토타입피컬 신경망 알고리즘 166
4.7 TADAM 신경망 알고리즘 169
4.8 다이나믹 퓨샷 알고리즘 173
4.9 mAP 알고리즘 181
4.10 결론 188
4.11 참고문헌 189
5장. 기본 러너와 메타 러너의 결합을 통한 메타 러닝 방법
5.1 기본 러너 196
5.2 메타 러너 197
5.3 MAML 알고리즘 198
5.4 렙타일 알고리즘 207
5.5 순환 신경망 213
5.5.1 순환 신경망 기본 구조 214
5.5.2 양방향 순환 신경망 217
5.5.3 장단기 메모리 신경망 219
5.5.4 게이트 순환 유닛 모델 223
5.6 순환 신경망 메타 러닝 알고리즘 226
5.7 메타-장단기 메모리 알고리즘 229
5.8 R2D2 알고리즘 235
5.9 LR2D2 알고리즘 239
5.10 MetaOptNet 알고리즘 244
5.11 전이적 전파 신경망 알고리즘 249
5.12 잠재 임베딩 최적화 알고리즘 257
5.13 참고문헌 264
2012년 칭화대학교의 수자원 관리 및 수력 발전 공학과에서 공학학사 학위와 경제학 학사 학위를 취득했다. 2017년 미국 노스캐롤라이나주립대 통계학과에서 통계학 박사 학위를 취득했으며, 고차원 데이터와 인과 추론을 주로 연구했다. 2019년 칭화대학교 재무학과에서 박사후 과정을 마쳤으며, 연구방향은 공적자금 성과 평가이다. 그 후, Inspur(Beijing) Electronic Information Industry Co., Ltd.의 State Key Laboratory에서 연구원으로 근무하며 머신 러닝연구에 집중하고 있다.
2012년 칭화대학교의 수자원 관리 및 수력 발전 공학과에서 공학학사 학위와 경제학 학사 학위를 취득했다. 2017년 미국 노스캐롤라이나주립대 통계학과에서 통계학 박사 학위를 취득했으며, 고차원 데이터와 인과 추론을 주로 연구했다. 2019년 칭화대학교 재무학과에서 박사후 과정을 마쳤으며, 연구방향은 공적자금 성과 평가이다. 그 후, Inspur(Beijing) Electronic Information Industry Co., Ltd.의 State Key Laboratory에서 연구원으로 근무하며 머신 러닝연구에 집중하고 있다.