이 책은 복잡한 공식과 방대한 양에 압도되어 수학 공부를 포기하는 사람들을 위해 만들어졌다. AI 시스템 구축에 필수적인 통계학, 선형 대수학, 미적분학 등 기본 수학 개념을 쉽게 풀어내어, 이해하기 쉽게 설명한다. 어려운 정리나 증명, 코딩은 최소화하고, 각 개념이 AI 애플리케이션에 어떻게 적용되는지를 실제 사례를 통해 보여준다. 이를 통해 수학적 세부 사항보다는 수학 개념 간의 관계와 전체적인 그림을 그리는 데 집중할 수 있도록 한다.
또한, AI의 어떤 부분에서 어떤 수학이 왜 사용되는지를 명확하게 설명하며, 단순한 이론 나열을 넘어 실제 AI 시스템에서 수학이 어떻게 활용되는지를 구체적인 예시를 통해 알기 쉽게 설명한다. 머신러닝 알고리즘의 기본 원리, 신경망의 작동 방식, 자연어 처리의 수학적 기반 등 AI의 핵심 분야별로 관련 수학 개념을 소개하여 독자들이 AI의 작동 원리를 체계적으로 이해할 수 있도록 돕는다. AI에 관심 있는 학생이나 개발자, 연구자는 물론, AI 기술을 비즈니스에 적용하고자 하는 경영진도 이 책으로 통찰력을 얻을 수 있을 것이다.
Contents
Chapter 1 인공지능 수학을 왜 배워야 할까?
1.1 인공지능이란 무엇일까?
1.2 인공지능이 각광받는 이유는 무엇일까?
1.3 인공지능은 무엇을 할 수 있을까?
1.4 인공지능의 한계는 무엇일까?
1.5 인공지능 시스템이 실패하면 어떻게 될까?
1.6 인공지능은 어디로 향하고 있을까?
1.7 현재 인공지능 분야의 가장 큰 기여자는 누구일까?
1.8 수학이 인공지능에 기여한 점은 무엇일까?
Chapter 2 데이터, 데이터, 또 데이터
2.1 인공지능을 위한 데이터
2.2 실제 데이터와 시뮬레이션 데이터
2.3 수학 모델: 선형과 비선형
2.4 실제 데이터 예시
2.5 시뮬레이션 데이터 예시
2.6 수학 모델: 시뮬레이션과 인공지능
2.7 어디서 데이터를 얻는가?
2.8 데이터 분포, 확률, 통계에서 자주 등장하는 용어
2.9 연속 분포와 이산 분포
2.10 결합 확률 밀도 함수의 힘
2.11 균등 분포
2.12 정규 분포
2.13 자주 사용되는 분포들
2.14 분포의 다양한 의미
2.15 A/B 테스트
Chapter 3 데이터에 함수를 최적화시키는 방법
3.1 유용한 고전 머신러닝 모델들
3.2 수치적 방법과 분석적 방법
3.3 회귀: 숫자 값 예측
3.4 로지스틱 회귀: 이항 분류
3.5 소프트맥스 회귀: 다항 분류
3.6 신경망의 마지막 층에 모델 통합하기
3.7 유명한 머신러닝 방법과 앙상블 방법
3.8 분류 모델의 성능 평가
Chapter 4 신경망을 위한 최적화
4.1 대뇌 피질과 인공 신경망
4.2 훈련 함수: 완전 연결 신경망, 밀집 신경망, 순방향 신경망
4.3 손실 함수
4.4 최적화
4.5 정규화
4.6 머신러닝 모델의 하이퍼파라미터
4.7 연쇄 법칙과 역전파
4.8 입력 데이터 피처의 중요도 평가
Chapter 5 합성곱 신경망과 컴퓨터 비전
5.1 합성곱과 교차 상관관계
5.2 시스템 설계 관점에서의 합성곱
5.3 합성곱과 1차원 이산 신호
5.4 합성곱과 2차원 이산 신호
5.5 선형 대수 표기법
5.6 풀링
5.7 이미지 분류를 위한 합성곱 신경망
Chapter 6 특이값 분해: 이미지 처리, 자연어 처리, 소셜 미디어
6.1 행렬 분해
6.2 대각 행렬
6.3 공간상 선형 변환인 행렬
6.4 행렬 곱셈을 위한 세 가지 방법
6.5 큰 크림
6.6 특이값 분해의 구성 요소
6.7 특이값 분해 vs 고유값 분해
6.8 특이값 분해의 계산
6.9 유사 역행렬
6.10 이미지에 특이값 분해 적용하기
6.11 주성분 분석과 차원 축소
6.12 주성분 분석과 클러스터링
6.13 소셜 미디어에서의 응용
6.14 잠재 의미 분석
6.15 랜덤 특이값 분해
Chapter 7 자연어 처리와 금융 인공지능: 벡터화와 시계열 분석
7.1 자연어 처리 인공지능
7.2 자연어 데이터 준비하기
7.3 통계적 모델과 로그 함수
7.4 단어 수에 관한 지프의 법칙
7.5 자연어 문서의 다양한 벡터 표현
7.6 코사인 유사도
7.7 자연어 처리 애플리케이션
7.8 트랜스포머와 어텐션 모델
7.9 시계열 데이터를 위한 합성곱 신경망
7.10 시계열 데이터를 위한 순환 신경망
7.11 자연어 데이터 예제
7.12 금융 인공지능
Chapter 8 확률적 생성 모델
8.1 생성 모델은 어떤 경우에 유용한가?
8.2 생성 모델의 일반적인 수학
8.3 결정론적 사고에서 확률 이론적 사고로의 전환
8.4 최대 가능도 추정
8.5 명시적 밀도 모델과 암시적 밀도 모델
8.6 추적 가능한 명시적 밀도: 믿을 수 있는 가시적인 신경망
8.7 명시적 밀도 - 추적 가능: 변수 변환 및 비선형 독립 성분 분석
8.8 명시적 밀도 - 추적 불가능: 변분 오토인코더의 변분법을 통한 근사화
8.9 명시적 밀도 - 추적 불가능: 마르코프 체인을 통한 볼츠만 머신 근사
8.10 암시적 밀도 - 마르코프 체인: 확률적 생성 모델
8.11 암시적 밀도 - 적대적 생성 모델
8.12 예제: 머신러닝 및 생성 신경망을 활용한 고에너지 물리학
8.13 기타 생성 모델
8.14 생성 모델의 발전
8.15 확률 이론적 언어 모델링
Chapter 9 그래프 모델
9.1 그래프: 노드, 엣지, 피처
9.2 예제: 페이지 랭크 알고리즘
9.3 그래프를 사용한 역행렬 계산
9.4 케일리 그래프 그룹: 순수 대수학과 병렬 연산
9.5 그래프 내 메시지 전달
9.6 그래프의 무한한 활용
9.7 그래프에서의 랜덤 워크
9.8 노드 표현 학습
9.9 그래프 신경망의 응용
9.10 동적 그래프 모델
9.11 베이즈 네트워크
9.12 확률적 인과관계 모델링을 위한 그래프 다이어그램
9.13 그래프 이론의 간략한 역사
9.14 그래프 이론의 주요 고려 사항
9.15 그래프 알고리즘과 연산 측면
Chapter 10 운용 과학
10.1 공짜 점심은 없다
10.2 복잡도 분석과 빅오 표기법
10.3 최적화: 운용 과학의 핵심
10.4 최적화에 대한 고찰
10.5 네트워크상에서의 최적화
Author
할라 넬슨,안민재
제임스 매디슨 대학교의 수학과 부교수. 뉴욕 대학교의 쿠란트 수학연구소에서 박사 학위를 받고, 미시간 대학교에서 박사 후 연구 조교수로 일했다. 수학 모델링을 전문으로 하며 공공 부문의 긴급 및 인프라 서비스를 위한 자문을 맡고 있다. 복잡한 아이디어를 간단하고 실용적인 용어로 번역하는 것을 좋아한다. 설명하는 사람이 수학 개념을 제대로 이해하지 못했거나 지식을 과시하려는 것이 아니라면 수학 개념을 쉽게 이해할 수 있다고 생각한다.
제임스 매디슨 대학교의 수학과 부교수. 뉴욕 대학교의 쿠란트 수학연구소에서 박사 학위를 받고, 미시간 대학교에서 박사 후 연구 조교수로 일했다. 수학 모델링을 전문으로 하며 공공 부문의 긴급 및 인프라 서비스를 위한 자문을 맡고 있다. 복잡한 아이디어를 간단하고 실용적인 용어로 번역하는 것을 좋아한다. 설명하는 사람이 수학 개념을 제대로 이해하지 못했거나 지식을 과시하려는 것이 아니라면 수학 개념을 쉽게 이해할 수 있다고 생각한다.