LLM 서비스 설계와 최적화

비용은 낮추고 성능은 극대화하는 AI 서비스 구축과 운영 가이드
$36.29
SKU
9791169213646
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Fri 05/2 - Thu 05/8 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 04/29 - Thu 05/1 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2025/04/10
Pages/Weight/Size 183*235*12mm
ISBN 9791169213646
Categories IT 모바일 > 인공지능
Description
생성형 AI의 경쟁력을 높이는 LLM 최적화 전략

AI와 머신러닝의 발전으로 거대 언어 모델(LLM)에 대한 관심은 급증했지만, 높은 비용 때문에 수많은 기업이 도입을 주저하고 있다. 이 책은 적은 비용으로 LLM을 구축하고 배포하는 효율적인 접근법을 소개한다. 모델 선택, 프롬프트 엔지니어링, 파인튜닝, 배포의 각 단계에서 성능 저하를 최소화 하면서 비용을 효과적으로 최소화하는 방법을 만나 보자. 검색 시스템이나 AI 에이전트와 같은 생성형 AI 애플리케이션 구현에 필요한 실용적이고 기술적인 지식을 제공한다. 모델 양자화, 스케일링 등의 추론 최적화 기법과 인프라 비용 절감 방법을 탐구하여 생성형 AI 서비스의 경쟁력을 강화해 보자.
Contents
CHAPTER 1 LLM 기초

_1.1 생성형 AI 애플리케이션과 LLM
_1.2 생성형 AI 애플리케이션의 상용화를 위한 길
_1.3 비용 최적화의 중요성
_1.4 요약

CHAPTER 2 비용 최적화를 위한 튜닝 기법

_2.1 파인튜닝 및 커스터마이징
_2.2 파라미터 효율적 파인튜닝(PEFT)
_2.3 PEFT의 비용 및 성능에 대한 영향
_2.4 요약

CHAPTER 3 비용 최적화를 위한 추론 테크닉

_3.1 추론 테크닉 소개
_3.2 프롬프트 엔지니어링
_3.3 벡터 스토어를 이용한 캐싱
_3.4 긴 문서를 관리하는 체인
_3.5 텍스트 요약
_3.6 효율적인 추론을 위한 배칭 프롬프트
_3.7 모델 최적화 방법
_3.8 파라미터 효율적 파인튜닝(PEFT)
_3.9 비용 및 성능 영향
_3.10 요약

CHAPTER 4 모델 선택과 대안

_4.1 모델 선택의 중요성
_4.2 효율적인 소형 모델
_4.3 성공적인 소형 모델 사례
_4.4 도메인 특화 모델
_4.5 범용 모델을 활용한 프롬프트의 성능
_4.6 요약

CHAPTER 5 인프라 및 배포 튜닝 전략

_5.1 튜닝 전략
_5.2 하드웨어 활용 및 배치 튜닝
_5.3 추론 가속화 도구
_5.4 모니터링과 옵저버빌리티
_5.5 요약

CHAPTER 6 성공적인 생성형 AI 도입의 열쇠

_6.1 성능과 비용의 균형
_6.2 생성형 AI 애플리케이션의 미래 트렌드
_6.3 요약
Author
슈레야스 수브라마니암,김현준,박은주
AWS의 수석 데이터 과학자이다. 아마존 내부 팀과 대기업 고객을 대상으로 생성형 AI 애플리케이션의 대규모 구축, 튜닝 및 배포의 컨설팅을 맡고 있다. 기초 모델을 위한 고급 훈련, 튜닝 및 배포 기술의 최첨단 연구 개발을 담당하며, 머신러닝 중심의 비용 최적화 워크숍을 운영하여 클라우드에서 인공지능 애플리케이션의 비용을 절감하는 법을 컨설팅한다.
AWS의 수석 데이터 과학자이다. 아마존 내부 팀과 대기업 고객을 대상으로 생성형 AI 애플리케이션의 대규모 구축, 튜닝 및 배포의 컨설팅을 맡고 있다. 기초 모델을 위한 고급 훈련, 튜닝 및 배포 기술의 최첨단 연구 개발을 담당하며, 머신러닝 중심의 비용 최적화 워크숍을 운영하여 클라우드에서 인공지능 애플리케이션의 비용을 절감하는 법을 컨설팅한다.