벡터 데이터베이스 설계와 구축

Vector DBMS & RAG
$19.22
SKU
9791193747049
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Wed 03/12 - Tue 03/18 (주문일로부 10-14 영업일)

Express Shipping estimated by Fri 03/7 - Tue 03/11 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2025/03/01
Pages/Weight/Size 152*225*20mm
ISBN 9791193747049
Categories IT 모바일 > OS/데이터베이스
Description
최근 팔란티어와 같은 AI 소프트웨어 기업들이 국방 및 의료 분야에서 두각을 나타내고 있으며, 그 핵심에는 데이터 기반 설계와 고도화된 분석기법이 자리하고 있다. AI 시스템의 성능을 극대화하려면 비정형 데이터를 구조적으로 정의하고 효율적으로 활용하는 것이 필수적이며, 이를 뒷받침하는 핵심 기술로는 Vector DB, 지식그래프 모델링, 온톨로지 등이 있다. 특히, 비정형 데이터에서 의미적 유사도를 빠르게 검색할 수 있는 Vector DB와 관계 중심 탐색이 가능한 Graph DB는 AI 구현에 필수적인 요소이다. 우리나라가 AI 선진국과 경쟁하기 위해서는 AI 개발 역량을 넘어 데이터를 구조화하고 분석하는 능력을 키우는 것이 중요하며, 이 책은 Vector DB, Graph DB의 개념부터 실전 적용까지 데이터 중심의 AI 설계 핵심 가이드를 제공한다.
Contents
Chapter 1. Vector DataBase 개요

__1.1 The Rising Star of AI
__1.2 Vector에 대한 이해

Chapter 2. Vector DBMS 종류 및 선택 기준

__2.1 Vector DBMS 특징
__2.2 Vector DBMS 종류 및 선택 시 고려사항
__2.3 Vector DBMS 종류별 특징 비교

Chapter 3. 생성형 AI 프로젝트 설계 방법론

__3.1 생성형 AI 프로젝트 수행 작업 절차
__3.2 데이터 분석 준비 및 설계 절차

Chapter 4. 데이터 분석 및 준비

__4.1 데이터 범위/유형 분석
__4.2 데이터 요건 분석
__4.3 데이터 피처 분석
__4.4 데이터셋 확보

Chapter 5. Vector DataBase Schema 설계

__5.1 Vector DB Schema 설계
__5.2 Collection Design
__5.3 Vector Design
__5.4 Meta Data Design
__5.5 Relationship Design

Chapter 6. 데이터 검색/응답 정합성 검증(Retrieval/Response)

__6.1 데이터 평가 및 검증

Chapter 7. RAG 개요 및 성능 개선

__7.1 RAG 개요
__7.2 RAG 아키텍처
__7.3 RAG 한계
__7.4 RAG 개선(Advanced RAG, Modular RAG, Graph RAG)

Chapter 8. Advanced RAG

__8.1 Advanced RAG 개요
__8.2 원천 데이터의 정비
__8.3 Retrieval 전략의 조정
__8.4 Search 전략 조정
__8.5 Collection 분리/분산

Chapter 9. Modular RAG

__9.1 Modular RAG 개요
__9.2 독립 모듈화
__9.3 다양한 FLOW 패턴
__9.4 참조 - Modular RAG 외부 논문

Chapter 10. Graph RAG - 지식 기반 RAG

__10.1 Graph RAG 개요
__10.2 Graph DB 모델링-데이터 모델링 기본 구조
__10.3 Graph DB 모델링-데이터의 분리(Divide) 깊이
__10.4 Graph DB 모델링-데이터 모델링 절차
__10.5 Graph DB 모델링-데이터 검색
__10.6 온톨로지
__10.7 Graph RAG에서 지식그래프 활용(Graph DB + 온톨로지)
__10.8 Graph RAG의 비즈니스 적용 사례(국방, 의료, 법률)
__10.9 Neo4j DB

Chapter 11. 프로그램 따라해 보기

__11.1 Chroma DB - Vector DB
____11.1.1 Chroma DB 설치
____11.1.2 프로그램 따라하기 with Python- Chroma Embedding 데이터 저장
____11.1.3 프로그램 따라하기 with Python- Response 정보 openAI로 생성하기
____11.1.4 프로그램 따라하기 with Python - Chunking
____11.1.5 프로그램 따라하기 with Python - 샘플 프로그램
__11.2 Neo4j DB - Graph DB
____11.2.1 Neo4j DB 설치
____11.2.2 프로그램 따라하기 with Python- Neo4j Embedding 데이터 저장
____11.2.3 프로그램 따라하기 with Python-Haluciation(환각) 개선 with Neo4j
__11.3 Neo4J DB-알고리즘 활용(커뮤니티 생성)
____11.3.1 Neo4J Plug-In 설치
____11.3.2 프로그램 따라하기 with Python-그래프 모델 생성(인터넷 뉴스 데이터)
____11.3.3 프로그램 따라하기 with 알고리즘 - 커뮤니티 생성(인터넷 뉴스 데이터)
__11.4 FAISS - Library
____11.4.1 FAISS 설치
____11.4.2 프로그램 따라하기 with Python - FAISS Embedding 저장 및 검색
__11.5 CHAT 시스템 - RAG 환경
____11.5.1 Streamlit
____11.5.2 프로그램 따라하기 with Python- 간단한 CHAT 프로그램
Author
송한림
데이터와 AI의 융합을 선도하는 데이터 아키텍처 및 AI 전문가로, 20여 년간 금융, 유통, 공공 등 다양한 산업에서 데이터 기반 프로젝트를 성공적으로 수행하였습니다. 은행, 보험, 카드, 캐피탈, 증권 등 금융권 프로젝트부터 홈쇼핑과 e-Commerce 같은 유통 분야, 국방, 경찰, 검찰, 인천공항 등 공공 프로젝트까지 폭넓은 실무 경험을 쌓아 왔으며, AI 분야에서도 역량을 보유한 저자는 대기업에서 AI와 데이터 아키텍처 관련 강사로도 활발히 활동하고 있습니다. 저자는 ‘대한민국 DA 공모대전’ 입상경력과 DAP(Data Architecture Professional) 자격을 통해 데이터 관리 분야에서 인정받고 있으며, 이를 기반으로 AI와 데이터 융합 기술의 잠재력을 널리 알리는 데 힘쓰고 있습니다.
데이터와 AI의 융합을 선도하는 데이터 아키텍처 및 AI 전문가로, 20여 년간 금융, 유통, 공공 등 다양한 산업에서 데이터 기반 프로젝트를 성공적으로 수행하였습니다. 은행, 보험, 카드, 캐피탈, 증권 등 금융권 프로젝트부터 홈쇼핑과 e-Commerce 같은 유통 분야, 국방, 경찰, 검찰, 인천공항 등 공공 프로젝트까지 폭넓은 실무 경험을 쌓아 왔으며, AI 분야에서도 역량을 보유한 저자는 대기업에서 AI와 데이터 아키텍처 관련 강사로도 활발히 활동하고 있습니다. 저자는 ‘대한민국 DA 공모대전’ 입상경력과 DAP(Data Architecture Professional) 자격을 통해 데이터 관리 분야에서 인정받고 있으며, 이를 기반으로 AI와 데이터 융합 기술의 잠재력을 널리 알리는 데 힘쓰고 있습니다.