견고한 데이터 엔지니어링

데이터 파이프라인 설계와 구축의 핵심 원칙
$45.89
SKU
9791169211222
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Thu 12/5 - Wed 12/11 (주문일로부 10-14 영업일)

Express Shipping estimated by Mon 12/2 - Wed 12/4 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2023/06/26
Pages/Weight/Size 183*235*35mm
ISBN 9791169211222
Categories IT 모바일 > OS/데이터베이스
Description
실용적인 데이터 엔지니어링의 세계로 이끄는 최고의 안내서!
고객 요구 사항에 맞는 시스템을 계획하고 구축하는 방법


데이터 엔지니어링 분야가 빠르게 성장하면서 많은 소프트웨어 엔지니어와 데이터 과학자, 분석가가 해당 분야에 대한 포괄적인 관점을 새롭게 모색하고 있다. 이 실용적인 책은 데이터 엔지니어링 수명 주기의 프레임워크를 소개하고 사용 가능한 최고의 기술을 평가한다. 또한 다양한 클라우드 기술을 결합함으로써 다운스트림 데이터를 소비하는 조직과 고객의 요구 사항에 따라 시스템을 계획하고 구축하는 구체적인 방법을 알려준다. 이 책을 다 읽고 나면 기본 기술과 관계없이 모든 데이터 환경에 중요한 데이터 생성, 수집, 오케스트레이션, 변환, 저장 및 거버넌스의 개념을 적용하는 방법을 이해할 수 있다.
Contents
[PART I 데이터 엔지니어링 기반 구축하기]

CHAPTER 1 데이터 엔지니어링 상세
_1.1 데이터 엔지니어링이란?
_1.2 데이터 엔지니어링 기술과 활동
_1.3 조직 내 데이터 엔지니어
_1.4 결론
_1.5 참고 문헌

CHAPTER 2 데이터 엔지니어링 수명 주기
_2.1 데이터 엔지니어링 수명 주기란?
_2.2 데이터 엔지니어링 수명 주기의 드러나지 않는 주요 요소
_2.3 결론
_2.4 참고 문헌

CHAPTER 3 우수한 데이터 아키텍처 설계
_3.1 데이터 아키텍처란?
_3.2 우수한 데이터 아키텍처의 원칙
_3.3 주요 아키텍처 개념
_3.4 데이터 아키텍처의 사례 및 유형
_3.5 데이터 아키텍처 설계 담당자는 누구인가?
_3.6 결론
_3.7 참고 문헌

CHAPTER 4 데이터 엔지니어링 수명 주기 전체에 걸친 기술 선택
_4.1 팀의 규모와 능력
_4.2 시장 출시 속도
_4.3 상호 운용성
_4.4 비용 최적화 및 비즈니스 가치
_4.5 현재 vs 미래: 불변의 기술과 일시적 기술 비교
_4.6 장소: 온프레미스, 클라우드, 하이브리드 클라우드, 멀티클라우드
_4.7 구축과 구매 비교
_4.8 모놀리식과 모듈식 비교
_4.9 서버리스와 서버 비교
_4.10 최적화, 성능, 벤치마크 전쟁
_4.11 데이터 엔지니어링 수명 주기의 드러나지 않는 요소
_4.12 결론
_4.13 참고 문헌

[PART II 데이터 엔지니어링 수명 주기 심층 분석]

CHAPTER 5 1단계: 원천 시스템에서의 데이터 생성
_5.1 데이터 원천: 데이터는 어떻게 생성될까?
_5.2 원천 시스템: 주요 아이디어
_5.3 원천 시스템의 실질적인 세부 사항
_5.4 함께 작업할 대상
_5.5 드러나지 않는 요소가 원천 시스템에 미치는 영향
_5.6 결론
_5.7 참고 문헌

CHAPTER 6 2단계: 데이터 저장
_6.1 데이터 스토리지의 기본 구성 요소
_6.2 데이터 스토리지 시스템
_6.3 데이터 엔지니어링 스토리지 개요
_6.4 스토리지의 주요 아이디어와 동향
_6.5 함께 작업할 대상
_6.6 드러나지 않는 요소
_6.7 결론
_6.8 참고 문헌

CHAPTER 7 3단계: 데이터 수집
_7.1 데이터 수집이란?
_7.2 수집 단계의 주요 엔지니어링 고려 사항
_7.3 배치 수집 고려 사항
_7.4 메시지 및 스트림 수집에 관한 고려 사항
_7.5 데이터 수집 방법
_7.6 함께 일할 담당자
_7.7 드러나지 않는 요소
_7.8 결론
_7.9 참고 문헌

CHAPTER 8 4단계: 쿼리 모델링 및 데이터 변환
_8.1 쿼리
_8.2 데이터 모델링
_8.3 변환
_8.4 함께 일할 담당자
_8.5 드러나지 않는 요소
_8.6 결론
_8.7 참고 문헌

CHAPTER 9 5단계: 분석, 머신러닝 및 역 ETL을 위한 데이터 서빙
_9.1 데이터 서빙의 일반적인 고려 사항
_9.2 분석
_9.3 머신러닝
_9.4 데이터 엔지니어가 ML에 관해 알아야 할 사항
_9.5 분석 및 ML을 위한 데이터 서빙 방법
_9.6 역 ETL
_9.7 함께 작업하는 사람
_9.8 드러나지 않는 요소
_9.9 결론
_9.10 참고 문헌

[PART III 보안, 개인정보보호 및 데이터 엔지니어링의 미래]

CHAPTER 10 보안과 개인정보보호
_10.1 사람
_10.2 프로세스
_10.3 기술
_10.4 결론
_10.5 참고 문헌

CHAPTER 11 데이터 엔지니어링의 미래
_11.1 사라지지 않는 데이터 엔지니어링 수명 주기
_11.2 복잡성의 감소와 사용하기 쉬운 데이터 도구의 부상
_11.3 클라우드 규모의 데이터 OS와 향상된 상호 운용성
_11.4 ‘엔터프라이즈’ 데이터 엔지니어링
_11.5 직책과 책임의 변화
_11.6 모던 데이터 스택을 넘어 라이브 데이터 스택으로
_11.7 결론

APPENDIX A 직렬화와 압축 기술 상세
APPENDIX B 클라우드 네트워킹

에필로그
찾아보기
Author
조 라이스,맷 하우슬리,김인범
데이터 업계에 20년 동안 몸담은 비즈니스 마인드의 데이터 괴짜. 통계 모델링, 예측, 머신러닝, 데이터 엔지니어링, 데이터 아키텍처 등 다양한 업무를 담당했다. 미국 유타주 솔트레이크시티에 위치한 데이터 엔지니어링 및 아키텍처 컨설팅 업체인 터너리 데이터(Ternary Data)의 CEO이자 공동 설립자다. 현재 여러 기술 그룹에서 자원봉사를 하고 있으며 유타 대학교에서 강의도 한다. 여가 시간에는 암벽 등반, 전자 음악 제작 등을 즐기며, 아이들과 함께 멋진 모험을 떠나는 것을 좋아한다.
데이터 업계에 20년 동안 몸담은 비즈니스 마인드의 데이터 괴짜. 통계 모델링, 예측, 머신러닝, 데이터 엔지니어링, 데이터 아키텍처 등 다양한 업무를 담당했다. 미국 유타주 솔트레이크시티에 위치한 데이터 엔지니어링 및 아키텍처 컨설팅 업체인 터너리 데이터(Ternary Data)의 CEO이자 공동 설립자다. 현재 여러 기술 그룹에서 자원봉사를 하고 있으며 유타 대학교에서 강의도 한다. 여가 시간에는 암벽 등반, 전자 음악 제작 등을 즐기며, 아이들과 함께 멋진 모험을 떠나는 것을 좋아한다.