일래스틱 스택을 이용한 머신러닝 2/e

머신러닝 피처로 데이터에서 귀중한 인사이트를 얻자

리치 콜리어 , 카밀라 몬토넨 , 바할딘 아자미 , 최중연

에이콘출판사

$40.82

SKU

9791161756844

[Free shipping over $100]

Standard Shipping estimated by Fri 04/25 - Thu 05/1 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 04/22 - Thu 04/24 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.

Publication Date	2022/09/30
Pages/Weight/Size	18823528mm
ISBN	9791161756844
Categories	IT 모바일 > OS/데이터베이스

Skip to the end of the images gallery

Skip to the beginning of the images gallery

Description

ELK 스택으로 알려진 일래스틱 스택은 사용자가 검색 데이터를 효과적으로 수집, 처리, 분석하도록 도와주는 로그 분석 솔루션이다. 주요 상용 기능인 머신러닝이 추가된 일래스틱 스택은 이 분석 프로세스를 훨씬 더 효율적으로 만든다. 2판에서는 시계열 데이터 분석은 물론 분류, 회귀, 아웃라이어 탐지를 위한 일래스틱 스택의 머신러닝 기능에 대해 포괄적인 개요를 제공한다. 머신러닝 개념을 직관적으로 설명하고 있으며 로그 파일, 네트워크 흐름, 애플리케이션 메트릭, 재무 데이터와 같은 다양한 데이터 유형에 대해 시계열 분석을 수행한다. 또한 로깅, 보안 및 메트릭을 위해 일래스틱 스택 내에서 머신러닝을 배포한다. 마지막에는 데이터 프레임 분석이 머신러닝이 도움될 수 있는 완전히 새로운 사용 사례의 문을 어떻게 여는지 알게 될 것이다. 이 책이 끝날 즈음에는 머신러닝을 분산 검색과 데이터 분석 플랫폼에 통합하는 데 필요한 지식과 함께 머신러닝과 일래스틱 스택에 있어 실질적인 경험을 갖게 될 것이다.

Contents

1장. IT를 위한 머신러닝

__IT의 역사적 도전 과제 극복
__엄청나게 많은 데이터 처리
__자동화된 이상 탐지의 출현
__비지도 ML 대 지도 ML
__이상 탐지를 위한 비지도 ML 사용하기
____특이에 관해 정의하기
____정상 상태 학습하기
____확률 모델
____모델 학습하기
____디트랜드
____특이성에 대한 점수화
____시간 요소
__데이터 프레임 분석에 지도 ML 적용하기
____지도 학습 과정
__요약

2장. 활성화와 운영화

__기술 요구 사항
__일래스틱 ML 기능 활성화
____자체 관리형 클러스터에서 ML 활성화
____클라우드에서 ML 활성화 - 일래스틱서치 서비스
__운영화의 이해
____ML 노드
____작업
____시계열 분석에서 데이터 버킷팅
____일래스틱 ML에 데이터 공급
____제공하는 인덱스
______.ml-config
______.ml-state-*
______.ml-notification-*
______.ml-annoataions-*
______.ml-stats-*
______.ml-anomalies-*
____이상 탐지 오케스트레이션
____이상 탐지 모델 스냅숏
__요약

3장. 이상 탐지

__기술 요구 사항
__일래스틱 ML 작업 유형
__탐지기 해부
____함수
____필드
____partition 필드
____by 필드
____over 필드
____공식(formula)
__이벤트 비율의 변화 탐지
____카운트 함수 탐색
____다른 카운트 함수
______논제로 카운트
______디스팅트 카운트
__메트릭 값에서 변화 탐지
____메트릭 함수
______min, max, mean, median과 metric
______varp
______sum, not-null sum
__고급 탐지기 함수의 이해
____레어(rare)
____프리퀀시 레어(frequency rare)
____정보 내용(information content)
____지오그래픽(geographic)
____시간
__범주형 피처로 분석 분할
____분할 필드 설정
____partition과 by_field를 사용한 분할의 차이점
____이중 분할에 한계가 있을까?
__시간 분석과 모집단 분석의 이해
__비정형 메시지 범주화 분석
____범주화에 훌륭한 후보가 되는 메시지 유형
____범주화에 사용되는 프로세스
____범주 분석
____범주화 작업 예제
____범주화 사용을 피해야 하는 경우
__API를 통한 일래스틱 ML 관리
__요약

4장. 예측

__기술 요구 사항
__예언과 대비되는 예측
__예측 사용 사례
__작업의 예측 이론
__단일 시계열 예측
__예측 결과 검토
__다중 시계열 예측
__요약

5장. 결과 해석

__기술 요구 사항
__일래스틱 ML 결과 인덱스 보기
__이상 징후 점수
____버킷 수준 스코어링
____정규화
____인플루언서 수준 점수
____인플루언서
____레코드 수준 점수
__결과 인덱스 스키마의 세부 정보
____버킷 결과
____레코드 결과
____인플루언서 결과
__다중 버킷 이상 징후
____다중 버킷 이상 징후 예제
____다중 버킷 스코어링
__예측 결과
____예측 결과 쿼리
__결과 API
____결과 API 엔드포인트
____전체 버킷 조회 API
____범주 조회 API
__사용자 정의 대시보드와 캔버스 워크패드
____대시보드 “임베디블”
____TSVB에서 이상 징후 주석
____캔버스 워크패드 사용자 정의
__요약

6장. ML 분석에 기반한 얼러팅

__기술 요구 사항
__얼러팅 개념 이해
____모든 이상 징후가 얼럿일 필요는 없다
____실시간 얼러팅에는 타이밍이 중요하다
__ML UI에서 얼럿 작성
____샘플 이상 탐지 작업 정의
__샘플 작업에 대한 얼럿 생성
____실시간 이례적인 행위 시뮬레이션
____얼럿 수신과 검토
__와치(watch)로 얼럿 만들기
____레거시 기본 ML 와치의 구조 이해
______trigger 섹션
______input 섹션
______condition 섹션
______action 섹션
____사용자 정의 와치는 몇 가지 고유한 기능을 제공할 수 있다
______연결된 입력과 스크립트 내의 조건
______연결된 입력 간에 정보 전달
__요약

7장. AIOps와 근본 원인 분석

__기술 요구 사항
__AIOps 용어의 이해
__KPI의 중요성과 한계 이해
__KPI를 넘어서
__더 나은 분석을 위한 데이터 조직화
____이상 탐지 데이터피드에 대한 사용자 정의 쿼리
____수집 시 데이터 강화
__컨텍스트 정보 활용
____분석 분할
____통계적 인플루언서
__RCA를 위해 모든 것을 통합
____가동 중단 배경
____상관관계와 공유된 인플루언서
__요약

8장. 다른 일래스틱 스택 앱에서 이상 탐지

__기술 요구 사항
__일래스틱 APM의 이상 탐지
____APM에 대한 이상 탐지 활성화
____APM UI에서 이상 탐지 작업 결과 조회
____데이터 인식기를 통한 ML 작업 생성
__로그 앱의 이상 탐지
____로그 카테고리
____로그 이상 징후
____메트릭 앱의 이상 탐지
__업타임 앱의 이상 탐지
__일래스틱 시큐리티 앱의 이상 탐지
____사전 구축된 이상 탐지 작업
__탐지 얼럿으로서의 이상 탐지 작업
__요약

9장. 데이터 프레임 분석 소개

__기술 요구 사항
__변환하는 방법 학습
____왜 변환이 유용한가?
____변환 작업의 내부 구조
____전자 상거래 주문을 분석하기 위해 변환 사용
____더 고급 수준의 피벗과 집계 구성 탐색
____배치 변환과 연속 변환의 차이점 발견
____연속 변환을 사용해 소셜 미디어 피드 분석
__고급 변환 구성에 페인리스 사용
____페인리스 소개
____변수, 연산자, 제어 흐름
____함수
__파이썬과 일래스틱서치로 작업하기
____파이선 일래스틱서치 클라이언트에 대해 간략하게 둘러보기
____일런드의 개발 목적 이해
____일런드와 함께하는 첫걸음
__요약
__더 읽어보기

10장. 아웃라이어 탐지

__기술 요구 사항
__아웃라이어 탐지의 내부 작동 이해
____아웃라이어 탐지에 사용하는 4가지 기술 이해
______거리 기반 기술
______밀도 기반 기술
__피처 영향력 이해
______각 점에 대한 피처 영향력은 어떻게 계산하는가?
____아웃라이어 탐지는 이상 탐지와 어떻게 다른가?
______확률 모델 기반 대 인스턴스 기반
______점수화
______데이터 특성
______온라인 대 배치(batch)
__실제 아웃라이어 탐지 적용
__Evaluate API로 아웃라이어 탐지 평가
__아웃라이어 탐지를 위한 하이퍼파라미터 조정
__요약

11장. 분류 분석

__기술 요구 사항
__분류: 데이터에서 훈련된 모델로
____데이터에서 분류 모델 학습
____피처 엔지니어링
____모델 평가
__분류의 첫 걸음
__분류의 내부 구조: 그래디언트 부스트 의사결정 트리
____의사결정 트리 소개
____그래디언트 부스트 의사결정 트리
__하이퍼파라미터
__결과 해석
____분류 확률
____분류 점수
____피처 중요도
__요약
__더 읽어보기

12장. 회귀

__기술 요구 사항
__회귀 분석을 사용해 주택 가격 예측
__회귀를 위한 의사결정 트리 사용
__요약
__더 읽어보기

13장. 추론

__기술 요구 사항
__훈련된 모델 API 및 파이썬을 사용해 훈련된 머신러닝 모델을 검사하고 가져오며 내보내기
__훈련된 모델 API 살펴보기
____훈련된 모델 API와 파이썬을 사용해 훈련된 모델 내보내기와 가져오기
__추론 프로세서와 인제스트 파이프라인 이해하기
____인제스트 파이프라인에서 누락되거나 손상된 데이터 처리
____예측에 대한 더 많은 통찰력을 얻기 위한 추론 프로세서 구성 옵션 사용하기
__일런드를 사용해 외부 모델을 일래스틱서치로 가져오기
____일런드에서 지원하는 외부 모델에 대해 알아보기
____scikit-learn의 DecisionTreeClassifier로 훈련하고 일런드를 사용해 일래스틱서치로 가져오기
__요약

부록. 이상 탐지 팁
__기술 요구 사항
__분할 작업 대 비분할 작업의 인플루언서 이해하기
__단측함수를 유리하게 사용하기
__기간 무시하기
____예정된 (알려진) 시간 윈도 무시하기
______캘린더 이벤트 생성
______원하는 타임프레임을 무시하기 위해 데이터피드 중지 및 시작
____예기치 못한 시간 윈도를 사후에 무시하기
______작업의 복제와 과거 데이터의 재실행
______작업을 이전 모델 스냅숏으로 되돌리기
__사용자 정의 규칙과 필터 유리하게 사용하기
____사용자 정의 규칙 만들기
______“하향식” 얼러팅 철학에 대한 사용자 지정 규칙의 장점
__이상 탐지 작업 처리량에 관한 고려 사항
__사용 사례의 과도한 엔지니어링 방지하기
__런타임 필드에서 이상 탐지 사용하기
__요약

Author

리치 콜리어,카밀라 몬토넨,바할딘 아자미,최중연

일래스틱의 솔루션 아키텍트다. 프리러트(Prelert) 인수로 일래스틱 팀에 합류해 소프트웨어, 하드웨어, 서비스 기반 솔루션을 위한 솔루션 설계자 및 사전 판매 시스템 엔지니어로서 20년 이상의 경험을 가지고 있다. 빅데이터 분석, 머신러닝, 이상 탐지, 위협 탐지, 보안 운영, 애플리케이션 성능 관리, 웹 애플리케이션, 컨텍 센터 기술을 포함한다. 메사추세츠주 보스턴에 거주하고 있다.