일래스틱서치 쿡북 4/e

효과적 데이터 검색과 분석을 위한 100가지 단계별 레시피
$60.38
SKU
9791161756783
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Fri 12/6 - Thu 12/12 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 12/3 - Thu 12/5 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2022/08/31
Pages/Weight/Size 188*235*40mm
ISBN 9791161756783
Categories IT 모바일 > OS/데이터베이스
Description
일래스틱서치는 루씬 기반의 분산 검색 서버로 사용자들이 페타바이트 규모의 비정형 데이터를 색인하고 검색할 수 있다. 이 책은 일래스틱서치의 기능과 복잡한 쿼리와 분석을 작성하고 실행할 수 있는 유용한 레시피를 제공한다. 이 책을 통해 일래스틱서치 노드를 배포하고 다른 도구들을 통합하며 다양한 시각화를 작성하는 일상적이고 비일상적인 작업을 수행 가능한 빠른 테크닉과 수많은 솔루션에 익숙해질 수 있다. 또한 자바, 스칼라, 파이썬과 아파치 스파크와 피그와 같은 빅데이터 애플리케이션과 일래스틱서치를 통합해 향상된 기능과 사용자 정의 플러그인으로 강화된 효율적인 데이터 애플리케이션을 생성할 수 있다. * 이 책은 오픈소스로 제공하는 마지막 버전 Elasticsearch 7.0으로 진행하고 있다.
Contents
1장. 시작하기
__기술적 요구 사항
__일래스틱서치 다운로드와 설치
__네트워크 설정
__노드 설정
__리눅스 시스템 설정
__서로 다른 노드 유형 설정
__코디네이터 노드 설정
__적재 노드 설정
__일래스틱서치 플러그인 설치
__플러그인 제거
__로그 설정 변경
__도커로 노드 설정
__일래스틱 클라우드 엔터프라이즈에 배포


2장. 매핑 관리
__명시적인 매핑 생성 사용
__기본 유형 매핑
__배열 매핑
__객체 매핑
__문서 매핑
__문서 매핑에 동적 템플릿 사용
__중첩된 객체 매핑
__조인 필드로 하위 문서 관리
__다중 매핑을 가진 필드 추가
__GeoPoint 필드 매핑
__GeoShape 필드 매핑
__IP 필드 매핑
__별칭 필드 매핑
__퍼콜레이터(여과) 필드 매핑
__피처 및 피처 벡터 필드 매핑
__매칭에 메타데이터 추가
__다른 분석기 지정
__완성 필드 매핑


3장. 기본 작업
__색인 생성
__색인 삭제
__색인 열기 또는 닫기
__색인에 매핑 집어넣기
__매핑 가져오기
__색인 재색인
__색인 새로 고침
__색인 청소
__색인 강제 병합
__색인 축소
__색인 존재 확인
__색인 설정 관리
__색인 별칭 사용
__색인 롤링
__문서 색인
__문서 가져오기
__문서 삭제
__문서 갱신
__단위 작업 속도 올리기(벌크 작업)
__GET 작업 속도 올리기(다중 GET)


4장. 검색 기능 탐색
__기술적 요구 사항
__검색 실행
__결과 정렬
__결과 강조
__스크롤 쿼리 실행
__search_after 기능 사용
__결과에서 내부 히트 결과 반환
__올바른 쿼리 추천
__일치된 결과 개수 계산
__쿼리 설명
__쿼리 프로파일링
__쿼리로 삭제
__쿼리로 갱신
__모든 문서 매칭
__불리언 쿼리 사용
__검색 템플릿 사용


5장. 텍스트와 숫자 쿼리
__용어 쿼리 사용
__다중 용어 쿼리 사용
__접두어 쿼리 사용
__와일드카드 쿼리 사용
__정규식 쿼리 사용
__span 쿼리 사용
__일치 쿼리 사용
__쿼리 문자열 쿼리 사용
__단순 쿼리 문자열 쿼리 사용
__범위 쿼리 실행
__공통 용어 쿼리
__ID 쿼리 사용
__함수 점수 쿼리 실행
__exists 쿼리 사용


6장. 관계 및 지리 정보 쿼리
__has_child 쿼리 사용
__has_parent 쿼리 사용
__중첩 쿼리 사용
__geo_bounding_box 쿼리 사용
__geo_polygon 쿼리 사용
__geo_distance 쿼리 사용


7장. 집계
____집계 실행
__참고 사항
__통계 집계 실행
__용어 집계 실행
__중요 용어 집계 실행
__범위 집계 실행
__히스토그램 집계 실행
__날짜 히스토그램 집계 실행
__필터 집계 실행
__다중 필터 집계 실행
__전역 집계 실행
__지리적 거리 집계 실행
__자식 집계 실행
__중첩 집계 실행
__최고 조회수 집계 실행
__행렬 통계 집계 실행
__지리적 경계 집계 실행
__지리적 중심지 집계 실행
__파이프라인 집계 실행


8장. 일래스틱서치 스크립팅
__페인리스 스크립트
__추가 스크립트 플러그인 설치
__스크립트 관리
__스크립트로 데이터 정렬
__스크립트로 결과 필드 계산
__스크립트로 검색 정렬
__집계에 스크립트 사용
__스크립트로 문서 갱신
__스크립트로 재색인


9장. 클러스터 관리
__API로 클러스터 정상 여부 제어
__API로 클러스터 상태 제어
__API로 클러스터 노드 정보 얻기
__API로 노드 통계 얻기
__작업 관리 API 사용
__핫 스레드 API 사용
__샤드 할당 관리
__세그먼트 API로 세그먼트 모니터링
__캐시 정리


10장. 데이터 백업과 복원
__저장소 관리
__스냅샷 실행
__스냅샷 복원
__백업을 위해 NFS 공유 설정
__원격 클러스터에서 재색인


11장. 사용자 인터페이스
__세레브로 설치와 사용
__일래스틱서치 HQ 설치와 사용
__키바나 설치
__키바나 검색 관리
__키바나로 데이터 시각화
__키바나 개발 도구 사용


12장. 객체 모듈 사용
__파이프라인 정의
__적재 파이프라인 배포
__적재 파이프라인 얻기
__적재 파이프라인 제거
__적재 파이프라인 시뮬레이션
__내장형 처리기
__Grok 처리기
__첨부 적재 플러그인 사용
__적재 GeoIP 플러그인 사용


13장. 자바 통합
__표준 자바 HTTP 클라이언트 작성
__HTTP 일래스틱서치 클라이언트 작성
__고수준 REST 클라이언트 작성
__색인 관리
__매핑 관리
__문서 관리
__대규모 작업 관리
__쿼리 생성
__표준 검색 실행
__집계 검색 수행
__스크롤 검색 실행
__DeepLearning4j로 통합


14장. 스칼라 통합
__스칼라로 클라이언트 생성
__색인 관리
__매핑 관리
__문서 관리
__표준 검색 실행
__집계 검색 실행기
__DeepLearning.scala로 통합


15장. 파이썬 통합
__클라이언트 생성
__색인 관리
__매핑을 포함한 매핑 관리
__문서 관리
__표준 검색 실행
__집계 검색 실행
__넘파이와 사이킷런으로 통합


16장. 플러그인 개발
__플러그인 작성
__분석기 플러그인 작성
__REST 플러그인 작성
__클러스터 작업 작성
__적재 플러그인 작성


17장. 빅데이터 통합
__아파치 스파크 설치
__아파치 스파크 활용 데이터 색인
__아파치 스파크 활용 메타데이터 포함 데이터 색인
__아파치 스파크로 데이터 읽기
__스파크 SQL로 데이터 읽기
__아파치 피그 활용 데이터 색인
__알파카로 일래스틱서치 사용
__몽고DB로 일래스틱서치 사용
Author
알베르토 파로,이준호
엔지니어, 프로젝트 관리자이자 소프트웨어 개발자다. 현재 이탈리아의 빅데이터 기술, 네이티브 클라우드, NoSQL 솔루션 기반인 NTTDATA에서 빅데이터 프랙티스 리더(Big Data Practice Leader)로 일하고 있다. 주로 클라우드, 빅데이터 처리, NoSQL, NLP, 신경망에 연관된 이머징 솔루션(emerging solutions)과 애플리케이션의 연구에 지대한 관심이 있다. 2000년에 폴리테크니코 디 밀라노(Politecnico di Milano)의 전산공학과를 졸업했다. 지식 관리 솔루션과 최첨단 빅데이터 소프트웨어를 사용하는 고급 데이터 마이닝 제품에 스칼라/자바와 파이썬을 사용해 일했다. 빅데이터 솔루션, NoSQL 데이터저장소, 연관 기술을 효과적으로 시용하는 방법을 가르치는 데 많은 시간을 할애했다. 『ElasticSearch Cookbook 2/e』(에이콘, 2016)의 저자며, 팩트출판사가 출판한 여러 서적의 기술 감수자를 맡았다.
엔지니어, 프로젝트 관리자이자 소프트웨어 개발자다. 현재 이탈리아의 빅데이터 기술, 네이티브 클라우드, NoSQL 솔루션 기반인 NTTDATA에서 빅데이터 프랙티스 리더(Big Data Practice Leader)로 일하고 있다. 주로 클라우드, 빅데이터 처리, NoSQL, NLP, 신경망에 연관된 이머징 솔루션(emerging solutions)과 애플리케이션의 연구에 지대한 관심이 있다. 2000년에 폴리테크니코 디 밀라노(Politecnico di Milano)의 전산공학과를 졸업했다. 지식 관리 솔루션과 최첨단 빅데이터 소프트웨어를 사용하는 고급 데이터 마이닝 제품에 스칼라/자바와 파이썬을 사용해 일했다. 빅데이터 솔루션, NoSQL 데이터저장소, 연관 기술을 효과적으로 시용하는 방법을 가르치는 데 많은 시간을 할애했다. 『ElasticSearch Cookbook 2/e』(에이콘, 2016)의 저자며, 팩트출판사가 출판한 여러 서적의 기술 감수자를 맡았다.