4차 산업혁명의 핵심 기반은 데이터이며, 이러한 데이터들을 수집하고, 정제 및 분석을 하여 실무와 비즈니스에 활용을 하는 기업과 기관들이 늘어나기 시작하면서, 빅데이터 분석과 활용에 대한 관심이 높아지고 있는 실정이다. 이러한 상황에 발맞춰 대용량 데이터에서 유의미한 정보를 찾고, 분석하여 결과를 예측하는 역량을 가진 빅데이터 분석 전문 인력의 필요성은 더욱 증가하고 있다.
빅데이터 분석기사는 데이터 전문 인력의 높은 수요를 기반으로 전문 인력의 빅데이터 수집·저장·처리·분석·시각화와 관련된 실무적인 능력을 체계적으로 검증하기 위한 국가기술자격이다. 본 교재는 빅데이터 분석기사 시험을 대비하기 위해 7명의 공동 집필진이 빅데이터 분석기사 이론 출제 과목(빅데이터 분석 기획, 빅데이터 탐색, 빅데이터 모델링, 빅데이터 결과 해석) 기준에 맞게 수많은 빅데이터 관련 도서, 기출문제 분석과 관련 지식을 기반으로 집필하였다.
Contents
■ 저자소개
■ 머리말
■ 자격시험 안내
■ 이 책의 구성
PART 1 빅데이터 분석 기획
Chapter 01. 빅데이터의 이해
1. 빅데이터의 개요 및 활용
1) 빅데이터의 등장 배경
2) 빅데이터의 활용
3) 빅데이터의 개념
4) 빅데이터 특징
5) 빅데이터 가치
6) 빅데이터 사회·경제적 가치
7) 빅데이터 사회·경제적 의미
8) 빅데이터 가치 측정 이슈
9) 빅데이터 가치 산정 프레임워크
10) 데이터 산업의 이해
11) 빅데이터 조직 및 인력
2. 빅데이터 기술 및 제도
1) 빅데이터 플랫폼
2) 빅데이터와 인공지능
3) 개인정보 보호법·제도
4) 개인정보 활용
Chapter 02. 데이터 분석 계획
1. 분석 방안 수립
1) 분석 로드맵 설정
2) 빅데이터 구축 프로세스
3) 분석 문제 정의
4) 데이터 분석 방안
2. 분석 작업 계획
1) 데이터 확보 계획
2) 분석 절차 및 작업 계획
Chapter 03. 데이터 수집 및 저장 계획
1. 데이터 수집 및 전환
1) 데이터 수집 절차
2) 주요 수집 기술
3) 데이터 유형 및 속성 파악
4) 데이터 속성 파악
5) 데이터 변환 및 통합
6) 데이터 비식별화
7) 데이터 품질 검증
2. 데이터 적재와 저장
1) 데이터 적재
2) 데이터 저장
PART 2 빅데이터 탐색
Chapter 01. 데이터 전처리
1. 데이터 정제
1) 빅데이터 전·후처리
2) 데이터 정제 절차
3) 데이터 결측값(Missing values) 처리
4) 데이터 이상값 처리
2. 분석 변수 처리
1) 변수 선택
2) 차원 축소 기법(Dimensionality Reduction)
3) 파생(유도)변수 생성
4) 변수 변환
5) 불균형 데이터 처리
Chapter 02. 데이터 탐색
1. 데이터 탐색 기초
1) 데이터 탐색 개요
2) 상관관계 분석
3) 기초통계량
4) 시각화를 통한 탐색적 자료 분석
5) 다중공선성
2. 고급 데이터 탐색
1) 시공간 데이터 탐색
2) 다변량 데이터 탐색
3) 비정형 데이터 탐색
Chapter 03. 통계 기법의 이해
1. 기술통계
1) 데이터 요약
2) 표본추출
3) 확률분포
2. 추론통계
1) 추론통계
2) 점추정
3) 구간추정
4) 가설검정
PART 3 빅데이터 모델링
Chapter 01. 분석 모형 설계
1. 분석 절차 수립
1) 분석 모형 선정
2) 분석 모형 정의
3) 분석 모형 구축 절차
2. 분석 환경 구축
1) 분석 도구 선정
2) 데이터 분할
Chapter 02. 분석 기법 적용
1. 분석 기법
1) 회귀분석
2) 로지스틱 회귀분석(Logistic Regression)
3) 의사결정나무 분석
4) 인공신경망
5) 서포트 벡터 머신
6) 연관관계분석
7) 군집분석(Cluster Analytics)
2. 고급 분석 기법
1) 범주형 자료 분석
2) 다변량 분석
3) 시계열 분석
4) 딥러닝 분석
5) 비정형 데이터 분석
6) 소셜 네트워크 분석(social network analysis)
7) 앙상블 분석
8) 비모수 통계(non-parametric statistics)
PART 4 빅데이터 결과 해석
Chapter 01. 분석 모형 평가 및 개선
1. 분석 모형 평가
1) 평가 지표
2) 분석 모형 진단
3) 교차검증
4) 모수 유의성 검정
5) 적합도 검정
2. 분석 모형 개선
1) 과대적합 방지
2) 매개변수 최적화
3) 분석 모형 융합
4) 최종 모형 선정
Chapter 02. 분석 결과 해석 및 활용
1. 분석 결과 해석
1) 분석 모형 해석
2) 비즈니스 기여도 평가
2. 분석 결과 시각화
1) 시간 시각화
2) 공간 시각화
3) 관계 시각화
4) 비교 시각화
5) 인포그래픽
6) 분석 모형 해석
3. 분석 결과 활용
1) 분석 모형 전개
2) 분석 결과 활용 시나리오 개발
3) 분석 모형 모니터링
4) 분석 모형 리모델링
부록
▣ 실전모의고사 1회
▣ 실전모의고사 2회
▣ 실전모의고사 정답 및 해설
Author
김진화,김명석,박성택,박은미,오명륜,이성원,정재림,신지아
한국지능정보시스템학회 회장, 국제미래학회 미래경영예측 위원장, 데이터 사이언스 & 아트 포럼 회장, 한국빅데이터학회 부회장, 대한산업경영학회 편집위원장으로 활동했고, 현재는 서강대학교 경영학과(경영전문대학원) 교수이다.
한국지능정보시스템학회 회장, 국제미래학회 미래경영예측 위원장, 데이터 사이언스 & 아트 포럼 회장, 한국빅데이터학회 부회장, 대한산업경영학회 편집위원장으로 활동했고, 현재는 서강대학교 경영학과(경영전문대학원) 교수이다.