빅데이터 분석을 위한 데이터 마이닝

$31.75
SKU
9791186689561
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Mon 05/5 - Fri 05/9 (주문일로부 10-14 영업일)

Express Shipping estimated by Wed 04/30 - Fri 05/2 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2025/01/15
Pages/Weight/Size 190*240*30mm
ISBN 9791186689561
Categories 대학교재 > 경상계열
Description
『빅데이터 분석을 위한 데이터 마이닝』에서는 경영정보학 전공 학생뿐만 아니라 일반 경영학 전공 학생들과 기업/기관의 일반 분석 실무자들에게 어떻게 데이터 마이닝 기법이 빅데이터 분석을 위해 사용될 수 있는지 제반 지식을 전달하고자 한다. 빅데이터 분석을 수행하기 위해 필요한 기본적인 알고리즘에 대한 소개, 범용적인 데이터 마이닝 도구인 웨카 사용 방법을 주로 다룬다. 이 외에도 데이터 사이언티스트들도 활용할 수 있도록 R 프로그래밍과 파이썬 코드도 같이 소개한다.
Contents
CHAPTER 1 데이터 마이닝 개요

1. 데이터 마이닝의 의미
2. 데이터 마이닝과 비즈니스 인텔리전스
3. 데이터 마이닝의 활용 분야
4. 데이터 마이닝의 필요성
5. 데이터 마이닝 시스템의 구조
6. 데이터 마이닝 관련 용어 정리
7. 데이터 마이닝 기원
8. 데이터 마이닝: 다양한 학문의 합류점
9. OLAM 구조
10. 데이터 마이닝의 급속한 성장
11. 데이터 마이닝의 응용 분야
12. 왜 다양한 데이터 마이닝 기법들이 존재하는가?
13. 용어와 표기
· 연습문제

CHAPTER 2 데이터 기초 분석

1. 변수의 종류
1.1 수치형 변수와 범주형 변수
1.2 시계열 자료와 횡단면 자료
2. 자료의 측정
2.1 명목척도
2.2 서열척도
2.3 구간척도
2.4 비율척도
3. 자료의 정리
3.1 도수분포표
3.2 히스토그램
4. 산포도
4.1 산포도-시계열 그래프
5. 피벗테이블
· 연습문제

CHAPTER 3 데이터 마이닝 프로세스

1. 데이터 마이닝 기법
2. 지도학습과 자율학습
3. 데이터 마이닝 단계
4. 데이터 마이닝 사전 단계
5. 모형 구축: 선형 회귀분석을 이용한 예제
· 연습문제

CHAPTER 4 차원 축소

1. 차원 축소
2. 예제를 통한 고찰
3. 데이터의 요약
4. 상관관계 분석
5. 데이터 수의 축소-표본추출
6. 변수 수의 축소-주성분분석
· 연습문제

CHAPTER 5 분류 및 예측 성능의 평가

1. 개요
2. 분류모형 평가
2.1 분류모형 평가를 위한 측도
3. 예측모형의 성과평가
· 연습문제

CHAPTER 6 회귀 분석

1. 개요
2. 선형회귀분석
3. 선형회귀분석의 예측변수 선정
4. 로지스틱 회귀분석
5. 다중선형회귀분석
6. 분류 성과의 평가
7. 적합도 평가
· 연습문제

CHAPTER 7 k 최근접이웃기법

1. k 최근접이웃기법
2. K의 선택
3. k-최근접 기법 예측기
4. k 최근접이웃기법의 특성
· 연습문제

CHAPTER 8 나이브 베이즈 분류 모형

1. 개요
2. 베이즈 정리
3. 베이즈 정리를 사용한 분류
4. 단순 규칙
5. 나이브 베이즈 분류 모형
6. 나이브 베이지안 분류모형의 특성과 장단점
7. 나이브 베이지안 분류기의 예
· 연습문제

CHAPTER 9 분류와 회귀나무

1. 결정나무
2. 분류 과정(모델 구조)
3. 분류 과정 2(예측을 위한 모델의 사용)
4. 의사결정 트리 구축하기
5. 결정나무 알고리즘의 비교
6. 과적합 없애기
7. 악취 데이터 예제
8. 분류나무에 의한 분류 규칙
9. 모형의 장단점과 추가 고려사항
· 연습문제

CHAPTER 10 군집분석

1. 군집분석
2. 단순한 군집의 예
3. 군집분석 모형
4. 계층적 군집분석
4.1 두 레코드 간 거리 계산
4.2 두 군집 간 거리 계산
5. K-평균 알고리즘
5.1 k-means 군집화 장단점
6. EM 알고리즘
7. 악취데이터 예제
· 연습문제

CHAPTER 11 인공 신경망

1. Elementary Neurophysiology: Neuron
2. Hebbian Learning
3. 단층신경망
4. 다층신경망
5. 다층신경망 모형의 학습
6. 과적합 없애기
7. 신경망 모형의 장단점
· 연습문제

CHAPTER 12 연관성 규칙

1. 시장바구니 분석 개요
1.1 시장바구니 분석(연관성 규칙 발견)이란?
1.2 거래와 항목
1.3 연관성 규칙
2. 시장바구니 분석의 기본 개념
2.1 거래데이터
2.2 연관성 규칙 발견
3. 시장바구니 분석 지표
3.1 지지도와 신뢰도 1
3.2 지지도와 신뢰도 2
4. 연관성 규칙 기법의 기본 과정
4.1 1단계: 적절한 제품 수준에 따른 분석 항목 선정
4.2 2단계: 동시구매 행렬(co-occurrence matrix) 작성 및 확률 계산
4.3 3단계: 확률 분석과 유용한 연관성 규칙 결정
5. 시장바구니 분석 예제
6. 연관성 규칙의 장 단점
7. 어프라이어리 알고리즘(Apriori Algorithm)
8. 기타 연관성 규칙 기법
8.1 순차적 연관성 규칙 발견(Sequence Association Rules Discovery)
8.2 다수준 연관성 규칙(Multi-level Association Rules)
8.3 다수준 내 균일 지지도 사용 연관성 규칙
8.4 다수준 내 감소 지지도 사용 연관성 규칙
· 연습문제

CHAPTER 13 부록: 소프트웨어 소개 및 설치

1. WEKA 소프트웨어 설치 및 사용
1.1 R 소프트웨어
1.2 R-Studio 소프트웨어
2. COLAB 소프트웨어

찾아보기
Author
최상현
충북대학교 경영정보학과 교수
한국과학기술원(KAIST) 박사(경영정보공학)
LG CNS 엔트루컨설팅 책임컨설턴트; 국립경상대학교 산업시스템 공학부 부교수, 한국빅데이터서비스학회 부회장, 충북대학교 산업 경영연구소 소장, 충북대학교 경영정보학과 학과장; University of Arizona MIS 학과에서 박사 후 연수과정, University of Tennessee에서 Visiting Professorlar로 근무하였다.
ㆍ연구 분야: IEEE Transanctions on SMC, European Journal of Operational Research, Journal of the Operational Research Society, Decision Support Systems 등 국내외 저명 경영과학, 정보시스템, 데이터마이닝 관련 학술지 및 학술대회에 논문을 발표하였으며, 주요 관심 분야는 빅데이터 활용, 데이터/프로세스 마이닝 기법, 전략적 의사결정, 경영혁신 전략, 정보시스템 마스터플랜 등이 있다.
충북대학교 경영정보학과 교수
한국과학기술원(KAIST) 박사(경영정보공학)
LG CNS 엔트루컨설팅 책임컨설턴트; 국립경상대학교 산업시스템 공학부 부교수, 한국빅데이터서비스학회 부회장, 충북대학교 산업 경영연구소 소장, 충북대학교 경영정보학과 학과장; University of Arizona MIS 학과에서 박사 후 연수과정, University of Tennessee에서 Visiting Professorlar로 근무하였다.
ㆍ연구 분야: IEEE Transanctions on SMC, European Journal of Operational Research, Journal of the Operational Research Society, Decision Support Systems 등 국내외 저명 경영과학, 정보시스템, 데이터마이닝 관련 학술지 및 학술대회에 논문을 발표하였으며, 주요 관심 분야는 빅데이터 활용, 데이터/프로세스 마이닝 기법, 전략적 의사결정, 경영혁신 전략, 정보시스템 마스터플랜 등이 있다.