파이썬을 활용한 빅데이터 분석 개론

$31.40
SKU
9791186689547
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Fri 12/6 - Thu 12/12 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 12/3 - Thu 12/5 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2024/06/28
Pages/Weight/Size 190*240*30mm
ISBN 9791186689547
Categories IT 모바일 > OS/데이터베이스
Description
이 책은 빅데이터 분석의 입문자를 위한 개론서다. 개론서는 기본서로서 전공 분야의 전반적인 내용과 지식을 담고 있기에 전공 분야의 참고서적으로 활용된다. 그러나 4차 산업혁명의 특징인 융복합이라는 포괄적인 개념으로 전공 분야의 내용과 지식의 범위가 점차 확대되고, 그 경계가 모호해지는 경향이 있기에 이 책에 수록할 내용의 폭과 깊이에 대해 적잖은 고민을 할 수밖에 없었다. 빅데이터 분석을 포함하여 빅데이터를 분석하기에 앞서 요구되는 절차들과 분석 이후의 평가와 해석 등을 모두 다루기에는 내용이 너무 방대하므로 이 책의 목적은 빅데이터 분석의 기초로서 소개와 이해에 있으며 다양한 분석 방법을 나열하여 설명하기 보다는 어떤 데이터로 어떤 분석을 통해 어떤 결과를 얻어낼 수 있으며 그 결과물에 대한 기초적인 해석에 초점을 두고 있다. 이 책에서는 관련 서적에서 많이 활용되고 있고, 인터넷에서 쉽게 얻을 수 있는 데이터를 사용하였고, 이 데이터를 통해 탐색적 데이터 분석 과정을 설명하기 위하여 파이썬 언어를 사용하였다. 그리고 파이썬 언어를 이용한 빅데이터 분석의 예를 통계적 기법의 다변량 분석을 통해 알기 쉽게 설명하고자 하였다.

이 책의 앞부분에서는 프로그램 언어의 경험이 없더라도 빅데이터를 분석하기 위한 도구로서 쉽게 활용할 수 있는 파이썬 언어와 라이브러리들을 소개하였고, 파이썬 언어의 기본적인 사용 방법과 그래프의 작성과 표현, 데이터를 요약하는 방법들의 예를 소개하고, 프로그램과 결과를 통해 확인해 나갈 수 있도록 하였다. 책의 중간 부분은 분석에 앞서 데이터를 수집하는 방법들, 데이터를 분석에 맞게 수정하거나 편집하는 방법들, 그리고 탐색적 데이터 분석을 통해 데이터 자체에 내재된 특성을 파악하는 방법의 예를 설명하였고, 파이썬을 통해 경험해 볼 수 있도록 하였다. 그리고 마지막 부분에서는 다변량 분석을 중심으로 데이터 분석의 예와 더불어 파이썬 프로그램의 결과와 의미에 대해서 설명하였다. 앞서 설명하였듯이 이 책은 입문서이므로 복잡한 수학적 표현은 생략하고 대신 그림을 통하여 쉽게 설명하였고, 어떤 부분에 대해서는 분석 절차와 분석 결과를 축소하거나 생략하였다.
Contents
CHAPTER 01 빅데이터

1.1 빅데이터란?
1.2 빅데이터 처리와 분석
1.3 빅데이터 관련 직업 분류와 자격증
1.3.1 빅데이터 직업 분류
1.3.2 관련 자격증
1.4 빅데이터와 인공지능
1.5 개인정보보호와 정보 활용
1.5.1 개인정보보호법
1.5.2 개인정보의 유형
1.5.3 개인정보의 사례와 판례
1.5.4 개인정보의 수집과 이용
1.5.5 마이데이터
단원 정리
연습문제

CHAPTER 02 파이썬 언어

2.1 설치와 프로그램의 실행
2.1.1 파이썬 언어
2.1.2 설치와 실행
2.1.3 라이브러리
단원 정리 2.1
연습문제 2.1
2.2 기초 문법
2.2.1 print 함수와 연산자의 사용법
2.2.2 데이터의 입력과 변수
2.2.3 프로그램의 제어
2.2.4 특별한 기능을 처리하는 단위, 함수
단원 정리 2.2
연습문제 2.2
2.3 데이터 시각화와 요약
2.3.1 그래프를 통하여 데이터의 특성을 나타내는 방법들
단원 정리 2.3.1
연습문제 2.3.1
2.3.2 데이터의 특성을 숫자로 요약하는 방법들
단원 정리 2.3.2
연습문제 2.3.2

CHAPTER 03 데이터 수집

3.1 데이터 수집
3.2 공공데이터 가져오기
3.3 데이터 제공 사이트
단원 정리
연습문제

CHAPTER 04 데이터 다루기

4.1 데이터 구조인 리스트와 배열의 사용 방법
4.1.1 리스트(list)
4.1.2 배열
4.2 데이터 구조의 변환
4.3 데이터 파일 다루기
4.3.1 데이터 파일 불러오기
4.3.2 데이터 파일 생성하기
4.4 결측값 다루기
4.4.1 결측값 확인하기
4.4.2 값 대체하기
4.4.3 결측 사례 삭제하기
단원 정리
연습문제

CHAPTER 05 탐색적 데이터 분석과 시각화

5.1 타이타닉 데이터를 이용한 분석
5.1.1 변수와 값
5.1.2 탐색 내용
단원 정리 5.1
연습문제 5.1
5.2 텍스트 마이닝의 시각화
5.2.1 단어 구름
5.2.2 히트맵
5.2.3 네트워크 다이어그램
단원 정리 5.2
연습문제 5.2

CHAPTER 06 데이터 분석 모형

6.1 통계 기반 데이터 분석 모형
6.1.1 기술통계와 추론통계
6.1.2 추정과 가설검정
6.1.3 모수 검정과 비모수 검정
6.1.4 단변량, 다변량, 단순, 다중 분석
단원 정리 6.1
연습문제 6.1
6.2 데이터 마이닝 기반 데이터 분석 모형
단원 정리 6.2
연습문제 6.2
6.3 머신러닝 기반 분석 모형
단원 정리 6.2
연습문제 6.2

CHAPTER 07 분석 기법

7.1 상관분석과 회귀분석
7.1.1 상관분석
7.1.2 회귀분석
7.1.3 로지스틱 회귀
단원 정리 7.1
연습문제 7.1
7.2 다변량 분석
7.2.1 변수 간의 관계 분석
7.2.2 개체 간의 관계 분석
단원 정리 7.2
연습문제 7.2
참고문헌
Author
안기수
성균관대학교 경상대학 통계학과, 성균관대학교 대학원 통계학과 졸업(경제학 석사). 성균관대학교 대학원 통계학과 전산통계전공(경제학 박사).
현재 동남보건대 세무회계학과 교수.
성균관대학교 경상대학 통계학과, 성균관대학교 대학원 통계학과 졸업(경제학 석사). 성균관대학교 대학원 통계학과 전산통계전공(경제학 박사).
현재 동남보건대 세무회계학과 교수.