데이터 분석을 위한 전처리와 시각화 with 파이썬

$35.02
SKU
9791140704286
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Fri 12/6 - Thu 12/12 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 12/3 - Thu 12/5 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2023/05/01
Pages/Weight/Size 183*235*35mm
ISBN 9791140704286
Categories 대학교재 > 공학계열
Description
다양한 데이터 분석 활용 방법과
파이썬 예제를 이용한 데이터 처리와 분석 노하우!


『데이터 분석을 위한 전처리와 시각화 with 파이썬』은 데이터 분석에 대한 이론적인 내용과 실제 적용 사례를 함께 다루고 있어서 누구나 쉽게 데이터 분석을 이해하고 활용할 수 있도록 구성되었다. 다양한 분야에서 데이터 분석을 활용하는 방법과 더 나은 의사 결정을 위한 데이터 분석 기술도 함께 소개하며, 독자들이 깊이 있는 데이터 분석을 학습할 수 있다. 특히, 데이터 분석을 위한 파이썬 핵심 라이브러리 넘파이와 판다스를 이용하여 데이터 처리 과정을 익히고, 맷플롯립 시각화 라이브러리를 통해서 시각화의 필요성 및 데이터를 다양하게 시각화하는 방법을 배울 수 있다.
Contents
〈첫째 마당〉 데이터 분석 개요

1장 | 데이터 분석 개요
1-1 데이터 분석 이해
데이터 분석 정의
데이터 분석 필요성
1-2 데이터 분석 활용 분야
국외 활용 사례
국내 활용 사례
1-3 데이터 분석 도구
데이터 분석 도구 종류
데이터 분석 도구로써의 파이썬
1-4 데이터 분석 처리 과정
문제 해결의 목적 정의
데이터 수집
데이터 전처리와 정형화
데이터 탐색과 분석
활용을 위한 공유 및 평가


〈둘째 마당〉 파이썬 기초

2장 | 데이터 분석을 위한 실습 환경
2-1 파이썬 IDLE
파이썬 IDLE 기본 사용법
2-2 주피터 노트북
주피터 노트북 기본 사용법
2-3 구글 코랩
구글 코랩 기본 사용법

3장 | 데이터 분석을 위한 파이썬 핵심 문법
3-1 변수
변수의 개념
변수의 특징
변수를 사용하는 이유
변수 생성 및 규칙
다양한 타입의 변수
3-2 연산자
산술 연산자
대입 연산자
비교 연산자
논리 연산자
문자열 연산자
3-3 표준 입력과 출력
표준 입력
표준 출력
3-4 컬렉션 자료형
컬렉션 자료형 개념과 필요성
리스트 자료형
튜플 자료형
딕셔너리 자료형
세트(set) 자료형
3-5 리스트 내포
리스트 내포 처리 과정
3-6 선택문
파이썬 선택문 개요
if/if~else 문
if~elif/if~elif~else 문
3-7 반복문과 기타 제어문
파이썬 반복문 개요
for 문
while 문
기타 제어문
중첩 반복문
3-8 함수
함수란?
사용자 정의 함수
람다 함수
3-9 파일 입·출력
파일 입·출력 기본
세션 저장소에 업로드
텍스트 파일 읽고 쓰기
파일 오류 처리
엑셀 파일 읽고 쓰기


〈셋째 마당〉 데이터 분석 라이브러리

4장 | 수치 연산이 쉬운 넘파이
4-1 넘파이 배열의 개념 및 특징
4-2 넘파이 배열 생성
리스트로 배열 생성하기
배열 생성 및 초기화
생성한 값으로 배열 생성
난수 기반으로 배열 생성하기
4-3 넘파이 배열 조회
넘파이 표준 데이터 타입
넘파이 배열 속성 정보
배열의 인덱싱
배열의 슬라이싱
논리 인덱싱
4-4 배열의 연산
배열의 일반 연산
브로드캐스팅 연산
백터 연산
4-5 배열 변환
전치
배열 형태 변경
배열 요소 추가 및 삭제
배열 결합
배열 분리

5장 | 데이터 처리가 쉬운 판다스
5-1 판다스 개념 및 특징
5-2 판다스 객체 생성
Series와 DataFrame
Series 만들기
DataFrame 만들기
csv 활용하기
5-3 판다스 데이터 확인하기
5-4 판다스 데이터 선택하기
5-5 판다스 결측데이터 처리하기
5-6 판다스 데이터 가공하기
5-7 판다스 데이터 그룹핑하기

6장 | 판다스 활용
6-1 붓꽃 데이터 분석하기
데이터 읽어 와서 확인하기
데이터 전처리
데이터 그룹핑하기
판다스의 데이터 시각화
6-2 타이타닉 데이터 분석하기
데이터 읽어와서 확인하기
데이터 전처리
데이터 그룹핑하기
판다스의 데이터 시각화

7장 | 시각화 라이브러리
데이터 시각화 장점
7-1 데이터 시각화 이해
데이터 시각화 활용 사례
파이썬으로 하는 데이터 시각화
시각화 옵션
7-2 맷플롯립 라이브러리
선 그래프
막대 그래프
산점도 그래프
히스토그램 그래프
상자수염 그래프
7-3 시본 라이브러리
데이터 시각화 준비하기
시본 막대 그래프
시본 산점도 그래프
시본 히스토그램
시본 상자수염 그래프
카운트 플롯 그래프
바이올린 플롯 그래프
시본 히트맵 그래프
다중 플롯 그리드 그래프


〈넷째 마당〉 데이터 분석 미니 프로젝트

8장 | 환경 관련 데이터 분석하기
8-1 분석 대상 데이터 수집
에어코리아 사이트에서 미세먼지 데이터 수집
기상청 사이트에서 날씨 데이터 수집
구글 코랩에 업로드하기
8-2 데이터 확인하기
미세먼지 데이터
날씨 데이터
8-3 데이터 병합하기
8-4 데이터 분석 및 시각화
데이터 분석
데이터 시각화

9장 | 행복지수 데이터 분석하기
9-1 분석 대상 데이터 수집
대한민국 행복지도 사이트에서 수집
세션 저장소에 업로드
9-2 데이터 가공
데이터 읽어와서 확인하기
데이터 병합하기
데이터 검산하기
9-3 데이터 분석 및 시각화
데이터 분석
한글 폰트 설정
선 그래프로 시각화
막대 그래프로 시각화
히트맵 그래프로 시각화

10장 | 병원 노쇼 환자 데이터 분석하기
10-1 데이터 전처리의 이해
데이터 전처리가 필요한 이유
데이터 전처리 방법
10-2 병원 노쇼 환자 데이터 분석 실습 (1)
문제 정의와 변수 설명
데이터 읽기와 확인
결측치 확인하기
통계량을 이용하여 이상치 제거하기
데이터 타입 변환
새로운 변수 추가
값 확인하여 이상치 제거하기
목적에 적합한 변수 추출
노쇼의 특징 파악 정리
10-3 병원 노쇼 환자 데이터 분석 실습 (2)

11장 | 주식 시세 예측 분석하기
11-1 시계열 데이터의 이해
시계열 데이터 패턴
시계열 데이터 분석의 이해
시계열 데이터 전처리 방법
11-2 시계열 데이터 전처리 실습
문제 정의와 변수 설명
주식 관련 라이브러리 설치하기
애플 주식 데이터 가져오기
주식 가격 시각화하기
시계열 데이터 전처리 및 데이터 확인
11-3 시계열 데이터 예측 분석
ARIMA 모델 만들기
모델을 이용하여 예측하기
예측 결과 시각화하기

12장 | 영화 리뷰 시각화하기
12-1 자연어
단어 토큰화
토큰화 실습
12-2 워드클라우드
라이브러리 설치하기
한글 글꼴 설치
텍스트 가져와서 품사 태깅하기
동일한 단어의 빈도수 구하기
워드클라우드 생성
맷플롯립으로 시각화하기
12-3 자연어 처리 실습 (1)
영화 리뷰 자연어 처리 (1)
12-4 자연어 처리 실습 (2)
영화 리뷰 자연어 처리 (2)

13장 | 대학생 정신 건강 데이터 분석하기
13-1 문제 정의와 데이터 살펴보기
데이터 읽기와 필요한 라이브러리 불러오기
13-2 데이터 전처리
속성 탐색과 전처리
데이터 시각화
상관 관계 분석하기
Author
오경선,양숙희,장은실
성균관대학교에서 컴퓨터교육전공 박사 학위를 취득하였으며, 2017~2019년에 단국대학교 SW중심사업단 강의전담 조교수를 거쳐 2019년부터 현재까지 건국대학교 상허교양대학 조교수로 재직 중이다. 『컴퓨팅 사고』, 『프로그래밍』, 『데이터 분석』 등 다양한 분야의 저서를 집필하였다.
성균관대학교에서 컴퓨터교육전공 박사 학위를 취득하였으며, 2017~2019년에 단국대학교 SW중심사업단 강의전담 조교수를 거쳐 2019년부터 현재까지 건국대학교 상허교양대학 조교수로 재직 중이다. 『컴퓨팅 사고』, 『프로그래밍』, 『데이터 분석』 등 다양한 분야의 저서를 집필하였다.