판다스로 쉽게 배우는 데이터 분석과 시각화

$27.00
SKU
9791193205181
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Mon 05/20 - Fri 05/24 (주문일로부 10-14 영업일)

Express Shipping estimated by Wed 05/15 - Fri 05/17 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2024/02/20
Pages/Weight/Size 188*257*30mm
ISBN 9791193205181
Categories IT 모바일 > OS/데이터베이스
Description
DATA ANALYSIS
pandas, matplotlib 또는 seaborn
라이브러리를 이용하여 시각화 표현


이 책은 크게 데이터 분석과 데이터 시각화라는 두 개의 주제를 다루고 있다. 시중에 나와 있는 다수의 데이터 분석 관련 도서에서 다루지 않은 수학적 배경지식, 기초적인 원리 등을 다루었으며, 이를 통해 원하는 데이터만 추출하고, 정렬하며, 이상치를 찾거나 결측치를 채우는 보다 효과적인 방법에 대해 학습할 수 있게 될 것이다. 또한, 이 책의 큰 장점 중 하나는 현업에서 많이 사용하고 여러 자격 검증에서도 자주 다루는 정형화된 포맷의 그래프 및 차트들을 기초부터 고급 활용 부분까지 세세하게 다루었다는 것이다. pandas를 이용하여 아주 간단히 그래프를 표현하는 방법부터, matplotlib 또는 seaborn 라이브러리를 이용하여 그래프를 표현하는 부분까지 폭넓게 다루고 있다. 만약 데이터 분석가가 장래의 목표이거나, 데이터 분석 전문가 등의 자격증을 준비한다면 이 책으로 시작하는 것도 훌륭한 선택이라 생각한다.

이 책은 파이썬 문법(변수, 함수, 반복문, 조건문, 컬렉션 자료형)을 이미 학습한 사람을 대상으로 쓰여졌지만, 문법을 모르는 사람들도 필요한 문법을 학습하며 본다면 그리 어렵지 않게 따라올 수 있을 것이다. 이 책에서 지면의 부족으로 미처 다루지 못한 예측적 데이터 분석(머신러닝, 딥러닝)은 현재 집필 중이므로 머지 않아 출판될 수 있을 것이다.
Contents
머리말

1. 파이썬(Python)으로 시작하는 데이터 분석

1.1 파이썬으로 데이터 분석을 해야 하는 이유
1.2 파이썬 개발 도구(주피터노트북) 설치
1.3 주피터 노트북 실행 및 사용 방법

2. 넘파이(Numpy)

2.1 Numpy 기초
2.1.1 Numpy와 List의 비교
2.1.2 Numpy 속성
2.1.3 Numpy.arange() 함수
2.1.4 Numpy 통계 관련 함수
2.2 Numpy 인덱싱(indexing), 슬라이싱(slicing), 반복(iterating)
2.2.1 Numpy 인덱싱과 슬라이싱
2.2.2 논리적 인덱싱
2.2.3 2차원 배열에서의 인덱싱과 슬라이싱
2.3 결합(concatenate)과 분리(split)
2.3.1 배열의 결합과 전치(np.concatenate()와 np.transpose())
2.3.2 배열 분리
2.4 Numpy의 특별한 행렬과 벡터
2.4.1 np.zeros()와 np.ones()
2.4.2 np.full()와 np.eye()
2.4.3 np.random()

3. 판다스(pandas) - 시리즈(Series)

3.1 시리즈 생성과 정렬
3.1.1 시리즈 생성
3.1.2 시리즈 인덱싱, 슬라이싱
3.1.3 시리즈 values 변경, 추가
3.1.4 시리즈 index와 values
3.1.5 시리즈 index 재설정
3.1.6 시리즈 정렬
3.2 시리즈 주요 메서드
3.2.1 head()와 tail()
3.2.2 unique(), nunique() 그리고 value_counts()

4. 판다스(pandas) - 데이터프레임(DataFrame)

4.1 데이터프레임 생성과 정렬
4.1.1 데이터프레임 생성과 이름 변경
4.1.2 데이터프레임 행과 열
4.1.3 데이터프레임 인덱싱과 슬라이싱
4.1.4 데이터프레임 복사
4.1.5 데이터프레임 행/열 선택 및 추가
4.1.6 데이터프레임 연산
4.1.7 데이터프레임 행/열 삭제
4.1.8 데이터프레임 논리적 인덱싱
4.1.9 데이터프레임 정렬
4.2 데이터프레임 데이터 타입(자료형)
4.2.1 Category 타입
4.2.2 datatime 타입

5. 판다스(pandas) - 데이터프레임(DataFrame) 다루기

5.1 CSV 파일로 데이터프레임 생성
5.2 5.2 데이터 요약
5.3 결측치 제거 및 대체
5.3.1 결측 데이터 확인과 NaN의 의미
5.3.2 결측 데이터 삭제
5.3.3 결측치에 값 채우기
5.3.4 결측치 단일 대체
5.3.5 결측치 다중 대체(마스킹과 보간)
5.4 문자열 데이터 처리
5.4.1 파이썬의 기본 문자열 처리 함수
5.4.2 str 액세서와 문자열 처리 메서드
5.4.3 정규 표현식
5.4.4 str.contains()과 str.startswith(), str.endswith()
5.4.5 apply(), agg(), map(), applymap() 비교
5.5 데이터프레임 결합과 병합
5.5.1 pandas.concat()
5.5.2 pandas.merge()
5.6 그룹 집계와 멀티인덱스
5.6.1 groupby()
5.6.2 멀티인덱스와 swaplevel(), droplevel()
5.6.3 groupby()에 멀티인덱스 적용
5.6.4 pandas.transform()
5.6.5 unstack()과 stack()
5.6.6 cross_tab()
5.6.7 pivot()과 pivots_table()

6. 데이터 시각화

6.1 pandas의 plot()
6.1.1 line 그래프
6.1.2 box 그래프
6.1.3 bar 그래프
6.1.4 pie 그래프
6.1.5 hist 그래프
6.1.6 kde 그래프와 scatter 그래프
6.2 matplotlib 라이브러리
6.2.1 matplotlib으로 기본 그래프 생성
6.2.2 Figure 생성과 subplot 추가
6.2.3 box 그래프와 bar 그래프
6.2.4 pie 그래프
6.2.5 hist 그래프
6.2.6 scatter 그래프
6.3 Seabron 라이브러리
6.3.1 seabron 예제 데이터 세트 활용
6.3.2 countplot()과 barplot()
6.3.3 histplot()과 boxplot(), violinplot()
6.3.4 scatterplot()과 relplot()
Author
조승근