파이썬 데이터 분석 & 시각화 + 웹 대시보드 제작하기

$19.12
SKU
9791193059180
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Tue 05/28 - Mon 06/3 (주문일로부 10-14 영업일)

Express Shipping estimated by Thu 05/23 - Mon 05/27 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2024/01/31
Pages/Weight/Size 190*257*20mm
ISBN 9791193059180
Categories IT 모바일 > OS/데이터베이스
Description
『파이썬 데이터 분석 & 시각화 + 웹 대시보드 제작하기』 책은 파이썬 데이터 분석과 데이터 시각화 기초와 유용한 팁 및 데이터 웹 대시보드 제작 등 실전에 바로 작용할 수 있는 알짜 내용만 알차게 담았다! 이 책을 통해서 배우는 핵심 내용은 다음과 같다. 「01. 정형 데이터를 다루는 Pandas 기초부터 실전까지」에서는 정형 데이터를 다루는 Pandas 기초부터 실전까지 정형 데이터를 다루는 국민 라이브러리 Pandas에 대한 기초부터 실전에 필수적인 메서드 및 팁들을 다룬다. 「02 파이썬 시각화의 기초부터 실전까지」에서는 Python의 대표적인 데이터 시각화 라이브러리인 Matplotlib, Seaborn, Plotly를 다룬다. 간단하고 깔끔한 그래프를 그리기 위한 실전 지향 메서드 및 팁들을 배운다. 「03. 웹 기초 지식 없이 Streamlit 웹 대시보드 제작하기」에서는 웹 관련 선수 지식 없이 손쉽게 웹 대시보드를 제작할 수 있는 Streamlit 라이브러리의 기초를 배운다. 실전 데이터셋을 이용하여 간단한 웹 대시보드를 직접 제작하고 데이터로부터 인사이트를 얻는 실습을 해본다. 이 책의 예제 데이터셋 및 소스 코드 파일 다운로드 방법은 5쪽을 참조한다.
Contents
CHAPTER 01 Pandas를 이용한 파이썬 데이터 분석 기초

Pandas Series 및 Dataframe
Dataframe의 열 및 행 선택
select_dtypes을 이용한 열 선택
filter 메서드를 이용한 행과 열 선택
rename을 사용한 행, 열 이름 변경
데이터 파악의 기본이 되는 info, describe, value_counts, unique 메서드
결측치를 처리하는 fillna, dropna 메서드
데이터의 분위수를 구하는 quantile 메서드
원하는 데이터만 필터링 하는 query 메서드
Pandas의 꽃, 그룹별 연산을 위한 groupby 메서드
시계열 데이터의 특징
시계열 데이터 그루핑을 위한 resample 메서드

CHAPTER 02 Pandas 라이브러리 실전 꿀팁 대방출

데이터를 처음 만나면 하는 것들
연속 데이터를 그룹화하여 범주형 데이터로 분석하기
조건을 만족하는 최대 연속 횟수 구하기
이상치를 다루는 방법: clip, quantile 메서드
결측치 내삽/외삽하기
정렬된 인덱스에서의 행 슬라이싱
Timestamp데이터를 포함한 여러 열을 기준으로 groupby하기
데이터셋 내 특정 그룹별 데이터 표준화
groupby 메서드를 이용한 문자열 연산
하나의 행을 여러 개의 행으로 쪼개기

CHAPTER 03 Matplotlib, Seaborn, Plotly를 이용한 파이썬 데이터 시각화

Matplotlib의 구성 요소 및 특징
Scatterplot
Regplot
Lineplot
Boxplot, Stripplot, Swarmplot
Histplot
Heatmap
Matplotlib의 axes-level plot과 figure-level plot
그래프 세부 요소 튜닝

CHAPTER 04 Matplotlib, Seaborn 및 Plotly 라이브러리 실전 꿀팁 대방출

x축이 날짜인 시계열 그래프 tick label 깔끔하게 표현하기
다중 축 그래프 그리기
범례(legend) 위치 조절하기
그래프의 테두리(spine) 강조하기
그래프 내 텍스트 표현하기
수평선과 수직선 그리기
FacetGrid로 나눈 각 ax별 mapping으로 그래프 세부 튜닝하기
FacetGrid에서 특정 조건에 해당하는 ax 강조하기
regplot의 선형회귀선의 식과 상관계수 표시
그래프의 축 log 형식으로 변환하기
Seaborn color palette 및 Plotly color의 활용

CHAPTER 05 Python Streamlit을 이용한 데이터 대시보드 만들기

Streamlit 설치 및 실행하기
텍스트와 표 이해하기
다양한 위젯 이해하기: Button
다양한 위젯 이해하기: Checkbox, Toggle
다양한 위젯 이해하기: Selectbox, Radio, Multiselect
다양한 위젯 이해하기: Slider
다양한 위젯 이해하기: Input
다양한 위젯 이해하기: File uploader
차트 및 이미지 표현하기
Layout 이해하기
Session state와 캐싱 이해하기
간단한 Streamlit 웹 대시보드 제작 실습
Author
박찬의
포스텍 공학박사로 졸업 후 국내 반도체 대기업에서 빅데이터를 활용한 반도체 불량 분석 및 성능 개선 업무를 수행하는 반도체 공정 및 데이터 엔지니어이다. “5분 빨리 퇴근하자”라는 모토로 파이썬 데이터 분석 세미나를 운영하고 있으며, 사내 데이터 사이언스 강사로 선발되어 관련 분야에서 파이썬의 잠재력을 널리 퍼뜨리고 있다. 지금까지의 경험과 지식을 공유하고, 관련 분야에 입문하는 독자들의 시행 착오를 줄이고자 핵심 내용만 모아 집필하였다.
포스텍 공학박사로 졸업 후 국내 반도체 대기업에서 빅데이터를 활용한 반도체 불량 분석 및 성능 개선 업무를 수행하는 반도체 공정 및 데이터 엔지니어이다. “5분 빨리 퇴근하자”라는 모토로 파이썬 데이터 분석 세미나를 운영하고 있으며, 사내 데이터 사이언스 강사로 선발되어 관련 분야에서 파이썬의 잠재력을 널리 퍼뜨리고 있다. 지금까지의 경험과 지식을 공유하고, 관련 분야에 입문하는 독자들의 시행 착오를 줄이고자 핵심 내용만 모아 집필하였다.