파이썬 데이터 분석가 되기 + 챗GPT

$28.08
SKU
9791194383031
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Tue 01/7 - Mon 01/13 (주문일로부 10-14 영업일)

Express Shipping estimated by Thu 01/2 - Mon 01/6 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2024/11/15
Pages/Weight/Size 183*235*22mm
ISBN 9791194383031
Categories IT 모바일 > 컴퓨터 공학
Description
파이썬으로 데이터 분석을 하고 싶다면?
파이썬 입문 그다음에 꼭 보세요!
‘패스트캠퍼스’, ‘메가스터디’ 셀레나 쌤과 함께 실패 없이 완주하세요!


실력을 갖춘 데이터 분석가로 성장하려면 시작이 중요하다. 그래서 이 책은 무엇부터 익혀야 하는지 막막한 입문자에게 데이터 분석 로드맵을 제시하고 개념과 실습, 그리고 실무팁까지 차근차근 설명한다. 또한 챗GPT로 공부하는 방법을 함께 소개하여 다양한 관점에서 데이터 분석을 학습할 수 있도록 준비했다. 이어서 파이썬 데이터 분석에 꼭 필요한 5대장인 넘파이, 판다스, 맷플롯립, 시본, 뷰티풀수프를 최신 트렌드에 맞게 그리고 실무에 유용하게 알려준다. 모든 장 끝에는 연습문제가 수록되어 있어 배운 내용을 점검할 수 있다.
Contents
01장 수치 계산 라이브러리, 넘파이

_01.1 넘파이와의 첫 만남
__넘파이 사용하기

_01.2 넘파이 배열, ndarray
__1차원 배열 알아보기
__2차원 배열 알아보기
__3차원 배열 알아보기
__넘파이 배열의 축 이해하기
__넘파이의 축 번호는 왜 그럴까?
__넘파이 배열의 데이터 타입 살펴보기
__데이터 타입 확인해보기
__넘파이 배열의 장점 알아보기
__다양한 방법으로 넘파이 배열 생성하기
__넘파이 배열 속성 이해하고 출력해보기
__[챗GPT와 함께] 넘파이 3차원 배열 생성해보기
__초기화 함수로 넘파이 배열 생성하기
__일정한 간격의 넘파이 배열 생성하기
__arange( ) 함수와 linspace( ) 함수 비교하기

_01.3 넘파이 배열로 다양하게 연산하기
__요소별 연산해보기
__[챗GPT와 함께] 넘파이 사칙연산 구하기
__수학 함수, 집계 함수와 함께 벡터화 연산해보기

_01.4 배열 인덱싱과 슬라이싱
__인덱스 이해하기
__단일 요소 인덱싱 이해하기
__슬라이싱 이해하기
__논리형 인덱싱 이해하기
__정수 배열 인덱싱 이해하기
__[챗GPT와 함께] 넘파이 배열의 슬라이싱을 다른 프로그래밍 언어와 비교하기

_01.5 배열의 형태 변형하기
__배열의 형태를 변형하여 새 배열을 반환하는reshape( ) 함수
__[챗GPT와 함께] reshape( ) 함수에서 -1을 쓰는 이유는 뭘까?
__원본 배열의 형태를 변형하는 resize( ) 함수
__1차원 배열로 변형하기
__전치 연산하기

_01.6 배열 합치고 분할하기
__배열 합치기
__배열 분할하기
__학습 마무리
__연습문제

02장 데이터 처리 라이브러리, 판다스

_02.1 판다스 시작하기
__판다스와 넘파이의 특징
__판다스와 넘파이의 관계
__판다스를 사용해야 하는 이유
__시리즈란?
__데이터프레임이란?
__데이터 다운로드하고 다시 업로드하여 살펴보기
__판다스의 데이터 타입 알아보기
__[챗GPT와 함께] 샘플 데이터 생성 후 판다스에서 읽어보기

_02.2 데이터 내용 확인하기
__데이터의 열과 행 확인하기
__데이터의 처음과 마지막 부분 확인하기
__데이터 구조 살펴보기
__[챗GPT와 함께] 데이터 구조 살펴보기

_02.3 특정 열 선택하기
__시리즈 반환하기
__데이터프레임 반환하기
__[챗GPT와 함께] 판다스 특정 열 선택을 조건으로 활용하기 (1)
__[챗GPT와 함께] 판다스 특정 열 선택을 조건으로 활용하기 (2)

_02.4 데이터 필터링하기
__비교 연산자 〉로 필터링하기
__부정 연산자 ~로 필터링하기
__논리 연산자 &나 |로 필터링하기
__[챗GPT와 함께] 데이터 필터링 기능 활용하기
__loc[ ]와 iloc[ ]로 필터링하기
__isin( ) 함수로 특정 값 필터링하기
__[챗GPT와 함께] isin( ) 함수와 조건문 비교하기

_02.5 결측치 처리하기
__결측치가 뭐죠?
__결측치 처리가 중요한 이유?
__결측치 처리, 어떻게 해야 할까요?
__결측치 확인하기
__결측치 처리하기
__결측치를 처리한 데이터프레임을 파일로 저장하기
__[챗GPT와 함께] 결측치에 대해 물어보자!

_02.6 데이터 통계 처리하기
__통계 구하기
__그룹별 집계하기
__[챗GPT와 함께] agg( ) 함수를 이용하여 통계 분석하기

_02.7 데이터프레임에 행이나 열 추가하거나 삭제하기
__행과 열 추가하기
__행과 열 삭제하기
__학습 마무리
__연습문제

03장 데이터 시각화 라이브러리, 맷플롯립

_03.1 맷플롯립 시작하기
__맷플롯립 소개
__맷플롯립 사용하기
__[챗GPT와 함께] 맷플롯립 장점 알아보기

_03.2 그래프 꾸미기
__축과 관련 있는 옵션 사용해보기
__선과 관련 있는 옵션 사용해보기
__[챗GPT와 함께] 맷플롯립 그래프 색상 설정하기
__제목 관련 옵션 사용해보기
__그래프 배경 관련 옵션 사용해보기
__[챗GPT와 함께] 맷플롯립 그래프 그리기

_03.3 다양한 그래프 그려보기(1)
__타이타닉 데이터셋 소개
__선 그래프 : 객실 등급에 따른 생존율 표시하기
__수직 막대 그래프 : 각 승선 항구에 따른 생존자 수 확인하기
__수평 막대 그래프 : 각 승선 항구에 따른 생존자 수 확인하기
__산점도 그래프 : 나이와 요금, 생존 여부 확인하기
__파이 차트 : 생존자, 사망자 비율 표현하기
__히스토그램 : 승객의 나이 분포 표시하기

_03.4 다양한 그래프 그려보기(2)
__히트맵 : 두 변수의 상관 관계를 표시하기
__영역 채우기 그래프 : 나이대별 생존자와 사망자 수 표현하기
__박스 플롯 : 승객 나이의 데이터 분포, 중앙값, 이상치 살펴보기
__바이올린 플롯 : 승객 등급에 따른 나이 분포 표시하기
__[챗GPT와 함께] 맷플롯립 박스플롯과 바이올린 플롯 활용에 대해 알아보기
__에러 바 : 요금의 평균과 표준편차 표현하기
__[챗GPT와 함께] 맷플롯립 에러바를 이용한 기업 월간 주가 확인하기

_03.5 그래프 한꺼번에 그려보기
__여러 종류의 그래프 그리는 방법 원리 설명
__개별 서브플롯을 하나씩 생성하기
__타이타닉 데이터셋으로 개별 서브플롯 하나씩 그리기
__개별 서브플롯을 동시에 생성하기
__타이타닉 데이터셋으로 개별 서브플롯 동시에 그리기
__하나의 서브플롯에 여러 그래프 그리기
__[챗GPT와 함께] 타이타닉 승객 등급별 요금 분포와 생존율 시각화하기

_03.6 그래프 저장하기
__학습 마무리
__연습문제

04장 데이터 시각화라이브러리, 시본

__04.1 시본 기본 개념
__시본 자체 데이터셋 불러오기
__팁 데이터셋 불러오기
__[챗GPT와 함께] Seaborn은 왜 별칭이 sns일까?

_04.2 여섯 가지 그래프 이해하기
__시본 그래프는 어떤 것들이 있을까?
__범주형 변수 산점도 그래프
__빈도 그래프
__선형 회귀선이 있는 산점도 그래프
__히스토그램과 커널 밀도 추정 그래프
__조인트 그래프
__관계 그래프
__[챗GPT와 함께] 이상치 탐지 그래프는 어떤 그래프로?
__학습 마무리
__연습문제

05장 웹 데이터 수집라이브러리, 뷰티풀수프

_05.1 웹 데이터 수집 기본 개념
__웹 데이터를 수집할 때 주의할 점
__[챗GPT와 함께] robots.txt 알아보기
__[챗GPT와 함께] 야후 파이낸스와 네이버 파이낸스의 robots.txt 비교하기
__웹 데이터 수집 용어 정리하기
__웹 스크래핑은 어떤 과정으로 수행될까?
__뷰티풀수프 기초 사용 방법 알아보기
__웹 스크래핑 원리 이해하기

_05.2 야후 파이낸스 주가 데이터 웹 스크래핑하기
__웹 페이지 파악하기
__헤더에 사용자 에이전트 값 추가하기
__삼성전자 종목 일별 시세 페이지 요청하기
__뷰티풀 수프로 데이터 추출하고 날짜, 원 표시하기
__for문으로 순회하면서 전체 날짜, 종가 데이터 가져오기
__수집한 데이터로 그래프 시각화하기
__[챗GPT와 함께] 날짜와 종가 데이터로 막대 그래프 그리기 346
__[챗GPT와 함께] 주식 데이터를 웹 스크래핑할 추가적인 사이트 349
__학습 마무리
__연습문제

06장 넷플릭스 데이터 분석 프로젝트

_06.1 넷플릭스 데이터 분석 프로젝트 소개
__여기서 사용하는 라이브러리
__데이터 분석 목표
__데이터 전처리 과정
__데이터 시각화 미리보기

_06.2 넷플릭스 데이터셋 파악하기
__캐글의 넷플릭스 데이터셋?
__[챗GPT와 함께] 캐글의 데이터 분석할 데이터셋 추천받기!
__넷플릭스 데이터셋 변수 살펴보기
__넷플릭스 데이터셋 불러와 살펴보기

_06.3 넷플릭스 데이터셋 결측치 처리하기
__넷플릭스 결측치 비율 확인하고 처리하기

_06.4 넷플릭스 피처 엔지니어링하기
__피처 엔지니어링은 어디에 쓰이나요?
__[챗GPT와 함께] 피처 엔지니어링 더 해보기

_06.5 넷플릭스 시각화하기 380
__데이터 전처리 완료한 데이터셋 불러오기
__넷플릭스 색상 시각화하기 380
__넷플릭스 오징어 게임 검색하기
__넷플릭스 파이 차트 그리기
__넷플릭스 막대 그래프 그리기
__넷플릭스 히트맵 그리기
__넷플릭스 워드 클라우드
__[챗GPT와 함께] 워드 클라우드 더 해보기
__학습 마무리

07장 의료 데이터 분석 프로젝트

_07.1 의료 데이터 분석 프로젝트 소개
__여기서 사용하는 라이브러리
__데이터 분석 목표
__데이터 전처리 과정
__데이터 시각화 미리보기

_07.2 의료 데이터셋 파악하기
__심부전 데이터셋이란?
__심부전 데이터셋 불러온 다음 내용 확인하기

_07.3 심부전 데이터셋 필터링하기
__논리형 인덱싱으로 데이터 필터링하기

_07.4 심부전 데이터셋 결측치 처리하기
__결측치 비율 확인하기
__결측치 처리하기
__결측치 처리 후에 결측치 개수 다시 확인하기
__[챗GPT와 함께] 결측치를 처리하는 방법이 궁금해!

_07.5 심부전 데이터셋 통계 처리하기
__평균값과 중앙값 구하기
__열의 빈도수 구하기
__통계량 요약하기
__그룹별 집계하기
__[챗GPT와 함께] 심부전 데이터셋을 이용한 피처 엔지니어링

_07.6 심부전 데이터셋 시각화하기
__심부전 색상 시각화하기
__심부전 파이 차트 그리기
__심부전 빈도 그래프 그리기
__심부전 데이터 영역 그래프 그리기
__심부전 범주형 산점도 그래프 그리기
__심부전 워드 클라우드 그리기
__[챗GPT와 함께] 추가적인 시각화를 진행해보자
__학습 마무리
Author
셀레나
패스트캠퍼스, 메가스터디, 국비 지원 강의를 통해 5,000명 이상의 수강생을 온라인과 오프라인에서 만나며 데이터 분석을 가르쳐 왔다. 수강생들이 데이터 분석을 처음 접할 때 겪는 어려움과 고민을 가까이에서 지켜보며, 어떻게 하면 더 쉽게 이해하고 실습할 수 있을지 끊임없이 고민했다. 이러한 경험을 바탕으로 누구나 부담 없이 데이터 분석을 시작할 수 있는 안내서가 되기를 바라며 책을 집필하였다.
패스트캠퍼스 : '실패 없이 완주하는 파이썬 데이터 분석 입문' 강의 런칭, 삼성전자 : Citizen Developer 양성 과정 '파이썬 프로그래밍 기초', 대한의료정보학회 : '의료 데이터를 활용한 실전 분석' 튜토리얼, 서강대학교, 숙명여자대학교, 한국교통대학교 : '파이썬을 활용한 머신러닝 및 데이터 분석 실습' 외 강의 및 컨설팅 진행.
패스트캠퍼스, 메가스터디, 국비 지원 강의를 통해 5,000명 이상의 수강생을 온라인과 오프라인에서 만나며 데이터 분석을 가르쳐 왔다. 수강생들이 데이터 분석을 처음 접할 때 겪는 어려움과 고민을 가까이에서 지켜보며, 어떻게 하면 더 쉽게 이해하고 실습할 수 있을지 끊임없이 고민했다. 이러한 경험을 바탕으로 누구나 부담 없이 데이터 분석을 시작할 수 있는 안내서가 되기를 바라며 책을 집필하였다.
패스트캠퍼스 : '실패 없이 완주하는 파이썬 데이터 분석 입문' 강의 런칭, 삼성전자 : Citizen Developer 양성 과정 '파이썬 프로그래밍 기초', 대한의료정보학회 : '의료 데이터를 활용한 실전 분석' 튜토리얼, 서강대학교, 숙명여자대학교, 한국교통대학교 : '파이썬을 활용한 머신러닝 및 데이터 분석 실습' 외 강의 및 컨설팅 진행.