파이썬의 엑셀, 판다스 라이브러리

엑셀 예제로 배우는 파이썬 데이터 분석
$45.36
SKU
9791165922962
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Mon 01/6 - Fri 01/10 (주문일로부 10-14 영업일)

Express Shipping estimated by Wed 01/1 - Fri 01/3 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2024/09/30
Pages/Weight/Size 188*257*35mm
ISBN 9791165922962
Categories IT 모바일 > 오피스 활용
Description
‘파이썬의 엑셀’이라 불리는 판다스 라이브러리는 데이터 분석가가 아니어도 배워볼 만한 가치가 충분하다. 데이터를 다루지만 엑셀의 한계를 느낀다면 판다스를 배워보자. 특히 마이크로소프트 엑셀에 파이썬이 탑재되었기에 더욱 그러하다. 또한 파이썬으로 데이터 분석에 입문하고자 한다면 판다스는 좋은 선택이다. 이 책은 판다스의 기초적 수준에서 시작하여 실전 데이터 분석을 위해 알아야 하는 필수적인 개념, 기능, 함수, 라이브러리 등을 다룬다. 다양한 예제와 그림 자료를 바탕으로 친절하게 설명하여 입문자도 쉽게 배울 수 있고, 판다스의 핵심이 되는 내용들을 세심하게 정리하였기에 판다스를 아는 사람이라도 지식의 빈틈을 메꿀 기회가 될 것이다. 또한 데이터 분석의 효율성을 높이는 심화 팁과 데이터 분석의 감을 잡을 수 있는 실전 데이터 분석 경험을 제공한다.
Contents
CHAPTER 01 판다스 입문

1.1 판다스 소개
1.1.1 판다스 라이브러리란?
1.1.2 마이크로소프트의 엑셀에 탑재된 판다스
1.1.3 판다스의 장점
1.2 파이썬 개발 환경
1.2.1 구글 코랩 소개
1.2.2 코랩 사용법

CHAPTER 02 파이썬 기초와 넘파이 라이브러리

2.1 변수와 자료형
2.1.1 변수
2.1.2 정수
2.1.3 실수
2.1.4 문자열
2.1.5 불
2.1.6 리스트
2.1.7 튜플
2.1.8 딕셔너리
2.2 제어문과 함수
2.2.1 제어문
2.2.2 함수
2.3 클래스와 객체, 라이브러리
2.3.1 클래스와 객체
2.3.2 라이브러리
2.3.3 넘파이 라이브러리

CHAPTER 03 데이터 프레임과 시리즈

3.1 데이터 프레임
3.1.1 데이터 프레임이란?
3.1.2 데이터 프레임의 구조 확인하기
3.1.3 데이터 프레임 생성하기
3.1.4 매개변수와 인수, 기본값
3.2 시리즈
3.2.1 시리즈란?
3.2.2 시리즈 생성하기
3.2.3 시리즈의 구조 확인하기
3.3 파일에서 데이터 프레임 불러오기
3.3.1 엑셀 파일에서 데이터 프레임 불러오기(read_excel)
3.3.2 CSV 파일에서 데이터 프레임 불러오기(read_csv)
3.4 데이터 프레임 저장하기
3.4.1 딕셔너리로 변환하기(to_dict)
3.4.2 파일로 저장하기(to_excel, to_csv)
3.4.3 함수와 메서드, 속성
3.5 데이터 프레임 탐색하기
3.5.1 데이터 프레임의 간단한 정보 파악하기(info 등)
3.5.2 데이터 프레임의 일부만 가져오기(head, tail)
3.5.3 데이터 프레임의 기술 통계 확인하기(describe)
3.5.4 각 열의 유일 값 확인하기(unique, nunique)
3.5.5 유일 값의 빈도수 파악하기(value_counts)
3.5.6 히스토그램 그리기(hist)
3.5.7 데이터 프레임과 시리즈 시각화하기(plot)

CHAPTER 04 인덱스

4.1 인덱싱과 슬라이싱
4.1.1 대괄호 인덱싱
4.1.2 대괄호 인덱싱으로 열 생성하기
4.1.3 대괄호 인덱싱으로 열 수정하기
4.1.4 대괄호 슬라이싱
4.1.5 키 인덱싱과 슬라이싱(loc 인덱서)
4.1.6 loc 인덱서로 행과 열 생성하기
4.1.7 로케이션 인덱싱과 슬라이싱(iloc 인덱서)
4.1.8 인덱싱과 슬라이싱 정리
4.2 데이터를 추출하는 함수들
4.2.1 행과 열 삭제하기(drop)
4.2.2 열 이름으로 필터링(filter)
4.2.3 자료형으로 열 선택하기(select_dtypes)
4.2.4 판다스의 함수와 원본 변경하기
엑셀 예제 1 타이타닉 침몰 사고 승객 데이터 인덱싱과 슬라이싱
4.3 인덱스와 컬럼즈를 다루는 함수들
4.3.1 인덱스 설정하기(set_index)
4.3.2 인덱스 리셋하기(reset_index)
4.3.3 인덱스와 컬럼즈 변경하기(배정)
4.3.4 인덱스와 컬럼즈 변경하기(set_axis)
4.3.5 열 이름 변경하기(rename)
4.3.6 매핑과 매퍼
4.3.7 데이터 재배열하기(reindex)
4.3.8 인덱스명 변경하기(rename_axis)
4.3.9 인덱스 클래스를 리스트로 변환하기(tolist)
4.4 멀티 인덱스 소개
4.4.1 멀티 인덱스와 레벨
4.4.2 멀티 인덱스의 구조 변경하기(stack, unstack)

CHAPTER 05 연산

5.1 판다스 연산 입문
5.1.1 벡터화 연산
5.1.2 연산자와 연산 함수
5.2 시리즈의 연산
5.2.1 시리즈와 단일 값의 연산
5.2.2 시리즈 간의 연산
5.2.3 데이터 프레임에서 열 간의 연산
5.3 데이터 프레임의 연산
5.3.1 데이터 프레임과 단일 값의 연산
5.3.2 데이터 프레임 간의 연산
5.3.3 NaN을 대체해 연산하기(연산 함수의 fill_value)
5.3.4 데이터 프레임과 시리즈의 연산(브로드 캐스팅)
엑셀 예제 2 주식 종목들의 일별 주가 추이 분석
5.4 통계 함수 적용하기
5.4.1 집계 함수
5.4.2 누적 통계 함수
5.4.3 매개변수 axis와 축 지정
5.4.4 그 외 다양한 통계 함수
엑셀 예제 3 다양한 통계 함수 실습하기

CHAPTER 06 데이터 정제하기

6.1 데이터 정제하기 입문
6.1.1 데이터 분석 과정 소개
6.1.2 데이터 정제하기란?
6.2 정렬
6.2.1 단일 열을 기준으로 정렬하기(sort_values)
6.2.2 오름차순과 내림차순
6.2.3 복수의 열을 기준으로 정렬하기
6.2.4 인덱스나 컬럼즈를 기준으로 정렬하기(sort_index)
6.3 필터링
6.3.1 불리언 인덱싱이란?
6.3.2 단일 요건 불리언 인덱싱
6.3.3 다중 요건 불리언 인덱싱
6.3.4 불 자료형 객체를 생성하는 함수
6.3.5 특정 열의 값을 기준으로 데이터의 일부만 가져오기(nlargest, nsmallest)
6.3.6 무작위로 데이터 추출하기(sample)
엑셀 예제 4 OECD 국가 GDP 데이터에서 원하는 데이터 추출하기
6.4 결측값 처리하기 1
6.4.1 결측값 확인하기(isna)
6.4.2 결측값을 포함한 데이터 삭제하기(dropna)
6.4.3 결측값 대체하기(fillna)
6.5 이상치와 중복 데이터 처리
6.5.1 이상치 처리하기(clip)
6.5.2 중복 데이터 확인 및 제거(duplicated, drop_duplicates)
6.5.3 중복 데이터 처리 함수의 활용
6.6 자료형 변환과 소수점 처리
6.6.1 여러 가지 자료형으로 변환하기(astype)
6.6.2 수치형으로 변환하기(to_numeric)
6.6.3 소수점 처리하기
6.7 치환과 매핑
6.7.1 데이터 치환하기(replace)
6.7.2 데이터 매핑하기(map)
6.7.3 replace 함수와 map 함수의 차이
엑셀 예제 5 미국 레스토랑 고객의 팁 데이터 정제하기

CHAPTER 07 데이터 결합하기

7.1 데이터 프레임 연결하기
7.1.1 데이터 프레임 연결하기(concat)
7.1.2 외부 조인과 내부 조인
7.2 데이터 프레임 병합하기
7.2.1 엑셀의 vlookup 방식으로 병합하기(merge)
7.2.2 다중 요건 vlookup을 merge 함수로 수행하기
7.2.3 merge 함수의 병합 방식
엑셀 예제 6 메이저 리그에서 시즌별로 팀 홈런에서 본인 홈런 비중이 높은 타자 집계하기
7.3 업데이트
7.3.1 데이터 프레임 업데이트하기(update)
7.3.2 데이터 프레임 업데이트하기(combine_first)
7.4 범위로 병합하기
7.4.1 범위로 병합하기(merge_asof)
7.4.2 그룹을 나누어 범위로 병합하기
엑셀 예제 7 인쇄소의 매출 데이터로 판매 금액 산출하기

CHAPTER 08 열 가공하기

8.1 열 가공하기
8.1.1 열 가공하기란?
8.1.2 다양한 열 가공하기 소개
8.2 다양한 연산으로 열 가공하기
8.2.1 객체 간 연산으로 열 가공하기
8.2.2 객체 내 연산으로 열 가공하기
8.2.3 수학적 연산으로 열 가공하기
8.3 순위 매기기
8.3.1 순위 매기기(rank)
8.3.2 rank 함수의 다양한 동점자 처리 방식
8.4 불리언 마스킹
8.4.1 불리언 인덱싱으로 불리언 마스킹
8.4.2 판다스 함수로 불리언 마스킹(mask, where)
8.4.3 넘파이의 np.where 함수로 불리언 마스킹
8.4.4 넘파이의 np.select 함수로 불리언 마스킹
8.5 수치형 데이터의 범주화
8.5.1 수치로 구간을 나누어 범주화(cut)
8.5.2 백분위수로 구간을 나누어 범주화(qcut)
엑셀 예제 8 학생들의 키와 몸무게 데이터로 열 가공하기 (1)
8.6 결측값 처리하기 2
8.6.1 전후방의 데이터로 결측값 대체하기(ffill, bfill)
8.6.2 결측값 보간하기(interpolate)
8.7 행 간의 연산으로 열 가공하기
8.7.1 데이터 이동하기(shift)
8.7.2 행 간의 차이 구하기(diff)
8.7.3 행 간의 변동률 구하기(pct_change)
엑셀 예제 9 삼성전자 주가 분석

CHAPTER 09 apply

9.1 apply 함수 소개
9.1.1 apply 함수가 필요한 이유
9.1.2 apply 함수의 기능
9.2 시리즈에 apply 함수 적용하기
9.2.1 시리즈에 apply 함수 적용하기
9.2.2 사용자 정의 함수와 apply
9.2.3 lambda 함수와 apply
9.2.4 시리즈에 apply 함수 적용할 때 유의할 점
9.2.5 lambda 함수 추가 학습
엑셀 예제 10 학생들의 키, 몸무게 데이터로 열 가공하기 (2)
9.3 데이터 프레임에 apply 함수 적용하기
9.3.1 데이터 프레임에 apply 함수 적용하기
9.3.2 데이터 프레임에 apply 함수 적용할 때 축 지정
9.3.3 복수 열의 데이터를 입력하는 lambda 함수를 각 행에 적용하기
9.3.4 apply와 map 함수 비교
엑셀 예제 11 지하철역 데이터 전처리 및 분석하기

CHAPTER 10 문자열 다루기

10.1 문자열을 다루는 함수
10.1.1 판다스의 문자열을 다루는 함수를 배우는 이유
10.1.2 판다스의 문자열을 다루는 함수들의 특징
10.2 문자열을 다루는 다양한 함수
10.2.1 인덱싱과 슬라이싱
10.2.2 문자열의 길이 반환하기(str.len)
10.2.3 문자열의 공백 제거하기(str.strip 외)
10.2.4 문자열 분할하기(str.split)
10.2.5 문자열 치환하기(str.replace 외)
엑셀 예제 12 GDP 관련 데이터 수치형으로 변환하기
10.2.6 문자열 포함 여부 확인하기(str.contains 외)
10.2.7 문자열 추출하기(str.extract)
10.3 정규 표현식
10.3.1 정규 표현식이란?
10.3.2 정규 표현식의 주요 문법
10.3.3 판다스의 문자열 함수에 정규 표현식 활용하기
10.3.4 정규 표현식을 활용해 문자열 추출하기(str.extractall 외)
엑셀 예제 13 커피 프랜차이즈의 서초구와 강남구 매장 수 집계하기

CHAPTER 11 피벗과 언피벗

11.1 피벗 테이블
11.1.1 피벗 테이블을 사용하는 이유
11.1.2 피벗 테이블과 집계 함수
11.1.3 피벗 테이블 생성하기(pivot_table)
11.1.4 복수의 인수를 입력해 피벗 테이블 생성하기
11.1.5 인수로 함수를 입력하는 방법
11.1.6 그룹화에만 적용되는 집계 함수(first, last)
11.1.7 문자열 피벗(pivot)
11.1.8 빈도수를 집계하는 교차표 생성하기(crosstab)
엑셀 예제 14 타이타닉 침몰 사고에서 과연 여성과 아이를 먼저 구조했을까?
11.2 언피벗
11.2.1 언피벗이 필요한 이유
11.2.2 stack 함수로 언피벗
11.2.3 melt 함수로 언피벗
11.2.4 stack 함수와 melt 함수의 언피벗 수행의 차이점
엑셀 예제 15 마트의 매출 데이터로 다양한 새로운 피벗 테이블 생성하기

CHAPTER 12 데이터 그룹화하기

12.1 groupby 함수로 열 가공하기
12.1.1 groupby 함수가 필요한 이유
12.1.2 그룹 내에서 함수 적용하기(groupby)
12.1.3 groupby 함수로 순위 매기기(rank)
엑셀 예제 16 동명이인 구분하기
12.1.4 groupby 함수로 행 간의 연산하기(shift 외)
12.1.5 groupby 함수로 전후방 값으로 결측값 대체하기(ffill, bfill 함수)
12.1.6 groupby 함수로 누적 합 구하기(cumsum)
12.1.7 groupby 함수로 순번 구하기(cumcount)
엑셀 예제 17 주식 ohlcv 데이터로 groupby 함수를 사용해 다양한 열 가공하기
12.1.8 집계 결과를 열로 생성하기(transform)
12.1.9 transform 함수로 사용자 정의 함수 적용하기
엑셀 예제 18 그룹을 나누어 표준점수를 구해 학생들의 성적 부여하기
12.2 groupby 함수로 집계하기
12.2.1 groupby 함수로 집계 함수 적용하기
12.2.2 groupby 함수로 집계하기와 피벗 테이블의 차이
12.2.3 groupby 함수와 agg 함수로 집계하기
12.2.4 문자열의 결합(join)
12.2.5 agg 함수로 사용자 정의 함수 적용하기
12.2.6 agg 함수와 transform 함수의 차이
엑셀 예제 19 타이타닉 침몰 사고의 승객 통계 데이터로 다양한 집계하기
12.3 groupby 심화
12.3.1 groupby 함수의 여러 가지 매개변수
12.3.2 그룹바이 객체
12.3.3 groupby 함수와 head, tail, sample
12.3.4 그루퍼
12.3.5 transform 함수를 활용한 다양한 그룹 필터링(all, any)
엑셀 예제 20 아우디 중고차 가격 집계하기

CHAPTER 13 시계열 데이터

13.1 시계열 데이터 소개
13.1.1 시계열 데이터의 종류
13.1.2 datetime 자료형
13.1.3 시계열 데이터의 학습 주안점
13.2 시계열 데이터로 변환 및 인덱싱
13.2.1 시계열 데이터로 변환하기(to_datetime)
13.2.2 기타 시계열 변환 함수들
13.2.3 파일에서 datetime 자료형을 지정하여 데이터 프레임 불러오기
13.2.4 DatetimeIndex의 인덱싱과 슬라이싱
13.2.5 특정 시간대의 데이터 추출하기(at_time, between_time)
엑셀 예제 21 시계열 데이터가 포함된 온라인 쇼핑몰 데이터 다루기 (1)
13.3 시계열 데이터 생성과 주기
13.3.1 주기
13.3.2 시계열 데이터 생성(date_range)
13.4 시계열 데이터 그룹화하기
13.4.1 그룹화로 열 가공하기(resample)
13.4.2 resample 함수와 groupby 함수 비교
13.4.3 그룹 집계하기(resample)
13.4.4 resample 함수에 agg 함수 적용하기
13.4.5 groupby 함수와 resample 함수를 동시에 적용하기
엑셀 예제 22 시계열 데이터가 포함된 온라인 쇼핑몰 데이터 다루기 (2)
13.5 특정 시계열 데이터 추출
13.5.1 특정 시계열 데이터 추출하는 다양한 메서드(dt 접근자)
13.5.2 문자열로 변환하기(strftime)
13.5.3 period 자료형으로 변환하기(to_period)
엑셀 예제 23 시계열 데이터가 포함된 온라인 쇼핑몰 데이터 다루기 (3)
13.6 그 외 시계열 데이터를 다루는 함수들
13.6.1 시간대 변환
13.6.2 시간 간격 생성하기(DateOffset)
13.6.3 시계열 그루퍼 생성하기(Grouper)
13.6.4 영업일만 배열로 생성하기(bdate_range)
13.6.5 업샘플링(asfreq 외)
엑셀 예제 24 비트코인 구매 일지의 업샘플링 수행하기

CHAPTER 14 판다스 심화 1

14.1 알아두면 유용한 판다스 함수들
14.1.1 열 이름 일괄적으로 변경하기(add_prefix, add_suffix)
14.1.2 열의 데이터를 반환한 뒤 삭제하기(pop)
14.1.3 특정 위치에 열 생성하기(insert)
14.1.4 열 생성하기(assign)
14.1.5 쿼리문으로 필터링하기(query)
14.1.6 행이나 열의 로케이션 반환하기(get_loc)
14.1.7 인덱스 클래스를 데이터 프레임이나 시리즈로 변환하기(to_frame, to_series)
14.1.8 데이터 프레임 연결하기(join)
14.1.9 연속적인 메서드 사용하기(pipe)
14.1.10 범주형 데이터 인코딩하기(factorize)
14.1.11 원 핫 인코딩 수행하기(get_dummies)
14.1.12 문자열 시리즈의 원 핫 인코딩 수행하기(str.get_dummies)
14.1.13 셀의 리스트를 행으로 전개하기(explode)
14.1.14 복수 열을 기준으로 인코딩하기(ngroup)
14.1.15 데이터 프레임이나 시리즈가 완전히 동일한지 확인하기(equals)
14.1.16 두 객체의 서로 다른 부분 반환하기(compare)
14.1.17 가로 형식 데이터 프레임을 세로 형식으로 변환하기(wide_to_long)
14.1.18 HTML 표에서 데이터 프레임 불러오기(read_html)
14.2 알아두면 유용한 넘파이 함수들
14.2.1 넘파이의 난수 생성 함수
14.2.2 두 배열 중 큰 값 반환하기(np.fmax)
14.2.3 각 행이나 각 열을 개별적으로 정렬하기(np.sort)
14.3 인덱스 클래스
14.3.1 인덱스 클래스 생성하기
14.3.2 인덱스 클래스에 적용하는 함수들
14.4 멀티 인덱스
14.4.1 멀티 인덱스의 생성
14.4.2 멀티 인덱스를 보유한 데이터 프레임의 인덱싱
14.4.3 멀티 인덱스를 다루는 함수들
14.4.4 구간 인덱스

CHAPTER 15 판다스 심화 2

15.1 이동 집계와 누적 집계
15.1.1 이동 집계(rolling)
15.1.2 누적 집계(expanding)
15.1.3 이동 집계와 누적 집계 심화
15.2 카테고리 자료형
15.2.1 카테고리 자료형을 사용하는 이유
15.2.2 카테고리 자료형으로 변환하기
15.2.3 카테고리 자료형의 다양한 메서드
15.3 시각화
15.3.1 색상
15.3.2 plot 함수의 매개변수
15.3.3 영역을 분할해 하위 그래프 생성하기
15.4 판다스 팁
15.4.1 과학적 표기법
15.4.2 자릿수마다 쉼표로 구분하기
15.4.3 소수를 백분율로 표현하기
15.4.4 엑셀 파일의 모든 시트 한 번에 합치기
15.4.5 하나의 데이터 프레임을 그룹으로 시트를 나누어 엑셀 파일로 저장하기
15.4.6 불리언 인덱싱에 lambda 함수 입력하기
15.4.7 rename 함수에 lambda 함수를 적용해 열 이름 변경하기
15.4.8 정렬의 기준에 함수를 적용해 정렬하기(매개변수 key)
15.4.9 정규 표현식의 캡처 그룹으로 문자열의 위치 교환하기
15.4.10 파이썬의 join 함수로 정규 표현식 패턴 생성하기
15.4.11 시리즈나 데이터 프레임을 역순으로 변환하기
15.4.12 오브젝트 열 내에서 개별 원소의 자료형 파악하기
15.4.13 비중이 낮은 범주를 통합하기
15.4.14 map함수로 멀티 인덱스를 단일 인덱스로 변환하기
15.4.15 cummin과 cummax 함수로 특정 시점 기준으로 필터링
15.4.16 NaN이 아닌 첫 번째 값 반환하기
15.4.17 셀 안의 리스트와 딕셔너리를 별도의 열로 확장하기
15.4.18 수치형 데이터인 열만 집계하기
15.4.19 그룹마다 소계를 집계한 행 생성하기
15.4.20 복수의 열을 순서와 상관없이 동일한 그룹을 설정해 그룹화하기
15.4.21 엑셀의 날짜 데이터를 숫자로 불러올 때 datetime으로 변환하기
15.4.22 기간의 마지막 날짜와의 차이 구하기
15.4.23 시계열 주기로 데이터 이동하기
15.4.24 구간 인덱스로 범주화하기
15.4.25 인덱스의 데이터를 사용해 apply 함수 적용하기

CHAPTER 16 실전 데이터 분석

16.1 볼린저 밴드와 주가 동향 분석
16.2 머니볼과 야구 데이터 분석
16.3 축구 국가대표 A매치 결과 분석
16.4 프랜차이즈의 거리 분석
16.5 빅데이터와 증권사 잔고 분석
Author
김판다