데이터 분석의 핵심은 ‘효율’
챗GPT로 속도를, 엑셀로 정확도를!
순서도에 따라 기초 통계부터 데이터 전처리, 시각화까지 한 권에 담았다
이 책은 실무에서 가장 많이 접하는 데이터 분석 유형을 2가지 프로젝트로 경험할 수 있게 구성했다. 데이터 분석 도구로 ‘엑셀’과 챗GPT의 데이터 분석 플러그인 ‘Data Analyst’를 활용해 가장 트렌디하고 효율적인 분석을 가능케 했다. 데이터가 낯설어도 누구나 쉽게 ‘데이터 분석 순서도’에 따라 실무에 가까운 분석 과정을 경험할 수 있다. 실습에 필요한 모든 파일과 엑셀의 주요 함수, 기능, 단축키까지 준비되어 있으니 데이터 분석 여정에 올라타기만 하면 목적지까지 금세 도달할 수 있을 것이다.
Contents
[PART 01 _ 데이터 분석 도구와 친해지기]
Chapter 01 _ 데이터 분석을 위한 도구
_1.1 챗GPT가 있는데 데이터 분석에 엑셀이 필요할까?
_1.2 챗GPT의 Data Analyst 플러그인
__1-2-1 챗GPT에 접속하기
__1-2-2 챗GPT-4로 전환하기
__1-2-3 ‘데이터 분석’ 플러그인 사용해 보기
_1.3 엑셀
__1-3-1 엑셀 최신 버전으로 업데이트하기
_1.4 코파일럿
Chapter 02 _ 챗GPT의 데이터 분석 플러그인 다루기
_2.1 데이터세트 불러오기
__2-1-1 서울시 공공 데이터 내려받기
__2-1-2 데이터 다듬기
__2-1-3 변수 간추리기
_2.2 챗GPT로 데이터 분석하기
__2-2-1 챗GPT-4에 데이터세트 올리기
__2-2-2 원본 매출과 예측 매출을 비교하고 CSV 파일로 저장하기
_2.3 챗GPT 가이드라인
Chapter 03 _ 데이터를 가져오는 방법
_3.1 캐글 데이터
__3-1-1 캐글 데이터세트 검색하고 내려받기
_3.2 공공 데이터
__3-2-1 치킨집 검색 및 파일 내려받기
__3-2-2 약국 정보 검색 및 파일 내려받기
_3.3 웹 데이터
__3-3-1 웹 데이터 불러오기
_3.4 API 데이터
__3-4-1 ‘치킨’ 오픈 API 데이터 가져오기
__3-4-2 ‘약국’ 오픈 API 데이터 가져오기
[PART 02 _ 데이터 분석 기능 손에 익히기]
Chapter 04 _ 데이터세트 분리와 병합
_4.1 데이터 분리
__4-1-1 파워 쿼리
__4-2-2 챗GPT로 데이터 분리하기
__4-2-3 엑셀로 데이터 분리하기
_4.2 데이터 병합
__4-2-1 챗GPT로 데이터 병합하기
__4-2-2 엑셀 파일 병합하기
__4-2-3 엑셀 시트 병합하기
Chapter 05 _ 필요한 데이터만 쏙! 피벗 테이블 및 피벗 차트
_5.1 피벗 테이블
__5-1-1 챗GPT로 피벗 테이블 구현하기
__5-1-2 엑셀로 피벗 테이블 구현하기
_5.2 피벗 차트
__5-2-1 챗GPT로 피벗 차트 만들기
__5-2-2 엑셀로 피벗 차트 만들기
Chapter 06 _ 원하는 데이터를 쉽게 찾는 법, VLOOKUP 함수
_6.1 FORMULATEXT 함수
__6-1-1 엑셀에서 FORMULATEXT 함수 사용하기
_6.2 VLOOKUP 함수
__6-2-1 챗GPT로 VLOOKUP 함수 사용하기
__6-2-2 엑셀에서 VLOOKUP 함수 사용하기
__6-2-3 엑셀에서 VLOOPUP 함수 수정하기
Chapter 07 _ 데이터 시각화의 힘, 조건부 서식
_7.1 데이터 막대
__7-1-1 챗GPT로 데이터 막대 그리기
__7-1-2 엑셀로 데이터 막대 그리기
_7.2 셀 규칙 강조와 새 규칙
__7-2-1 챗GPT로 데이터 시각화하기
__7-2-2 엑셀에서 데이터 셀 규칙 강조 적용하기
__7-2-3 엑셀에서 새 규칙 적용하기
Chapter 08 _ 데이터 분석 순서도
_8.1 데이터 분석에도 순서가 있어?
_8.2 데이터 분석 순서도
[PART 03 _ 실전, 데이터 분석]
Chapter 09 _ 아파트 거래 가격 예측
_9.1 데이터 분석 프로젝트의 시작 3단계
__9-1-1 문제 제기, 데이터 구하기, 타깃 변수 설정
_9.2 데이터 처리 1 - ID 변수, 타깃 변수
__9-2-1 데이터 불러오기
__9-2-2 ID 변수 설정하기
__9-2-3 타깃 변수 생성하기
_9.3 데이터 처리 2 - 기타 변수 데이터 처리
__9-3-1 데이터 타입 확인하기
__9-3-2 데이터 타입 정리하기
__9-3-3 챗GPT로 날짜 변수 전처리하기
__9-3-4 엑셀에서 날짜 변수 전처리하기
__9-3-5 범주형 변수 전처리
_9.4 탐색적 자료 분석 및 시각화
__9-4-1 결측값 50% 초과 변수 제거
__9-4-2 구간 변수 요약 통계
__9-4-3 구간 변수 시각화
__9-4-4 범주형 변수 도수분포표 및 시각화
__9-4-5 이상값 제거
__9-4-6 상관관계 검토
__9-4-7 T-검정
_9.5 모델 실행 전 데이터 처리
__9-5-1 데이터 변환 - 구간 변수 스케일 조정
__9-5-2 데이터 대체 - 결측값 보정
__9-5-3 범주형 데이터 추가 처리 - 트리 기반 데이터세트
__9-5-4 범주형 데이터 추가 처리 - 거리 기반 데이터세트
_9.6 연속형 타깃 변수 모델
__9-6-1 데이터세트 파일 정리
__9-6-2 챗GPT 회귀 모델
__9-6-3 엑셀 회귀 분석
__9-6-4 릿지 모델과 라쏘 모델
__9-6-5 결정 트리 모델
__9-6-6 랜덤 포레스트 모델
__9-6-7 그레이디언트 부스팅, XGBoost, LightGBM 모델
_9.7 최적 모델 선정 및 활용
Chapter 10 _ 공유 자전거 수요 예측
_10.1 데이터 분석 프로젝트의 시작 3단계
__10-1-1 문제 제기, 데이터 구하기, 타깃 변수 설정
_10.2 데이터 처리 1 - ID 변수, 타깃 변수
__10-2-1 데이터 불러오기 & ID 변수 설정하기
__10-2-2 타깃 변수 생성
__10-2-3 타깃 변수 결측값 확인하기
_10.3 데이터 처리 2 - 기타 변수 데이터 처리
__10-3-1 데이터 타입 확인
__10-3-2 날짜 변수 전처리
__10-3-3 범주형 변수 전처리
_10.4 탐색적 자료 분석 및 시각화
__10-4-1 결측값 50% 초과 변수 제거
__10-4-2 구간 변수 요약 통계 검토
__10-4-3 구간 변수 시각화
__10-4-4 범주형 변수 도수분포표 및 시각화
__10-4-5 이상값 제거
__10-4-6 상관관계 검토
__10-4-7 T-검정
_10.5 모델 실행 전 데이터 처리
__10-5-1 구간 변수 스케일 조정
__10-5-2 범주형 데이터 추가 처리
_10.6 연속형 타깃 변수 모델
__10-6-1 회귀 모델
__10-6-2 릿지 모델과 라쏘 모델
_10.7 트리 기반 분류 모델
__10-7-1 결정 트리 모델
__10-7-2 랜덤 포레스트 모델
__10-7-3 그레이디언트 부스팅, XGBoost, LightGBM 모델
_10.8 거리 기반 분류 모델
__10-8-1 로지스틱 회귀·릿지·라쏘 모델
__10-8-2 신경망 모델
__10-8-3 KNN 모델
__10-8-4 SVM 모델
_10.9 최적 모델 선정 및 활용
APPENDIX _ 부록
_Appendix A _ 유용한 엑셀 기능 모음
__A.1 엑셀의 주요 기능
__A.2 엑셀 팁
__A.3 엑셀 단축키
_Appendix B _ 유용한 엑셀 함수 모음
__B.1 엑셀의 주요 함수
Author
임선집,채호창,신경민
미국 주립대 University of Central Oklahoma에서 MBA, MSBA 학위 및 SAS Enterprise Miner 자격증을 취득했다. 한국인터넷진흥원 조사 분석 팀장을 역임했고 데이터 분석, 챗GPT, 코파일럿, 엑셀, 오렌지3, 파이썬, 파이토치, 트랜스포머, 자연어 처리 과목으로 다수 기업 및 대학에 출강 중이다. 저서로는 『오렌지3 데이터 분석 with 파이썬』과 『플로우가 보이는 머신러닝 프로젝트』 등이 있으며 현재 컴퍼스랩의 Data Analyst 및 한국 열린 사이버 대학 특임 교수로 재직 중이다.
미국 주립대 University of Central Oklahoma에서 MBA, MSBA 학위 및 SAS Enterprise Miner 자격증을 취득했다. 한국인터넷진흥원 조사 분석 팀장을 역임했고 데이터 분석, 챗GPT, 코파일럿, 엑셀, 오렌지3, 파이썬, 파이토치, 트랜스포머, 자연어 처리 과목으로 다수 기업 및 대학에 출강 중이다. 저서로는 『오렌지3 데이터 분석 with 파이썬』과 『플로우가 보이는 머신러닝 프로젝트』 등이 있으며 현재 컴퍼스랩의 Data Analyst 및 한국 열린 사이버 대학 특임 교수로 재직 중이다.