《모두를 위한 R 데이터 분석 입문(2판)》은 R로 데이터 분석을 시작하는 입문자를 위한 책입니다. 탄탄한 이론 설명을 토대로 다양한 예제를 직접 실습하면서 R의 기초 문법과 R을 활용한 데이터 분석을 동시에 학습할 수 있습니다. 특히 이번 2판에서는 ‘실전 분석’ 요소와 ‘데이터 분석 사례 프로젝트’를 추가하여 현업에서 실제 데이터 분석이 어떻게 구현되는지 이해할 수 있도록 도와줍니다. 이 책의 내용을 따라 하다 보면 자연스럽게 데이터를 다루는 능력을 습득할 수 있을 것입니다.
※ 본 도서는 대학 강의용 교재로 개발되었으므로 연습문제 해답은 제공하지 않습니다.
Contents
CHAPTER 01 데이터 분석과 R
01 데이터의 시대
02 빅데이터
03 데이터 분석 과정
04 R과 R스튜디오의 설치 및 사용
요약
연습문제
CHAPTER 02 변수와 벡터
01 R의 기본 연산
02 변수
03 벡터의 이해
04 벡터의 연산
05 리스트와 팩터
요약
연습문제
CHAPTER 03 매트릭스와 데이터프레임
01 매트릭스
02 데이터프레임
03 매트릭스와 데이터프레임 다루기
04 파일 데이터 읽기/쓰기
요약
연습문제
CHAPTER 04 조건문, 반복문, 함수
01 조건문
02 반복문
03 apply() 함수
04 사용자 정의 함수
05 조건에 맞는 데이터의 위치 찾기
요약
연습문제
01 군집화와 분류의 개요
02 k-평균 군집화
03 k-최근접 이웃 분류
04 k-fold 교차 검증
실전분석
요약
연습문제
CHAPTER 13 데이터 분석 사례 I
01 분석 대상 데이터 준비
02 데이터 탐색
03 기간별 분석
04. 역삼1동 상권 분석
요약
연습문제
CHAPTER 14 데이터 분석 사례 II
01 데이터셋 설명
02 데이터 탐색
03 코로나19 전후 비교
요약
연습문제
CHAPTER 15 데이터 분석 사례 III
01 데이터셋 설명
02 데이터 탐색
03 주택 가격 형성 요인 분석
04 주택 가격 예측모델 개발
요약
연습문제
부록. 구글맵 API 키와 KoNLP 패키지
Author
오세종
서강대학교 컴퓨터학부 학사와 석사를 거쳐 동대학원 컴퓨터학과에서 접근제어 이론으로 박사학위를 받았다. 학위 후 George Mason University에서 Post Doc. 연구원으로 2년간 일하였다. 대우정보시스템 CIM 사업부에 근무하면서 데이터베이스 설계, ERP 시스템 개발에도 참여하였다. 현재 단국대학교 소프트웨어학과 교수로 재직 중이다. 주요 연구 분야로 빅데이터 분석, 데이터 시각화, 머신러닝을 활용한 의료분야 진단모델 개발 등이 있다, 저서로는 『데이터베이스 설계 및 구축』(생능출판사, 2012), 『C로 배우는 기초 프로그래밍』(그린, 2010) 등이 있다.
서강대학교 컴퓨터학부 학사와 석사를 거쳐 동대학원 컴퓨터학과에서 접근제어 이론으로 박사학위를 받았다. 학위 후 George Mason University에서 Post Doc. 연구원으로 2년간 일하였다. 대우정보시스템 CIM 사업부에 근무하면서 데이터베이스 설계, ERP 시스템 개발에도 참여하였다. 현재 단국대학교 소프트웨어학과 교수로 재직 중이다. 주요 연구 분야로 빅데이터 분석, 데이터 시각화, 머신러닝을 활용한 의료분야 진단모델 개발 등이 있다, 저서로는 『데이터베이스 설계 및 구축』(생능출판사, 2012), 『C로 배우는 기초 프로그래밍』(그린, 2010) 등이 있다.