빅데이터 분석 R 유 레디

$26.08
SKU
9791192187693
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Tue 04/30 - Mon 05/6 (주문일로부 10-14 영업일)

Express Shipping estimated by Thu 04/25 - Mon 04/29 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2022/10/15
Pages/Weight/Size 188*257*30mm
ISBN 9791192187693
Categories IT 모바일 > OS/데이터베이스
Description
4차 산업 혁명 시대에 핵심이 되는 관련 기술로는 인공지능, 3D 프린팅, 빅데이터, 텔레매틱스, 클라우드 컴퓨팅, 웨어러블, RFID, 자율주행차, 유비쿼터스 컴퓨팅, 사물인터넷 등이 있으며, 4차 사업 혁명의 본질은 가상과 현실의 융합이다. 4차 산업 시대에 있어서 소프트웨어는 국가의 경쟁력을 좌우하게 될 것이며, 선진국을 중심으로 코딩교육을 실시하고 있으며, 우리나라에서도 시대의 흐름에 따라 소프트웨어의 중요성을 인식하고 초등학교에서부터 정규 교과로 편성하여 교육을 하고 있다.

4차 산업 혁명 시대 관련 기술 중 하나인 빅데이터 관련 기술은 기존에는 오프라인 형태의 일부 데이터들을 활용한 반면 인터넷이 발달하면서 빅데이터를 활용한 기술이 기하급수적으로 증가하고 사회 전 분야에 걸쳐서 관심이 지속되고 있으며, 다양한 분야에 활용되고 있다.

빅데이터는 특정 분야가 아닌 인문, 사회, 경영, 경상, 공학, 자연과학, 의학, 치의학 분야 등 모든 분야에서 활용되고 있고, 수많은 데이터들 중에 의미 있는 정보를 추출해내는 핵심 기술로써 인식되고 있다. 이 책은 빅데이터를 처음 접하거나 초보자들을 위해 본문에서는 기본적인 내용들을 다루고 실습과정과 연습문제를 통해 분석 능력을 갖출 수 있도록 하였다.
Contents
CHAPTER 1 R의 소개와 설치 001

1.1 R이란 무엇인가? 003
1.2 R과 RStudio 설치 003
1.2.1 R 설치하기 003
1.2.2 RStudio 설치하기 010
1.3 RStudio 실행하기 015
1.4 기본 프로젝트 만들기 016
1.5 RStudio 환경설정하기 023

CHAPTER 2 데이터 027

2.1 데이터 종류 029
2.2 변수와 자료형 029
2.2.1 변수 029
2.2.2 자료형 030
2.2.3 자료형 확인하기 031
2.3 입출력 032
2.3.1 입력 032
2.3.2 출력 034
2.4 데이터프레임 035
- EXERCISE 037

CHAPTER 3 함수와 패키지 039

3.1 함수란 무엇인가? 041
3.2 기본함수 041
3.2.1 c() 함수 041
3.2.2 seq() 함수 042
3.3 수학 함수 046
3.4 문자 함수 050
3.5 비교 연산자 053
3.6 논리 연산자 054
3.7 조건문 055
3.7.1 if ~ else 함수 055
3.7.2 if ~ else if 함수 058
3.7.3 ifelse() 함수 059
3.7.4 switch() 함수 062
3.8 반복문 063
3.8.1 for() 함수 063
3.8.2 while() 함수 068
3.9 패키지 075
- EXERCISE 077

CHAPTER 4 데이터 분석 081

4.1 데이터 파악하기 083
4.2 변수명 변경하기 092
4.3 파생변수 생성하기 094
- EXERCISE 096

CHAPTER 5 데이터 가공 및 분석 099

5.1 데이터 추출하기 101
5.2 데이터 정렬하기 113
5.3 데이터 변형하기 118
5.4 데이터 요약하기 126
5.5 데이터 그룹화 하기 136
5.6 데이터 결합하기 141
- EXERCISE 145

CHAPTER 6 데이터 정제 147

6.1 결측치 확인 149
6.1.1 is.na() 함수 150
6.1.2 table() 함수 151
6.1.3 summary() 함수 153
6.1.4 !is.na() 함수 155
6.1.5 complete.cases() 함수 156
6.1.6 na.omit() 함수 158
6.1.7 filter() 함수 159
6.2 결측치 처리 163
6.2.1 na.rm = T 함수 163
6.2.2 결측치를 평균값으로 변경 167
6.3 이상치 확인 및 처리 171
- EXERCISE 177

CHAPTER 7 그래프 179

7.1 qplot() 함수 181
7.2 hist() 함수 183
7.3 plot() 함수 184
7.4 pie() 함수 186
7.5 boxplot() 함수 187
7.6 ggplot2() 패키지 193
7.6.1 geom_bar() 함수 193
7.6.2 geom_point() 함수 197
7.6.3 geom_line() 함수 202
7.6.4 geom_boxplot() 함수 207
- EXERCISE 210

CHAPTER 8 텍스트 마이닝 213

8.1 단어의 빈도 분석하기 215
8.1.1 텍스트 전처리 215
8.1.2 토큰화하기 221
8.1.3 단어 빈도 분석하기 224
8.2 형태소 분석기를 이용한 단어 빈도 분석 233
8.2.1 형태소 분석 233
8.2.2 명사 빈도 분석하기 237

CHAPTER 9 Shapefile을 활용한 대한민국 지도 시각화 241

9.1 Shapefile을 활용한 대한민국 지도 시각화 243
9.1.1 shapefile 불러오기 246
9.1.2 shapefile을 데이터프레임으로 변환 252
9.1.3 ggplot2 패키지로 지도 시각화 257
9.1.4 행정구역의 위치정보와 메타데이터 속성의 결합 258
9.2 서울시 지도 시각화 263
9.3 서울시 초미세먼지 단계구분도 267
9.3.1 서울시 초미세먼지 데이터 수집 268
9.3.2 초미세먼지 데이터와 시군구 데이터를 병합한 통합 데이터 생성 272
9.3.3 서울시 초미세먼지 단계구분도 276
9.3.4 서울시 초미세먼지 인터렉티브 단계구분도 279

CHAPTER 10 대기오염 측정데이터 분석 283

CHAPTER 11 전국 일반음식점 표준데이터를 활용한 실전 분석 295

11.1 전국일반음식점표준데이터 준비 297
11.2 전국일반음식점표준데이터 파악 299
11.3 전국일반음식점표준데이터 전처리 302
11.4 전국일반음식점표준데이터 분석 310
11.4.1 전국일반음식점표준데이터 전국 통계 310
11.4.2 전국일반음식점표준데이터 서울특별시 통계 317

INDEX 327
Author
이광옥,조영주,임희경,유소월
조선대학교 전산통계학과 학사·석사·박사 과정을 졸업하였으며 조선대학교 일반대학원 교육학박사과정을 수료, 조선간호대학교 겸임교수를 역임했다. 현재 조선대학교 SW융합교육원 초빙교수이다.