인공지능은 여러 가지 기법으로 구현 가능하다. chatGPT와 DALL-E 같이 데이터를 기반으로 하는 인공지능 기법들이 크게 활용 가치를 발휘하는 가운데, 인공지능을 이해하고 구현하거나 데이터를 읽고 분석하는 데이터 리터러시 능력은 주요 경쟁력의 하나가 되고 있다. 인공지능을 구현하는 여러 도구들이 있지만, R은 우리에게 새로운 기회가 될 수 있다. 통계 패키지로 출발한 R은 SAS, MATLAB, SPSS보다 더 선호되고 있으며, 범용 프로그래밍 언어인 Java, C/C++, Python 못지 않게 인기가 높다. R은 일반적인 데이터 처리를 위한 뛰어난 기능이 있고, 간단한 코딩으로 표, 차트, 지도 등 다양한 시각화 자료를 쉽게 만들어 내며, 웹을 통한 정보 추출과 인공지능 구현을 위한 손쉬운 기능 등을 제공하고 있어 배울수록 흥미가 커질 것이다.
이 책은 R을 통해 데이터 활용에 대한 흥미와 코딩에 대한 자신감을 높이는 계기가 되었으면 하는 기대로, 이전의 R로 배우는 코딩 시리즈를 최신 환경의 변화에 따라 전면 개편한 것이다. 특히, 처음 데이터를 다루는 입문자를 위해 R의 기초 문법과 여러 흥미로운 주제를 쉽게 이해할 수 있도록 내용을 구성하였다.
Contents
PART 1 R의 시작
CHAPTER 1 데이터 활용과 R
1.1 제4차 산업혁명과 인공지능
1.2 빅데이터의 활용과 데이터 리터러시
1.3 데이터 분석 도구: R
CHAPTER 2 R의 시작
2.1 R 개발환경
2.2 R 설치와 시작
2.3 RStudio 설치와 시작
2.4 R 패키지
CHAPTER 3 데이터 구조
3.1 데이터 구조의 이해
3.2 벡터와 연산자
3.3 요인
3.4 배열과 행렬
3.5 리스트
3.6 데이터 프레임
연습문제
PART 2 시각화
CHAPTER 4 그래프
4.1 그래프의 활용과 유형
4.2 막대 그래프
4.3 선 그래프
4.4 산포도
4.5 원 그래프
4.6 히스토그램
4.7 박스 플롯
연습문제
응용문제1: CDNow의 거래 데이터 분포 분석
응용문제2: 강의 길이에 대한 분포 분석
CHAPTER 5 애니메이션
5.1 애니메이션 개요
5.2 그래프 애니메이션: 막대 그래프
5.3 그래프 애니메이션: 산포도
5.4 그래프 애니메이션: 선 그래프
5.5 그래프 애니메이션: 시계열 데이터
5.6 그림 애니메이션: 양궁
연습문제
응용문제1: 애니메이션 그래프
응용문제2: 포물선으로 날아가는 화살
응용문제3: 당구공 굴리기
CHAPTER 6 지도
6.1 지도 개요
6.2 지형정보 지도
6.3 지형정보 지도를 이용한 지진 분포 파악
6.4 우리나라 행정경계 지도
6.5 행정경계 지도를 이용한 국내 지진 분포 파악
연습문제
응용문제1: 지역별 미세먼지 분포
응용문제2: 지역별 코로나 확진자 수 분포
PART 3 데이터 수집과 전처리
CHAPTER 7 웹스크래핑
7.1 웹스크래핑 개요
7.2 DOM의 이해
7.3 웹스크래핑의 기본원리
7.4 웹스크래핑 응용
연습문제
응용문제1: 지역별 미세먼지 추출
응용문제2: 지역별 코로나 확진자 수 추출
CHAPTER 8 공공 데이터 활용
8.1 공공데이터 포탈 개요
8.2 오픈 API 인증키 신청: 미세먼지 정보
8.3 미세먼지 농도의 시간대별 그래프 비교
8.4 지역별 미세먼지 농도의 지도 분포
연습문제
응용문제: 일별 미세먼지 발생 현황 조회
CHAPTER 9 네이버 오픈 API
9.1 네이버 오픈 API 개요
9.2 네이버 오픈 API 기본사항
9.3 네이버 정보검색 API 키 발급받기
9.4 뉴스 검색 및 데이터 정제
연습문제
응용문제: 블로그 검색
CHAPTER 10 데이터 전처리
10.1 데이터 전처리 개요
10.2 데이터 프로파일링
10.3 데이터 정제
10.4 데이터 통합
연습문제
응용문제1: adult 데이터 세트의 프로파일링
응용문제2: 시뮬레이션 데이터의 정제
PART 4 시뮬레이션과 데이터 분석
CHAPTER 11 시뮬레이션
11.1 시뮬레이션 개요
11.2 표본추출과 난수
11.3 동전 던지기
11.4 원주율 구하기
11.5 회귀선 구하기
연습문제
응용문제1: 동전 2개 던지기
응용문제2: 시행횟수에 따른 원주율의 변화
응용문제3: 회귀선 구하기
CHAPTER 12 네트워크 분석
12.1 네트워크 분석의 개요
12.2 네트워크 분석 지표
12.3 네트워크 유형별 지표 분석
12.4 페이스북 사용자의 네트워크 분석
연습문제
응용문제1: 천체물리학자의 협업네트워크 분석
응용문제2: 이메일 네트워크 분석
CHAPTER 13 인공신경망과 딥러닝의 이해
13.1 인공지능과 인공신경망 개요
13.2 인공신경망의 기본원리
13.3 선형 회귀분석의 예
13.4 비선형 회귀분석의 예
연습문제
응용문제1: 시뮬레이션 데이터를 이용한 선형 회귀분석
응용문제2: 시뮬레이션 데이터를 이용한 비선형 회귀분석
부록
부록1: R과 RStudio 설치(2장 참조)
부록2: graphics 패키지를 이용한 그래프(4장 참조)
부록3: 네트워크 분석(12장 참조)
부록4: 인공신경망을 이용한 분류문제(13장 참조)
Author
장용식,최진호
서강대학교 이학사, POSTECH 이학석사, KAIST에서 경영공학 박사 학위를 취득하였고, 현재 한신대학교 IT경영학과 교수로 재직 중이다. POSCO ICT(전 POSDATA)에서 MIS 연구 및 개발 경험이 있으며, 지능정보 시스템 분야의 다수 국내외 연구 논문을 발표하였고, 안드로이드 앱, JSP 웹, R과 파이썬 기반 데이터 분석 관련 저서를 출판하였다. 현재 사물인터넷과 데이터 분석 기반 지능정보시스템 연구 개발에 관심을 두고 있다.
서강대학교 이학사, POSTECH 이학석사, KAIST에서 경영공학 박사 학위를 취득하였고, 현재 한신대학교 IT경영학과 교수로 재직 중이다. POSCO ICT(전 POSDATA)에서 MIS 연구 및 개발 경험이 있으며, 지능정보 시스템 분야의 다수 국내외 연구 논문을 발표하였고, 안드로이드 앱, JSP 웹, R과 파이썬 기반 데이터 분석 관련 저서를 출판하였다. 현재 사물인터넷과 데이터 분석 기반 지능정보시스템 연구 개발에 관심을 두고 있다.