인터넷이 고도로 발전한 오늘날, 우리는 알게 모르게 다양한 데이터에 둘러싸여서 일상생활을 보내고 있다. 이런 사회를 책에서는 ‘데이터화 사회’라 칭하고 있지만, 이는 데이터가 없으면 흔한 일상생활을 보내기 어렵다는 것을 의미한다. 이처럼 현대 사회에서는 ‘데이터’의 가치가 올라가고 있기에 데이터를 다루는 과학이 생기는 것은 당연한 일이며, 이러한 과학을 데이터 사이언스라고 한다. 우리가 알아야 할 데이터 사이언스의 기본 개요와 사고방식을 쉽게 설명하기 위해 책에 일러스트와 도표를 적극적으로 활용하였다. 어려운 수식 없이 이해할 수 있도록 만들었기 때문에 데이터 사이언스에 입문하고자 한다면, 이 책으로 시작하길 권한다.
Contents
들어가기 앞서
저자 소개
역자의 말
역자 소개
제1장 데이터 사이언스란? ㅡ 데이터와 사회 ㅡ
1-1 데이터와 사회
1 우리의 일상 생활과 데이터
2 다가온 데이터화 사회
1-2 데이터 사이언스와 데이터 사이언티스트
1 데이터 사이언스는 다양한 정의가 가능한 과학
2 데이터 해석의 4가지 공정
3 데이터 사이언티스트의 업무
제2장 데이터를 알자 ㅡ 데이터 해석의 제1공정 ㅡ
2-1 데이터 타입을 분류한다
1 조사 데이터와 비조사 데이터
2 빅데이터와 비(非)빅데이터
2-2 데이터 특징을 잡아라
1 변수와 데이터
2 양적 데이터와 질적 데이터
3 개표(個票) 데이터와 집계 데이터
2-3 데이터를 준비한다
1 조사에 의한 데이터 수집
2 웹에서 데이터 수집
2-4 데이터를 정형화한다
1 데이터를 정형화하는 것은
2 완전 데이터와 불완전 데이터
3 이상치
4 선택 편향(Bais)
제3장 데이터 읽기ㅡ 데이터 해석의 제2공정 ㅡ
3-1 데이터를 집계하고 가시화한다
1 데이터 분포를 파악한다
2 다양한 그래프
3-2 데이터 정보를 요약한다
1 데이터 정보를 얻는다
2 1변수 데이터의 특징을 알다
3 2변수의 관계를 발견한다
4 다차원 데이터의 관계를 파악한다
5 결론을 일반화하기 위해서
제4장 데이터를 분류하다ㅡ 데이터 해석의 제3공정 ㅡ
4-1 비슷한 것들을 분류한다
1 클러스터 분석의 사고방식
2 클러스터 분석으로 분류한다
4-2 복수 변수를 합성한다
1 주성분 분석의 사고방식
2 주성분 분석으로 분류한다
4-3 질적 데이터를 분석하다
1 수량화Ⅲ류의 사고방식
2 수량화Ⅲ류로 분석한다
제5장 데이터로부터 예측한다ㅡ 데이터 해석의 제4공정 ㅡ
5-1 데이터에 기반해서 예측한다
1 회귀분석의 사고방식
2 회귀분석으로 예측한다
5-2 예측의 질을 평가한다
1 다중회귀분석의 사고방식
2 좋은 회귀모델이란
3 다양한 회귀진단
5-3 질적 데이터를 예측한다
1 수량화Ⅰ류
2 로지스틱 회귀
제6장 데이터 윤리를 생각하다ㅡ 데이터화 사회에 경종 ㅡ
6-1 데이터 윤리란
1 데이터 윤리와 데이터화 사회
2 정보 윤리의 4가지 원칙과 데이터 윤리의 규범 예
3 분석의 윤리
6-2 윤리 위반 사건집
1 디오반 사건
2 통계부정 사건
제7장 데이터 사이언스와 AIㅡ 빅데이터가 가져온 데이터 혁명 ㅡ
7-1 기계학습의 기본
1 기계학습ㆍ심층학습ㆍAI
2 데이터 프리퍼레이션
3 선택 알고리즘
4 파라미터 튜닝
5 모델 선택
7-2 뉴런 네트워크와 AI
1 AI와 데이터 사이언스의 관계
2 뉴런 네트워크란
3 뉴런 네트워크의 구성 요소
부록 데이터 사이언스를 체험하다
데이터 사이언스의 이해를 높이기 위한 참고 도서
찾아보기
Author
우와후지 이치로,박선필
시즈오카(?岡) 대학 인문사회과학부 교수. 전공은 통계학, 과학사(통계학사, 확률논사). 데이터 사이언스 관련 저서ㆍ번역으로 [デ?タサイエンス入門 ? Excelで?ぶ統計デ?タの見方ㆍ使い方ㆍ集め方] 옴사 (공저), [調査と分析のための統計 - 社?ㆍ??のデ?タサイエンス] 丸善(마루젠) (공저), [?式なしでわかるデ?タサイエンス-ビックデ?タ時代に必要なデ?タリテラシ?] 옴사 (번역) 등
시즈오카(?岡) 대학 인문사회과학부 교수. 전공은 통계학, 과학사(통계학사, 확률논사). 데이터 사이언스 관련 저서ㆍ번역으로 [デ?タサイエンス入門 ? Excelで?ぶ統計デ?タの見方ㆍ使い方ㆍ集め方] 옴사 (공저), [調査と分析のための統計 - 社?ㆍ??のデ?タサイエンス] 丸善(마루젠) (공저), [?式なしでわかるデ?タサイエンス-ビックデ?タ時代に必要なデ?タリテラシ?] 옴사 (번역) 등