데이터 과학자의 가설 사고

종이와 연필로 익히는 데이터 분석
$24.15
SKU
9791165922566
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Fri 12/6 - Thu 12/12 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 12/3 - Thu 12/5 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2024/02/08
Pages/Weight/Size 152*225*20mm
ISBN 9791165922566
Categories 자연과학
Description
“프로그래밍 용어를 사용하지 않고, 데이터 과학자의 사고를 배운다.”

데이터를 읽고 분석하는 능력은 누구나 익혀야 할 기본 소양이 되었습니다. 하지만 파이썬, R과 같은 프로그래밍 언어 때문에 공부를 포기하기도 합니다. 이 책은 복잡한 계산, 엑셀, 프로그래밍 언어를 사용하지 않고, 종이와 연필만으로 데이터 과학자의 사고를 알려줍니다. 데이터 기본 개념을 쉽게 이해하고, 40개의 퀴즈를 풀면서 데이터 과학자 사고 과정을 직접 체험해 보시기 바랍니다.
Contents
들어가며
저자 소개
베타리더
이 책을 활용하는 방법

제1장 디지털 시대에 필요한 데이터 리터러시

1-1. 디지털 시대의 도래
DX 시대의 빅데이터의 역할
Society 5.0의 실현

1-2. 데이터 리터러시는 미래의 직장인에게 필수 스킬
디지털 시대의 「읽기·쓰기·셈하기」 같은 소양
모든 대학생·고등학생이 배우는 데이터 리터러시
신입사원이 더 뛰어난 데이터 리터러시
column: 모든 직장인이 익혀야 할 DX 리터러시

1-3. 데이터 리터러시를 익히자
직장인이 익혀야 할 데이터 리터러시
column: 데이터 과학자란?

제2장 데이터를 읽는 힘을 기른다

2-1. 생각하면서 데이터를 읽자!
퀴즈1 : 데이터를 목적에 맞게 보는 방법을 배운다
퀴즈2 : 데이터의 특징과 경향을 파악하는 방법을 배운다
퀴즈3 : 데이터에서 착안점을 찾는 방법을 배운다

2-2. 전체의 경향을 파악하자!
데이터의 대푯값 : 평균값·최빈값·중앙값
퀴즈4 : 평균값·최빈값·중앙값 산출 방법을 배운다
퀴즈5 : 대푯값과 데이터 분포의 관계를 배운다
데이터 분포를 확인한다
column: 히스토그램의 폭
실제 사회에서는 평균값=최빈값이 아닌 경우가 많다
일본 국민의 대부분은 552만 3천 엔의 소득이 있다?
대부분의 세대는 1,791만 엔을 저축해 놓았다?

2-3. 데이터의 세부 내용을 확인하자!
퀴즈6 : 상이값·이상값을 배운다
존재하지 않는 데이터(결측값)

2-4. 데이터의 관계성을 파악하자!
퀴즈7 : 두 개의 데이터의 관계성을 배운다
두 데이터의 관계성 : 상관
상관관계와 인과관계
퀴즈8 : 상관과 인과를 배운다
상관관계를 어떻게 볼 것인가?

제3장 데이터를 설명하는 힘을 기른다

3-1. 데이터를 시각화해보자!
퀴즈1 : 적절한 그래프 표현을 배운다
적절한 그래프 표현
column: 시계열 데이터를 시각화할 때는 꺾은선 그래프?
column: 데이터 과학자는 원 그래프를 쓰지 않는다?
퀴즈2 : 부적절한 그래프 표현을 배운다

3-2. 데이터를 비교한다는 것은?
퀴즈3 : 적절한 비교 대상 설정 방법을 배운다
적절한 비교 대상 설정
데이터를 비교하는 4가지 시점
퀴즈4 : 어떤 시점과의 비교 방법을 배운다
퀴즈5 : 타자와의 비교 방법을 배운다
곱셈에 의한 분해
덧셈에 의한 분해

3-3. 데이터에서 과제를 찾아낸다
퀴즈6~9 : 데이터에서 과제를 찾아내는 순서를 배운다
매출 데이터에서 과제를 찾아내는 순서
포인트 3배 DAY의 매출 증가 효과
운동회의 매출 증가 효과

제4장 데이터를 분류하는 힘을 기른다

4-1. 특징이 비슷한 데이터를 그룹으로 만들자!
퀴즈1 : 데이터를 그룹으로 나누는 의미를 배운다
데이터를 그룹으로 나누는 의미
그룹별 해결 방안을 생각한다
column: 고객의 잠재적인 니즈를 파악한다
데이터의 특징이 비슷하다는 판단
퀴즈2 : 데이터 사이의 거리를 배운다
퀴즈3 : 거리를 계산할 때의 주의사항을 배운다
column: 스케일이 다른 데이터

4-2. 목적에 맞게 데이터를 분류하자!
퀴즈4 : 데이터를 분류하기 위한 관점을 배운다
데이터 분류의 어려움

4-3. 데이터를 기계적으로 분류하자!
퀴즈5 : 그룹의 중심을 배운다
데이터를 분류하는 방법 : k-means법
column: k-means법의 초깃값 문제

4-4. 데이터 분류를 체험하자!
퀴즈6~8 : 데이터를 분류하는 순서를 배운다

제5장 데이터에서 법칙을 발견하는 힘을 기른다

5-1. 데이터에서 법칙을 발견한다!
퀴즈1 : 데이터에서 법칙을 발견하는 방법을 배운다
퀴즈2 : 발견한 법칙을 적용하는 방법을 배운다
■ 판별 문제의 특징

5-2. 판별 문제를 푸는 의사결정 트리 모델
퀴즈3 : 의사결정 트리 모델을 만드는 방법을 배운다
의사결정 트리 모델을 성장시킨다
퀴즈4 : 의사결정 트리 모델을 이용해 결과를 추측하는 방법을 배운다

5-3. 판별 문제의 정밀도를 평가해보자!
퀴즈5 : 판별 문제의 평가 방법을 배운다
2×2칸 크로스 표로 정리한다
판별 문제의 정밀도를 평가하는
적합률과 재현율 가운데 어느 쪽이 중요할까?

5-4. 의사결정 트리 모델을 활용해보자!
퀴즈6 : 데이터에서 법칙을 발견해서 판별 문제를 푸는 순서를 배운다

제6장 데이터를 보고 예측하는 힘을 기른다

6-1. 수치 데이터의 관계성을 확인하자!
퀴즈1 : 수치 데이터의 관계성을 확인하는 방법을 배운다
퀴즈2 : 수치 데이터의 관계성이 좁혀지지 않을 때의 대처 방법을 배운다
수치 이외의 데이터와의 관계성을 확인한다
퀴즈3 : 수치 이외의 데이터와의 관계성을 확인하는 방법을 배운다

6-2. 내삽과 외삽에 주의하자!
퀴즈4 : 데이터를 보고 예측할 때 주의해야 할 내삽과 외삽을 배운다
데이터를 보고 찾아낸 관계성을 적용할 수 있는 경우와 적용할 수 없는 경우
외삽에 의한 예측 예

6-3. 데이터의 치우침에 주의하자!
퀴즈5 : 데이터에 치우침이 있을 때의 주의사항을 배운다
데이터에 치우침이 없는지 확인한다
식료품점의 캠페인 실패

6-4. 시간 변화에 주목하자!
퀴즈6 : 시계열 데이터의 트렌드와 주기성을 배운다
시계열 데이터에서는 다양한 변동을 발견할 수 있다

6-5. 데이터를 보고 예측하자!
퀴즈7~9 : 데이터를 보고 예측하는 순서를 배운다

제7장 업무에서 데이터 리터러시를 활용한다

7-1. 데이터를 읽는 힘을 활용한다
데이터를 읽는 힘을 활용한 사례 : 앙케트 조사
데이터를 읽는 힘을 활용한 사례 : 상권 분석

7-2. 데이터를 설명하는 힘을 활용한다
데이터를 설명하는 힘을 활용한 사례 : 매출 분석
데이터를 설명하는 힘을 활용한 사례 : 품질 관리

7-3. 데이터를 분류하는 힘을 활용한다
데이터를 분류하는 힘을 활용한 사례 : 고객 세그먼테이션
데이터를 분류하는 힘을 활용한 사례 : 점포 뭉치기

7-4. 데이터에서 법칙을 발견하는 힘을 활용한다
데이터에서 법칙을 발견하는 힘을 활용한 사례 : 설비 이상
데이터에서 법칙을 발견하는 힘을 활용한 사례 : 고객 이탈

7-5. 데이터를 보고 예측하는 힘을 활용한다
데이터를 보고 예측하는 힘을 활용한 사례 : 상품 수요 예측
데이터를 보고 예측하는 힘을 활용한 사례 : 이용객 수 예측

맺는 말
참고문헌
Author
고추 다이스케,김지윤
일본 전기 주식회사 AI·애널리틱스 사업통괄부 수석 데이터 과학자.
2003년 4월 일본 전기 주식회사 입사. 유통·서비스업을 중심으로 분석 컨설팅을 제시하였고, 2016년 NEC프로페셔널 인정 제도 ‘시니어 데이터 애널리스트’ 초대 인정자가 되었다. 2018년 NEC그룹의 AI인재 육성을 통괄하는 AI 인재 육성 센터의 센터장으로 취임하여 AI인재 육성에 힘썼다. 2019년 AI인재를 육성하기 위한 NEC아카데미 for AI를 개설해 학장을 지냈다. 저서로는 『AI 인재를 기르는 방법』, 『교양으로서의 데이터 과학』, 『데이터 과학자 검정공식 레퍼런스북』이 있다.
일본 전기 주식회사 AI·애널리틱스 사업통괄부 수석 데이터 과학자.
2003년 4월 일본 전기 주식회사 입사. 유통·서비스업을 중심으로 분석 컨설팅을 제시하였고, 2016년 NEC프로페셔널 인정 제도 ‘시니어 데이터 애널리스트’ 초대 인정자가 되었다. 2018년 NEC그룹의 AI인재 육성을 통괄하는 AI 인재 육성 센터의 센터장으로 취임하여 AI인재 육성에 힘썼다. 2019년 AI인재를 육성하기 위한 NEC아카데미 for AI를 개설해 학장을 지냈다. 저서로는 『AI 인재를 기르는 방법』, 『교양으로서의 데이터 과학』, 『데이터 과학자 검정공식 레퍼런스북』이 있다.