R을 이용한 머신러닝과 텍스트마이닝

$29.90
SKU
9788959729579
+ Wish
[Free shipping over $100]

Standard Shipping estimated by Fri 12/6 - Thu 12/12 (주문일로부 10-14 영업일)

Express Shipping estimated by Tue 12/3 - Thu 12/5 (주문일로부 7-9 영업일)

* 안내되는 배송 완료 예상일은 유통사/배송사의 상황에 따라 예고 없이 변동될 수 있습니다.
Publication Date 2023/04/15
Pages/Weight/Size 190*240*30mm
ISBN 9788959729579
Categories IT 모바일 > 컴퓨터 공학
Description
머신러닝은 오늘날 생활의 한 부분으로 여겨질 만큼 폭넓게 활용되고 있습니다. 질병 진단부터 자율주행 자동차에 이르기까지 이미 우리 생활 속 깊숙이 자리잡고 있습니다. 기업에서는 머신러닝을 활용하여 과거에는 할 수 없었던 새로운 사업 기회를 포착하고 예기치 않은 위험에 선제적으로 대응할 수 있는 다양한 수단을 개발하고 있습니다. 또한 디지털화된 텍스트 데이터의 급격한 증가로 인해 그로부터 의미 있는 정보를 추출하기 위한 텍스트마이닝의 필요성도 꾸준히 커지고 있습니다. 따라서 머신러닝과 이를 바탕으로 한 텍스트마이닝에 대한 이해는 정도의 차이는 있지만 이제 데이터분석 전문가뿐만 아니라 조직구성원 누구에게나 필요한 일이 되었습니다. 하지만 데이터분석 분야에 막 발을 들여놓은 초보자 입장에서 머신러닝과 텍스트마이닝 기법을 이해하고 활용하는 것은 여전히 쉽사리 접근할 수 없는 어려운 과제임에 틀림없습니다.

이 책은 머신러닝 및 텍스트마이닝 입문자에게 가능하면 쉽게 주요 분석기법을 소개하는 것을 목적으로 하고 있습니다. 이 책은 다음과 같은 특징을 갖습니다. 첫째, 가능한 수식의 사용 없이 분석기법을 설명하려고 노력하였습니다. 머신러닝 및 텍스트마이닝 알고리즘은 수많은 수학과 통계학 이론을 바탕으로 하고 있기 때문에 분석기법의 올바른 활용과 응용을 위해서는 알고리즘의 수학적 표현을 이해하는 것이 필수적일 수 있습니다. 하지만 수학적 배경 지식이 부족한 사람들에게 알고리즘을 수식만으로 설명하는 것은 오히려 분석기법을 이해하는 데 있어서 방해가 될 수 있습니다. 또한 업무나 연구에 분석기법을 단순 적용하려고 하는 사람들에게는 복잡한 수식 대신에 일상 언어로 알고리즘을 이해하는 것이 분석기법을 실무적으로 활용하는 데 있어서 더 유용할 수 있습니다. 둘째, 책에 소개된 분석기법은 모두 데이터분석 및 통계분석 프로그래밍 언어인 R을 이용하여 실습을 통해 확인해볼 수 있도록 하였습니다. R을 이용하여 단순히 분석기법을 적용하는 방법을 소개하는 데 그치지 않고 출력결과가 담고 있는 의미를 이론적 개념과 연계하여 설명하였습니다. 출력결과에 대한 깊이 있는 이해는 당면한 문제를 효과적으로 해결하고 나아가 다른 문제에 응용할 때에도 보탬이 될 것입니다. 셋째, R에 대한 기억을 새롭게 하려는 독자를 위해 R을 이용한 데이터전처리 방법을 부록에 포함하였습니다. 본문에서 다루는 다양한 분석기법을 학습하고 활용할 때 도움이 될 것으로 기대합니다.

이 책의 동영상 강의와 R 스크립트 코드는 다음 사이트에서 볼 수 있습니다.
- 동영상 강의: https://www.youtube.com/곽기영
- R 스크립트 코드: https://www.github.com/kykwahk
Contents
Chapter 01 머신러닝 개요

Chapter 02 나이브베이즈

2.1 분석기법 이해
2.2 사례: 의원 소속정당

Chapter 03 의사결정나무

3.1 분석기법 이해
3.2 사례: 유방암

Chapter 04 랜덤포레스트

4.1 분석기법 이해
4.2 사례: 유방암

Chapter 05 서포트벡터머신

5.1 분석기법 이해
5.2 사례: 꽃 종류
5.3 사례: 배우자 외도

Chapter 06 성능평가

6.1 성능평가 지표
6.2 민감도와 특이도
6.3 ROC곡선

Chapter 07 텍스트마이닝

7.1 텍스트 구조화
코퍼스
타이디-텍스트
문서-용어행렬
7.2 빈도분석
분석기법 이해
사례: 대통령 연설문
7.3 감성분석
분석기법 이해
사례: 트윗
7.4 분류분석
분석기법 이해
사례: 스팸 필터링
7.5 토픽모델링
분석기법 이해
사례: 뉴스 기사

〈부록〉 데이터전처리
A.1 분할-적용-결합
A.2 반복 적용
A.3 형태 변환
Author
곽기영
국민대학교 경영대학과 비즈니스IT전문대학원에 재직 중이다. 서울대학교 경영대학을 졸업하였으며 KAIST에서 석사 및 박사 학위를 취득하였다. 한국경영학회, 한국경영정보학회, 한국경영과학회, 한국지식경영학회, 한국지능정보시스템학회, 한국정보시스템학회, 디지털산업정보학회 등으로부터 논문상을 수상하였다. 소셜네트워크분석, R 기초와 활용, 웹 스크레이핑과 데이터분석 등의 저서를 출간하며, 통계 및 데이터분석 분야에서 활발한 저술 활동을 하고 있다. 삼성SDS에서 정부기관 및 기업들을 상대로 정보전략계획, 비즈니스 프로세스 리엔지니어링, e-비즈니스 등과 관련된 프로젝트를 수행하며 IT 컨설턴트로 재직한 경험이 있으며 CISA(Certified Information Systems Auditor), PMP(Project Management Professional), CGEIT(Certified in the Governance of Enterprise IT) 등의 국제자격을 보유하고 있다.
국민대학교 경영대학과 비즈니스IT전문대학원에 재직 중이다. 서울대학교 경영대학을 졸업하였으며 KAIST에서 석사 및 박사 학위를 취득하였다. 한국경영학회, 한국경영정보학회, 한국경영과학회, 한국지식경영학회, 한국지능정보시스템학회, 한국정보시스템학회, 디지털산업정보학회 등으로부터 논문상을 수상하였다. 소셜네트워크분석, R 기초와 활용, 웹 스크레이핑과 데이터분석 등의 저서를 출간하며, 통계 및 데이터분석 분야에서 활발한 저술 활동을 하고 있다. 삼성SDS에서 정부기관 및 기업들을 상대로 정보전략계획, 비즈니스 프로세스 리엔지니어링, e-비즈니스 등과 관련된 프로젝트를 수행하며 IT 컨설턴트로 재직한 경험이 있으며 CISA(Certified Information Systems Auditor), PMP(Project Management Professional), CGEIT(Certified in the Governance of Enterprise IT) 등의 국제자격을 보유하고 있다.