저자들은 HR 운영 패러다임이 급격하게 바뀌고 있는 현 상황에서 감이나 관행이 아닌 팩트에 기반한 HR이 되기 위해서는 오렌지 같은 분석 툴 활용이 필수적이라고 생각하였다. 그리고 이러한 도구를 어떻게 활용하는 것이 필요한지를 소개하는 것이 HR 부문의 역량 제고에도 도움이 된다고 판단하여 이 책을 집필하게 되었다. 본 저서는 피플 애널리틱스를 실행하는 사람들이 실질적/주도적으로 분석 모델을 설정하고 데이터를 분석하여 의사결정에 의미 있는 시사점을 뽑을 수 있는 역량을 확보할 수 있도록 도움을 주는 데 그 목적이 있다. 사람과 관련한 다양한 데이터 분석을 통해, 경영진이 궁금해하는 질문에 대한 분석적이고 설득력 있는 답을 모색함으로써 인적자원 운영의 효과성을 높이고자 하는 것이다.
본 저서는 크게 4개의 파트로 구성되어 있다. 첫 번째 파트는 피플 애널리틱스의 전반적인 개요, 필요성 및 실행 단계에 대해서 언급하였다. 두 번째 파트는 피플 애널리틱스를 실행하기 위해 이해가 필요한 핵심 사항들을 정리하였다. 본 저서의 가장 중요한 부분이라고 생각되는 세 번째 파트는 실제 데이터를 가지고 피플 애널리틱스를 실행해보는 사례로 구성되어 있다. 쉽게 따라할 수 있도록 단계별로 오렌지를 작동하는 방법과 의미를 설명하였다. 마지막 네 번째 파트는 향후 피플 애널리틱스의 과제에 대해 간략하게 이야기하고 있다.
Contents
들어가기 전에 ⅱ
사례 데이터 활용 방법 ⅵ
PART 01 인공지능과 HR의 연계:피플 애널리틱스
01 HR 의사결정, 분석이냐 직관이냐? 3
02 왜 지금 피플 애널리틱스인가? 10
03 피플 애널리틱스의 실행 단계 20
PART 02 피플 애널리틱스 실행을 위해알아야 할 것들
01 인공지능은 어떻게 일을 하는가? 31
02 인공지능이 잘 해결할 수 있는 영역은? 40
03 인공지능이 일을 잘했다는 것을 어떻게 알 수 있을까? 46
04 인공지능에서 활용하는 알고리즘은? 54
05 인공지능 모델의 성능을 어떻게 고도화할까? 69
PART 03 AI 도구 오렌지(Orange)를 활용한 분석 실행하기
오렌지 설치하기 83
사례 1 퇴직자 예측: 누가 왜 회사를 떠나는가? 86
사례 2 HR과 조직 성과: HR을 잘하면 성과가 좋을까? 146
사례 3 구성원 개인에게 적합한 교육 과정은? 183
사례 4 우리의 채용 대상자는 누구인가? 219
사례 5 Kaggle Competitions: 타이타닉, 주택 가격 250
PART 04 피플 애널리틱스의 미래 과제
01 데이터와 친해지기 295
02 향후 피플 애널리틱스 실행의 주요 포인트 300
참고 사이트 및 자료 304
사례 데이터 활용 방법
사례에 사용되는 데이터 파일은 출판사 홈페이지(www.pybook.co.kr) 도서자료실에서 다운로드할 수 있다.
사례에 활용할 파일은 사례별 폴더로 나뉘어져 있다. 사례 데이터의 구성은 다음과 같다.
● 사례 1 폴더
train: 퇴직자 파악을 위한 학습 데이터
test: 향후 퇴직자 예측을 위한 테스트 데이터
train_Involvement: 재직자 직무 몰입 분석을 위한 데이터
● 사례 2 폴더
Case2_Analysis_Basic: HRM과 조직 성과 관계 파악을 위한 학습 데이터
Case2_Analysis_Test: HRM을 통한 조직 성과 예측을 위한 테스트 데이터
Case2_Analysis_prediction: 예측치와 실제치의 오차 분석 결과
● 사례 3 폴더
employee_course_ratings: 구성원 ID, 과목 ID, 구성원 평가 점수 등의 데이터
course_names: 과목 ID와 과목명 데이터
employee_names: 구성원 ID, 구성원 이름 데이터
Popular_Course_Deriving: 인기 과목 도출을 위한 코딩 내용
Index_Adjusting: 인덱스 조정을 위한 코딩 내용
● 사례 4 폴더
aug_train: 채용 대상자 파악을 위한 학습 데이터
aug_test: 채용 데이터 예측을 위한 테스트 데이터
● 사례 5 폴더: 1_타이타닉
train: 생존자 파악을 위한 학습 데이터
train_cabin_regroup: train 데이터 중 cabin 변수를 조정한 데이터
test: 생존자 예측 시 활용할 테스트 데이터
test_cabin_regroup: test 데이터 중 cabin 변수를 조정한 데이터
gender_submission: 예측한 결과의 제출 형식을 보여주는 파일
● 사례 5 폴더: 2_주택가격
train: 주택가격 예측을 위한 학습 데이터
train_Modify: train 데이터의 결측값 형식을 바꾼 데이터
test: 주택가격 예측할 때 활용하는 테스트 데이터
test_Modify: test 데이터의 결측값 형식을 바꾼 데이터
sample_submission: 예측한 결과의 제출 형식을 보여주는 파일
data_description: 변수의 의미를 설명하는 텍스트 파일
Author
김범열,박철용
연세대학교에서 경영학 학사/석사/박사 학위를 받았다. LG경제연구원(현 경영연구원)에서 30년 넘게 주요 기업 조직설계, 평가/보상 시스템 구축, R&D 운영 체계 수립, 기업 비전 및 조직문화 구축 등 조직 운영의 효과성 제고를 위한 다양한 프로젝트 및 연구를 수행하였다. 또한 LG인화원 MBA HR 과정, 신임 임원 과정 등 다양한 과정에서 강의 수행과 기고 활동도 하였다. 인사혁신처 자체평가위원회/정책자문위원회 위원, 국가과학기술심의회 기초기반전문위원회 위원, 다목적 방사광가속기 구축사업 추진위원회 위원 등을 역임하였다. 현재는 퇴직하여 관심 있는 이슈에 대해 읽고 쓰는 일을 하고 있다.
연세대학교에서 경영학 학사/석사/박사 학위를 받았다. LG경제연구원(현 경영연구원)에서 30년 넘게 주요 기업 조직설계, 평가/보상 시스템 구축, R&D 운영 체계 수립, 기업 비전 및 조직문화 구축 등 조직 운영의 효과성 제고를 위한 다양한 프로젝트 및 연구를 수행하였다. 또한 LG인화원 MBA HR 과정, 신임 임원 과정 등 다양한 과정에서 강의 수행과 기고 활동도 하였다. 인사혁신처 자체평가위원회/정책자문위원회 위원, 국가과학기술심의회 기초기반전문위원회 위원, 다목적 방사광가속기 구축사업 추진위원회 위원 등을 역임하였다. 현재는 퇴직하여 관심 있는 이슈에 대해 읽고 쓰는 일을 하고 있다.