무엇보다 이 책은 금융 분야에서 데이터를 수집하고 분석하는 논문이나 보고서를 작성하 고자 하는 사람들에게 필요한 책이다. CDS 프리미엄, TED 스프레드, VIX 지수 등 다양한 금융지표들이 한국경제, 매일경제, 머니투데이 등 주요 일간지에서 매일 거론되고 있는데, 정작 우리 학생들은 경영학 전공자나 경제학 전공자나 아니면 타 사회과학전공자 할 것 없이 도무지 이해할 수 없고 이해하지 않으려 한다. 답답한 마음에 필자가 개설한 글로벌재무 수업에서 어려운 교과서를 대신하여 한국경제 신문읽기를 목적으로 교과내용을 수정하여 가르쳐보았다. 그 결과 아무래도 학생들에게는 보다 손쉽게 경제 일간지를 볼 수 있는 기회를 마련해 줄 수 있었다. 이번에는 다음 단계로 넘어가 전공과 상관없이 학생들이 손쉽게 금융 지표들을 이해하고 일간지를 읽으면서 비판적으로 토론하고 잘못된 기사 내용에 대해서도 지적할 수 있는 학습기회를 마련해주고 싶다. 이에 이 책을 집필하게 되었다. 경영경제통계를 배운 학생들은 이 책을 통해 금융 분야에서 금융지표를 스스로 수집하고 이를 분석 및 해석 하는 역량을 키울 수 있다. 이 책의 내용 학습을 통해 학생들은 DB 전문회사가 제공하는 전용선을 사용하지 않고도 주요 금융지표를 수집할 수 있는 능력을 갖추게 된다. 무엇보다 상경계열 전공자들이 무조건적으로 컴퓨터사이언스 전공을 쫓아가지 않고 자신의 전공을 살려 금융 분야에서 분석가가 될 수 있는 길을 열어주고 싶었다. 상경계열 전공자들은 컴공 기술개발자보다는 금융분석가가 더 잘 어울린다. 금융 IT 교육에도 교재로 사용될 수 있게끔 기초 금융지식을 다루고 있다
Contents
1. R 설치
1) RStudio 설치하기
2) 자바(Java) 설치하기
2. 기초 명령어
2.1 데이터 추출과 저장
1) 작업디렉토리 확인 및 지정하기
2) 패키지를 불러와서 예제코드 실행하기
3) 저장된 기초자료 불러오기
4) 인터넷 사이트에서 공개된 파일 불러오기
5) 웹 사이트에서 데이터 추출하기
6) 빅데이터 빠르게 불러오기
7) 불러온 데이터 자료의 상세 내용 열람하기: 아이콘
8) 스크립트 불러오기(깨진 스크립트 해결)
9) 파일 저장하기
2.2 데이터 전처리
1) 요약
2) 표준화 하기
3) 벡터로부터 데이터 프레임 작성하기 (행렬좌표 데이터와 같은 양식)
4) 특수문자 제거하기
5) 변수 삭제하기 & 정리하기
6) 자료 병합하기
7) 특정한 변수만 따로 저장하기
8) 파생변수 만들기
9) 이진(1과 0값) 변수 만들기
10) 소수점 자리수 조정하기
11) 래그 변수 만들기
12) 변수명 바꾸기
13) 자료의 속성 변환하기
14) 날짜 다루기
15) 결측치 채우기
16) 오류 발생 시 예외처리하기
17) 행렬 전환하기
Chapter 2 기초 시각화
1. 일반 그래프
1) 그래프 그리는 도화지
2) 데이터 셋 전체 변수들간 단순관계 살펴 보기
3) 사사분면 구분을 위한 그래프 추가 하기
4) 두 변수 간 회귀직선 그래프 추가 하기
5) 그래픽 모수와 그래프 모양 바꾸기
6) 그래프 축 형태 바꾸기
7) 각 객체의 라벨 달아주기
2. 금융 전문 그래프
1) 시계열 차트
2) 바 차트
3) 캔들 스틱 차트
4) 하이킨 아시 차트
5) 추가 차팅 작업
Chapter3 금융 빅데이터 수집분석
1. 기초
1.1 데이터 수집 방법: 일반 크롤링
1) 자료 긁어 모으기: 텍스트 자료
2) 자료 긁어 모으기: 리스트 자료
1.2 데이터 수집 방법: 동적 크롤링
1) 셀레니움(RSelenium)으로 동적 크롤링하기
2) 셀레니움(RSelenium) 설치하기
3) 셀레니움(RSelenium) 패키지 설치하기
1.3 자료 빗질하기: 데이터 전처리
1) 데이터 추출: 문자열
2) 문자열 추출: url로부터 추출
3) 정규표현식으로 패턴 추출
2. 기초 시각화: 빅데이터 253
1) 낱말구름: 워드 클라우드(기초)
2) 낱말구름: 워드 클라우드(고급)
3. 중급
3.1 텍스트 크롤링: 주요 신문 기사 및 평가 자료
1) 네이버 뉴스 크롤링
2) 주요 신문 크롤링
3) 특정면 크롤링하기: 강원일보 ‘경제’면 크롤링
3.2 데이터 크롤링: 주요 금융자료
1) 금융데이터 크롤링
2) Investing.com 데이터 크롤링
3) worldgovernmentbonds.com 데이터 크롤링: CDS 프리미엄
4) 금융시장 주요 지표 크롤링: 금융시장 불안 지표
Author
양오석,우영목,양윤호
서울대학교 경영대학에서 경영학 박사학위(국제경영전략 및 국제재무 전공)를 마치고 현재 강원대학교 경영대학에 재직 중이다. 영국 University of Leeds에서 국제경영 MBA를 마쳤고, University of Warwick에서 박사학위(국제정치경제 전공, 정치학 박사)를 마쳤다. “은행의 국제화와 성과 간 관계에 대한 탐색적 고찰: 동태적 내부화 우위 관점에서”(2011)로 2011년 한국국제경영학회로부터 Best Paper 상을 받았고, “The Mediating Effect of Creativity on Knowledge Management in Multinational Firms”(2017)로 한국지식경영학회 우수논문상을 받았다. 그 외 “The Market Premium of Foreign Exchange Exposure in the Use of Derivatives: Evidence from Korea”(2017)로 한국산업경영학회 우수발표논문상을, “지식공유-지식창출-기업성과 간 관계에서 나타나는 지식유형의 중요도: 중국에 진출한 글로벌 기업 본사-해외자회사 사례“(2017)로 한국국제경영관리학회 우수논문상을, “환노출 결정요인에 관한 블랙박스 열기: 신흥국 글로벌은행의 영업헤지와 불확실성(2019)”으로 한국경영컨설팅학회 최우수논문상을, “글로벌 시장 맥주 소비자의 문화적 가치에 따른 구매 행위 연구: 아시아 5개국을 중심으로(2020)”로 한국국제경영학회?한국국제경영관리학회 공동학술대회(2020년)에서 우수발표논문상을 받았다. 이 책에서 활용되고 있는 일부 데이터는 이들 논문에 활용된 실제 데이터들이다.
서울대학교 경영대학에서 경영학 박사학위(국제경영전략 및 국제재무 전공)를 마치고 현재 강원대학교 경영대학에 재직 중이다. 영국 University of Leeds에서 국제경영 MBA를 마쳤고, University of Warwick에서 박사학위(국제정치경제 전공, 정치학 박사)를 마쳤다. “은행의 국제화와 성과 간 관계에 대한 탐색적 고찰: 동태적 내부화 우위 관점에서”(2011)로 2011년 한국국제경영학회로부터 Best Paper 상을 받았고, “The Mediating Effect of Creativity on Knowledge Management in Multinational Firms”(2017)로 한국지식경영학회 우수논문상을 받았다. 그 외 “The Market Premium of Foreign Exchange Exposure in the Use of Derivatives: Evidence from Korea”(2017)로 한국산업경영학회 우수발표논문상을, “지식공유-지식창출-기업성과 간 관계에서 나타나는 지식유형의 중요도: 중국에 진출한 글로벌 기업 본사-해외자회사 사례“(2017)로 한국국제경영관리학회 우수논문상을, “환노출 결정요인에 관한 블랙박스 열기: 신흥국 글로벌은행의 영업헤지와 불확실성(2019)”으로 한국경영컨설팅학회 최우수논문상을, “글로벌 시장 맥주 소비자의 문화적 가치에 따른 구매 행위 연구: 아시아 5개국을 중심으로(2020)”로 한국국제경영학회?한국국제경영관리학회 공동학술대회(2020년)에서 우수발표논문상을 받았다. 이 책에서 활용되고 있는 일부 데이터는 이들 논문에 활용된 실제 데이터들이다.