인간과 인간의 의사소통이 언어로 이루어진다면, 인간과 AI의 의사소통은 ‘인문데이터’를 통하여 이루어진다. 우리는 컴퓨터 과학이나 자연언어처리를 위하여 숫자로 이루어진 표준 데이터 세트와 구별하기 위해서 인문데이터를 ‘인문학’의 범주로 분류하였다. 인문데이터는 인공지능 기술 발전이 인간의 가치와 윤리적 기준에 부합하도록 보장하는 기초적인 관점을 제공할 뿐만 아니라, AI가 사회문화적 맥락에 어떠한 영향을 미치는지 조명할 수 있다. 또한 AI 개발에 인간 중심적인 데이터의 속성과 정보를 제공하고, 나아가 AI가 인문학적 주제와 인간 사회에 대한 이해를 돕는 데 기여할 것으로 본다. 이를 통해 기술이 인간과 공감하면서 문화적으로 다양하게 인식되며, 윤리적으로 건전하게 개발될 수 있도록 하는 중추적인 연구 분야로 자리 잡을 것이다.
앞으로 AI가 감정 능력을 지니며 인간과 정서적으로 소통하기 위해서는 다양한 AI 인문데이터의 구축이 필요하다. 이 책에서 제시한 감정 데이터, 비윤리 데이터 등의 AI 인문데이터는 인간과 AI가 상호작용하기 위해서 인간의 감정, 윤리, 경험의 다면성, 복잡성 등을 고려하여 인간 주석자를 통해 구축되었으며, 한국인의 정서에 적합한 데이터를 구축했다는 점에서 의의가 있다.
Contents
머리말 ― 인문데이터로 인간 읽기
1장 들어가며
2장 인공지능 인문데이터
1. 인공지능 인문데이터의 정의
2. 인공지능 인문데이터의 특성
(1) 인문데이터의 속성
(2) 인문데이터 구축의 중요성
3장 인공지능 인문데이터 구축의 실제
1. 비윤리 텍스트 데이터
(1) AI 데이터 구축에서 비윤리 텍스트가 가지는 의미
(2) 비윤리 텍스트 말뭉치 구축 동향
(3) 비윤리 텍스트 말뭉치 구축의 실제
2. 감정 온톨로지 데이터
(1) 인공지능과 인간의 감정
(2) 감정 온톨로지 데이터 기획 및 설계
(3) 학문 영역별 감정 온톨로지 데이터 구축
4장 인공지능 인문데이터 분석의 실제
1. 어휘 데이터의 분석
(1) 24개 감정에 기반한 한국어 감정 어휘 사전
(2) 감정 어휘 사전 구축 절차
(3) 감정 어휘 사전을 활용한 감성 분석
2. 음성 데이터의 분석
(1) 제1차 중앙대학교 인문콘텐츠연구소 한국어 음성 감정 데이터베이스
(2) 제2차 중앙대학교 인문콘텐츠연구소 한국어 음성 감정 데이터베이스
(3) 딥러닝 기반 음성 감정 인식
3. 이미지 데이터의 분석
(1) 24개 한국인 감정 기반 얼굴 표정 인식 데이터 세트
(2) 관련 연구
(3) 데이터 세트의 구축
(4) 얼굴 표정 기반 감정 인식 기계학습 모델의 학습과 성능
(5) 결론
4. 인문데이터 구축의 한계와 의의
참고문헌
Author
강우규, 남영자, 정유남, 조희련
중앙대학교 인문콘텐츠연구소 HK+인공지능인문학사업단 HK 연구 교수이다. 중앙 대학교 국어 국문학과를 졸업하고, 같은 대학교 대학원에서 문학 박사 학위를 받았다. 현대의 대중 서사인 웹툰, 드라마, 영화 등의 문화 콘텐츠에 대한 관심을 가지고 연구를 진행하고 있고, 고전 서사의 텍스트 한정성 문제를 극복하기 위하여 인공 지능을 활용하는 융합 연구를 진행하고 있다. 논문으로는 「디지털 맵핑(Mapping)을 활용한 구운몽 연구 및 교육적 활용」, 「바리 이야기의 웹툰 수용 양상과
의미 고찰」, 「딥러닝을 활용한 경판 방각본 소설의 유형 고찰」 등이 있다.
중앙대학교 인문콘텐츠연구소 HK+인공지능인문학사업단 HK 연구 교수이다. 중앙 대학교 국어 국문학과를 졸업하고, 같은 대학교 대학원에서 문학 박사 학위를 받았다. 현대의 대중 서사인 웹툰, 드라마, 영화 등의 문화 콘텐츠에 대한 관심을 가지고 연구를 진행하고 있고, 고전 서사의 텍스트 한정성 문제를 극복하기 위하여 인공 지능을 활용하는 융합 연구를 진행하고 있다. 논문으로는 「디지털 맵핑(Mapping)을 활용한 구운몽 연구 및 교육적 활용」, 「바리 이야기의 웹툰 수용 양상과
의미 고찰」, 「딥러닝을 활용한 경판 방각본 소설의 유형 고찰」 등이 있다.