가짜 이미지·음성·영상을 만들어내는 AI 기술의 원리와 이를 구별하는 탐지 기술을 쉽게 설명한다. 생성형 AI의 구조, 활용 사례, 사회적 문제와 대응 방안까지 다뤄 균형 잡힌 이해를 돕는다.
Contents
일상으로 다가온 딥페이크
01 딥페이크의 역사 및 사회적 대처
02 딥러닝
03 잠재 공간을 이용한 멀티미디어 생성
04 인공지능을 이용한 멀티미디어 생성 과정
05 적대적 생성형 모델과 확산 모델
06 영상 딥페이크 탐지 방법
07 음성 딥페이크 탐지 방법
08 딥페이크 탐지의 어려움
09 딥페이크 탐지 성능 향상
10 딥페이크 탐지 연구 방향
Author
유하진
서울시립대학교 컴퓨터과학부 교수다. KAIST 전산학과에서 학사, 석사, 박사 학위(1997)를 받았다. 박사 학위 논문 제목은 “불균일 단위 신경 회로망과 퍼지전문가 시스템에 기반한 연속음성인식 시스템”이다. LG전자기술원에서 한국어음성인식기를 개발했다(1997∼2000). 벤처 기업 SL2(주)에서 연구소장으로 음성 인식 기술을 상업화했다(2000∼2002). 2002년 서울시립대학교 컴퓨터과학부 교수로 부임해 현재까지 화자 인식 등을 연구했고, 2014년부터 음성 딥페이크 탐지 연구를 진행했다. 국제적 챌린지 ASVspoof(automatic speaker verification spoofing and countermeasures challenge)에 여러 차례 팀으로 참가해 상위권의 성적을 얻었다. 한국음성학회와 한국음향학회에서 총무이사, 편집위원장 등을 역임했고, 우수논문상을 수상했다. 서울시립대학교 컴퓨터과학부장, 인공지능학과장, 교수학습연구센터장 등의 직을 수행했다. 옮긴 책으로 『루비 프로그래밍언어』(2012)가 있고, “AASIST: Audio anti-spoofing using integrated spectro-temporal graph attention networks” 등 100편 이상의 논문을 국제 학술 대회에서 발표하거나 학술지에 게재했다.
서울시립대학교 컴퓨터과학부 교수다. KAIST 전산학과에서 학사, 석사, 박사 학위(1997)를 받았다. 박사 학위 논문 제목은 “불균일 단위 신경 회로망과 퍼지전문가 시스템에 기반한 연속음성인식 시스템”이다. LG전자기술원에서 한국어음성인식기를 개발했다(1997∼2000). 벤처 기업 SL2(주)에서 연구소장으로 음성 인식 기술을 상업화했다(2000∼2002). 2002년 서울시립대학교 컴퓨터과학부 교수로 부임해 현재까지 화자 인식 등을 연구했고, 2014년부터 음성 딥페이크 탐지 연구를 진행했다. 국제적 챌린지 ASVspoof(automatic speaker verification spoofing and countermeasures challenge)에 여러 차례 팀으로 참가해 상위권의 성적을 얻었다. 한국음성학회와 한국음향학회에서 총무이사, 편집위원장 등을 역임했고, 우수논문상을 수상했다. 서울시립대학교 컴퓨터과학부장, 인공지능학과장, 교수학습연구센터장 등의 직을 수행했다. 옮긴 책으로 『루비 프로그래밍언어』(2012)가 있고, “AASIST: Audio anti-spoofing using integrated spectro-temporal graph attention networks” 등 100편 이상의 논문을 국제 학술 대회에서 발표하거나 학술지에 게재했다.