사진 한 장으로 동영상 만든다

삼성전자 인공지능 센터, 한 장의 사진만으로도 애니메이션 비디오 제작하는 첨단 딥페이크 인공지능 기술 개발해

딥페이크(deepfake)는 인공지능을 이용한 영상 합성·조작 기술이다. 버락 오바마 전 미국 대통령의 딥페이크 영상. / 사진:YOUTUBE/YONHAP

삼성전자가 사진 한 장만 이용해 사람의 애니메이션 동영상을 제작하는 방법을 개발했다. 이 기술은 기존의 비슷한 기술로 가능한 수준을 뛰어넘어 우려의 목소리가 커지고 있다.

러시아 모스크바에 소재한 삼성전자 인공지능 센터의 연구팀은 단 한 장의 사진만으로 사람들의 소름 돋게 정확한 애니메이션 동영상을 제작할 수 있는 첨단 ‘딥페이크(deepfake, 인공지능의 영상 합성·조작 기술)’ 인공지능 기술을 개발했다고 IT 전문매체 더버지가 보도했다.

단 한 장의 사진

IT 매체 마더보드가 처음 입수한 그 논문은 그렇게 정확하게 딥페이크를 제작할 수 있는 알고리즘을 삼성전자의 연구팀이 어떻게 개발할 수 있었는지 자세히 설명했다.

대체로 신경 모델은 많은 참고자료로 훈련을 받아야 딥페이크를 제작할 수 있다. 신경 모델에 참고자료를 더 많이 입력할수록 가짜 비디오가 더 정확하게 만들어진다. 그러나 이번의 새 논문은 사진 한 장만으로 가짜 비디오를 제작할 수 있는 신경 모델을 보여줬다.

얼굴형태, 눈, 입모양 같은 얼굴의 주요 특징을 알고리즘에 훈련시키는 방법으로 신형 딥페이크 인공지능이 기막히게 정확한 가짜 비디오를 제작할 수 있었다고 연구팀은 설명했다. 얼굴 특징은 유튜브 동영상에 등장하는 7000건 이상의 유명인 이미지를 토대로 했다.

인공지능에 한 장의 사진을 입력하면 그 사진을 토대로 놀랍도록 정확한 가짜 비디오가 만들어진다. 인공지능에 8~32장의 사진을 입력하면 현실세계 비디오 녹화로 착각할 수 있을 만큼 훨씬 더 정확한 딥페이크가 탄생한다.

연구팀은 인기 스타(생사를 막론하고)들의 사진으로 입술과 얼굴표정이 조용히 움직이는 동영상을 만들어 딥페이크 인공지능이 얼마나 정확한지를 보여줬다.

연구팀의 동영상에선 과학자 알버트 아인슈타인, 소설가 표도르 도스토옙스키, 화가 살바도르 달리, 배우 마릴린 먼로가 제각기 페이스북 스토리를 올린 듯 조용히 이야기를 한다. 심지어 모나리자가 유명한 미소를 띤 채 활발히 움직이는 모습을 인공지능이 어떻게 그렇게 정확히 만들어냈는지 흥미롭다.

타당한 우려

물론 이런 기술이 나오면 어떻게 사용될 수 있을지 항상 사람들의 걱정이 따른다. 그릇된 또는 악의적인 용도로 사용될 가능성이 있다고 더버지는 설명했다. 딥페이크가 원래 음란 비디오에 사람의 얼굴을 넣으려고 만들어졌기 때문이다. 할리우드 여배우 스칼렛 요한슨이 바로 그런 일을 겪었다.

미국 다트머스대학 해니 파리드 연구원은 또한 이런 수준의 정확성을 가진 딥페이크 인공지능이라면 가짜뉴스·선거조작·사기에도 사용될 수 있다고 IT매체 씨넷에 말했다.

– 줄리오 카칠라 아이비타임즈 기자