구글, 얼굴 사진 움직이는 AI '브이로거(VLOGGER)' 공개
브이로거(VLOGGER), 단일 스틸 사진으로부터 말하고 움직이는 모습을 실감나게 재현할 수 있는 AI 기술 시스템 브이로거는 음성 데이터에 맞춰 입 모양, 표정, 머리 움직임, 손짓을 포함한 다양한 인간의 행동을 자연스럽게 생성할 수 있는 능력을 가지고 있습니다. '멘터(MENTOR)'라는 대규모 데이터셋을 통해 학습된 이 기술은 다양한 인종, 연령, 의상, 포즈 및 배경을 가진 인물의 비디오를 생산할 수 있으며, 프리젠테이션, 교육, 나레이션 등 여러 분야에서 활용될 가능성을 지니고 있습니다. 비록 현재로서는 아직 2D 환경에서만 작동하고, 실제 인간의 말투나 버릇을 완벽히 구현하기에는 한계가 있지만, 브이로거는 현존하는 이미지-영상 변환 기술보다 뛰어난 이미지 품질, 신원 보존, 시간적 일관성을 제공함으로써 인간과 컴퓨터 간의 상호작용을 한층 발전시킬 것으로 기대됩니다. <발췌 논문> <원문 링크>
1