ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations
Created by
Haebom
Category
Empty
저자
Bowen Jiang, Yuan Yuan, Xinyi Bai, Zhuoqun Hao, Alyson Yin, Yaojie Hu, Wenyu Liao, Lyle Ungar, Camillo J. Taylor
개요
본 논문은 폰트 라벨 어노테이션 없이 원시 이미지만을 사용하여 확산 모델이 폰트 제어 가능한 다국어 텍스트 렌더링을 달성할 수 있음을 보여준다. 텍스트 세분화 모델과 조건부 확산 모델을 통합하여 픽셀 공간에서 폰트를 자가 지도 방식으로 캡처하고 표현함으로써 어떠한 정답 라벨 없이 사용자가 원하는 다국어 폰트로 텍스트 렌더링을 사용자 정의할 수 있도록 한다. 제로샷 텍스트 및 폰트 편집 실험을 통해 알고리즘의 개념 증명을 제시한다.