Sign In

ControlText: Unlocking Controllable Fonts in Multilingual Text Rendering without Font Annotations

Created by
  • Haebom
Category
Empty

저자

Bowen Jiang, Yuan Yuan, Xinyi Bai, Zhuoqun Hao, Alyson Yin, Yaojie Hu, Wenyu Liao, Lyle Ungar, Camillo J. Taylor

개요

본 논문은 폰트 라벨 어노테이션 없이 원시 이미지만을 사용하여 확산 모델이 폰트 제어 가능한 다국어 텍스트 렌더링을 달성할 수 있음을 보여준다. 텍스트 세분화 모델과 조건부 확산 모델을 통합하여 픽셀 공간에서 폰트를 자가 지도 방식으로 캡처하고 표현함으로써 어떠한 정답 라벨 없이 사용자가 원하는 다국어 폰트로 텍스트 렌더링을 사용자 정의할 수 있도록 한다. 제로샷 텍스트 및 폰트 편집 실험을 통해 알고리즘의 개념 증명을 제시한다.

시사점, 한계점

폰트 라벨 어노테이션 없이 폰트 제어 텍스트 렌더링 가능
다국어 지원
자가 지도 학습 방식 채택으로 데이터 의존성 감소
제로샷 텍스트 및 폰트 편집 실험 성공
실제 대규모 데이터셋에 대한 적용 가능성 추가 연구 필요
알고리즘의 일반화 능력 및 성능 개선 여지 존재
👍