Riccardo Brioschi, Aleksandr Alekseev, Emanuele Nevali, Berkay Doner, Omar El Malki, Blagoj Mitrevski, Leandro Kieliger, Mark Collier, Andrii Maksai, Jesse Berent, Claudiu Musat, Efi Kokiopoulou
개요
사용자 정의 스케치를 직관적인 제약 조건으로 활용하여 포스터 디자인에서 문서에 이르기까지 미적으로 만족스러운 레이아웃을 생성하는 새로운 접근 방식을 소개합니다. 이 문제는 현재 탐구되지 않은 유망한 연구 방향으로, 스케치와 콘텐츠 자산을 입력으로 사용하는 멀티모달 트랜스포머 기반 솔루션을 제안합니다. 또한, 학습용 스케치 데이터를 대규모로 합성 생성하는 효율적인 방법을 도입했습니다. PubLayNet, DocLayNet, SlidesVQA의 세 가지 공개 데이터 세트에서 모델을 학습하고 평가했으며, 최첨단 제약 조건 기반 방법보다 성능이 뛰어나고 더 직관적인 디자인 경험을 제공합니다. 향후 연구를 위해 약 20만 개의 합성 생성 스케치를 공개합니다.