본 논문은 기존 이미지 스타일 전이 기법의 한계를 극복하고자, 다양한 예술 작품의 시각적 특징을 효과적으로 반영하는 새로운 방법인 CreativeSynth를 제안합니다. 기존 스타일 전이 방식은 스타일 정보만을 전달하여 인위적인 결과물을 생성하는 반면, CreativeSynth는 다중 모드(multimodal) 의미 정보를 통합하여 합성 가이드로 활용합니다. 이는 확산 모델(diffusion model) 기반의 다중 작업 통합 프레임워크로, 맞춤형 어텐션 메커니즘과 Cross-Art-Attention을 통해 실세계 의미 내용을 예술 영역에 매끄럽게 통합하고 미적 조화를 유지하며 의미를 융합합니다. 다양한 예술 장르에 대한 실험 결과를 통해 생성 모델과 예술적 표현 사이의 간극을 메울 수 있음을 보여줍니다. GitHub에서 코드와 결과를 공개합니다.
시사점, 한계점
•
시사점:
◦
기존 스타일 전이 방식의 한계를 극복하고, 예술 작품의 다양한 속성(레이아웃, 원근법, 형태, 의미 등)을 더욱 효과적으로 반영하는 새로운 방법 제시.