Daily Arxiv

This page organizes papers related to artificial intelligence published around the world.
This page is summarized using Google Gemini and is operated on a non-profit basis.
The copyright of the paper belongs to the author and the relevant institution. When sharing, simply cite the source.

EmoFeedback$^2$: Reinforcement of Continuous Emotional Image Generation via LVLM-based Reward and Textual Feedback

Created by
  • Haebom
Category
Empty

저자

Jingyang Jia, Kai Shu, Gang Yang, Long Xing, Xun Chen, Aiping Liu

개요

C-EICG(Continuous emotional image generation) 분야에서 감성 피드백 부재, 감성-텍스트 정렬의 문제점을 해결하기 위해, LVLM(Large Vision-Language Model)의 추론 능력을 활용하는 새로운 생성-이해-피드백 강화 패러다임(EmoFeedback$^2$) 제안. 감성 인식 보상 피드백 전략과 자체 개선 텍스트 피드백 프레임워크를 통해 이미지의 감성 연속성과 충실도를 향상시킴. 실험 결과, 제안하는 방법이 기존 SOTA(State-of-the-Art) 방식보다 우수한 성능을 보임.

시사점, 한계점

시사점:
LVLM을 활용한 감성 인식, 보상 기반 강화 학습을 통해 이미지 생성 품질 및 감성 연속성 향상.
자체 개선 텍스트 피드백 프레임워크를 통해 감성 충실도 개선.
새로운 C-EICG 방법론 제시 및 실험적 우수성 입증.
한계점:
코드 및 데이터셋 미공개.
구체적인 한계점은 논문 상세 내용 분석 필요.
👍