每日 Arxiv

本页面整理了世界各地发表的人工智能相关论文。
本页面使用 Google Gemini 汇总而成,并以非盈利为基础运营。
论文版权归作者及相关机构所有,分享时请注明出处。

EdiVal-Agent:一个以对象为中心的框架,用于自动、细粒度地评估多轮编辑

Created by
  • Haebom

作者

陈天宇、张雅思、张志、于佩玉、王舒、王振东、林凯文、王晓飞、杨正源、李林杰、林中庆、谢建文、梁家强、王丽娟、吴英念、周明远

EdiVal-Agent:一个复杂的以对象为中心的图像编辑评估框架

大纲

EdiVal-Agent 是一个自动化框架,用于从对象中心视角评估图像编辑,严格评估基于单轮和多轮指令的编辑。它将输入图像分解为语义上有意义的对象,生成各种上下文感知的编辑指令,并动态更新对象池。EdiVal-Agent 提供了两个用于多轮评估的对象中心指标和一个用于衡量整体视觉质量的全局指标。我们构建了 EdiVal-Bench 来评估九种指令类型和最先进的编辑模型。

Takeaways, Limitations

Takeaways:
采用以对象为中心的评估方法可以对图像编辑进行精确评估。
可以评估单圈和多圈编辑
比较各种编辑模型的性能并提出改进的方向。
为新编辑模型的开发做出贡献
Limitations:
论文中没有具体介绍Limitations(需要稍后查看论文详情)
仅关注评估模型的性能,可能不包括对用户体验或其他因素的评估。
👍