haebom
Sign In
Fair in Mind, Fair in Action? A Synchronous Benchmark for Understanding and Generation in UMLLMs
Created by
Haebom
Category
Empty
์ ์
Yiran Zhao, Lu Zhou, Xiaogang Xu, Zhe Liu, Jiafei Wu, Liming Fang
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๋ค์ํ ๊ณต์ ์ฑ ์งํ๋ค์ด ์กด์ฌํ์ง๋ง ์ฒ ํ์ ๊ฐ์ ์ ์ถฉ๋๋ก ์ธํด ํตํฉ์ ์ธ ํจ๋ฌ๋ค์ ๊ตฌ์ถ์ด ์ด๋ ค์ด UMLLM(Unified Multimodal Large Language Models)์ ๊ณต์ ์ฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค. ์ด๋ฅผ ์ํด UMLLM์ ์ดํด ๋ฐ ์์ฑ ์์ ์ ๊ณต์ ์ฑ์ ๋์์ ํ๊ฐํ๋ ์ต์ด์ ๋ฒค์น๋งํฌ์ธ IRIS๋ฅผ ์ ์ํฉ๋๋ค. IRIS ๋ฒค์น๋งํฌ๋ 60๊ฐ ์ด์์ ์ธ๋ถํ๋ ์งํ๋ฅผ '์ด์์ ๊ณต์ ์ฑ', '์ค์ธ๊ณ ์ถฉ์ค๋', 'ํธํฅ ๊ด์ฑ ๋ฐ ์ ์ด ๊ฐ๋ฅ์ฑ'์ ์ธ ๊ฐ์ง ์ฐจ์์ผ๋ก ํตํฉํ์ฌ UMLLM์ ๊ณต์ ์ฑ ๋ฅ๋ ฅ์ ์ง๋จํ๊ณ ์ต์ ํํ๋ ๋ฐ ๋์์ ์ค๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
UMLLM์ ์ดํด ๋ฐ ์์ฑ ์์ ์์ ๋ฐ์ํ๋ ์์คํ ์ ํธํฅ์ ํฌ๊ด์ ์ผ๋ก ํ๊ฐํ ์ ์๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
โข
๋ค์ํ ๊ณต์ ์ฑ ์งํ๋ฅผ ํตํฉํ๊ณ ํด์ํ ์ ์๋ "๊ณต์ ์ฑ ๊ณต๊ฐ" ๊ฐ๋ ์ ์ ์ํ์ฌ ๊ณต์ ์ฑ ์ฐ๊ตฌ์ "๋ฐ๋ฒจํ" ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ๊ธฐ์ฌํฉ๋๋ค.
โข
"์์ฑ ๊ฒฉ์ฐจ", "๊ฐ์ธ๋ณ ๋ถ์ผ์น", "๋ฐ๊ณ ์ ๊ด๋ ๋ณด์"๊ณผ ๊ฐ์ UMLLM์ ์๋ก์ด ๊ณต์ ์ฑ ํ์์ ๋ฐ๊ฒฌํ๊ณ ์ง๋จํ ์ ์๋ ๋๊ตฌ๋ฅผ ์ ๊ณตํฉ๋๋ค.
โข
์์ง ๋ฐ์ ์ด๊ธฐ ๋จ๊ณ์ ์๋ UMLLM์ ๊ณต์ ์ฑ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ์ง์์ ์ธ ์ฐ๊ตฌ ๋ฐ ๊ฐ์ ์ด ํ์ํ๋ฉฐ, ๋ฒค์น๋งํฌ์ ํ์ฅ์ฑ๊ณผ ๋ค์ํ ์ค์ ์๋๋ฆฌ์ค ์ ์ฉ์ ๋ํ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ์๊ตฌ๋ฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage