haebom
Sign In
OpenMMReasoner: Pushing the Frontiers for Multimodal Reasoning with an Open and General Recipe
Created by
Haebom
Category
Empty
์ ์
Kaichen Zhang, Keming Wu, Zuhao Yang, Bo Li, Kairui Hu, Bin Wang, Ziwei Liu, Xingxuan Li, Lidong Bing
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ์ถ๋ก ๋ชจ๋ธ์ ๋ฉํฐ๋ชจ๋ฌ ์์ญ ํ์ฅ์ ๋ชฉํ๋ก, ํฌ๋ช ํ๊ณ ์ฌํ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ํ๋ ์ด์ ๋ฐ ํ์ต ์ ๋ต ๋ถ์กฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด OpenMMReasoner๋ฅผ ์ ์ํฉ๋๋ค. OpenMMReasoner๋ ์ง๋ ํ์ต ๋ฏธ์ธ ์กฐ์ (SFT)๊ณผ ๊ฐํ ํ์ต(RL)์ ๋ ๋จ๊ณ๋ก ๊ตฌ์ฑ๋ ์์ ํฌ๋ช ํ ๋ ์ํผ์ด๋ฉฐ, 874K๊ฐ์ ์ํ๋ก ๊ตฌ์ฑ๋ SFT ๋ฐ์ดํฐ์ ๊ณผ 74K๊ฐ์ RL ๋ฐ์ดํฐ์ ์ ํ์ฉํฉ๋๋ค. ๋ค์ํ ๋ฒค์น๋งํฌ ํ๊ฐ ๊ฒฐ๊ณผ, OpenMMReasoner๋ ๊ธฐ์กด ๊ฐํ ๊ธฐ๋ฐ ๋ชจ๋ธ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ์ ๋ณด์์ผ๋ฉฐ, ๋ฐ์ดํฐ ํ์ง๊ณผ ํ์ต ์ค๊ณ์ ์ค์์ฑ์ ์ ์ฆํ์ต๋๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
ํฌ๋ช ํ ํ์ต ๋ ์ํผ์ ๋ฐ์ดํฐ ๊ณต๊ฐ๋ฅผ ํตํด ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ์ฐ๊ตฌ์ ์ฌํ์ฑ์ ๋์ด๊ณ , ์ฐ๊ตฌ ๊ฐ๋ฐ์ ํจ์จ์ฑ์ ํฅ์์ํฌ ์ ์์ต๋๋ค.
โข
๋ฐ์ดํฐ ํ์ง ๊ด๋ฆฌ์ ํ์ต ์ ๋ต ์ค๊ณ๊ฐ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ์ฑ๋ฅ์ ๊ฒฐ์ ์ ์ธ ์ํฅ์ ๋ฏธ์น๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋๋ค.
โข
๋๊ท๋ชจ ๋ฉํฐ๋ชจ๋ฌ ์ถ๋ก ์ฐ๊ตฌ๋ฅผ ์ํ ๊ธฐ์ด๋ฅผ ๋ง๋ จํ์ง๋ง, ๋ ๋ค์ํ ๋ฐ์ดํฐ์ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ๋ค๋ฃจ๋ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage