haebom
Sign In
JMed48k: A Multi-Profession Japanese Medical Licensing Benchmark for Vision-Language Model Evaluation
์์ฑ์
Haebom
์นดํ ๊ณ ๋ฆฌ
Empty
์ ์
Yue Xun, Junyu Liu, Qian Niu, Xinyi Wang, Zheng Yuan, Zirui Li, Zequn Zhang, Bowen Zhao, Shujun Wang, Irene Li, Kan Hatakeyama-Sato, Yusuke Iwasawa, Yutaka Matsuo
๐ก ๊ฐ์
๋ณธ ๋ ผ๋ฌธ์ ์ผ๋ณธ ์๋ฃ ๋ฉดํ ์ํ์ ์ฌ์ฉ๋๋ ๊ฐ๊ด์ ๋ฌธ์ ์ ์ด๋ฏธ์ง๋ฅผ ํฌํจํ๋ 48,862๊ฐ์ ์ง๋ฌธ์ผ๋ก ๊ตฌ์ฑ๋ JMed48k์ด๋ผ๋ ์๋ก์ด ๋ค์ค ์ง์ ์๋ฃ ๋ผ์ด์ ์ฑ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํ๋ค. 2005๋ ๋ถํฐ 2025๋ ๊น์ง 11๊ฐ ๊ตญ๊ฐ ๋ฉดํ ์ํ์์ ์์ง๋ ์ด ๋ฒค์น๋งํฌ๋ ํ ์คํธ์ ์ด๋ฏธ์ง ๊ธฐ๋ฐ ์ง๋ฌธ์ ๋ํ ๋น์ -์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ๋๋ก ์ค๊ณ๋์๋ค. ์ด๋ฏธ์ง ์ ๊ฑฐ ๊ฐ์ฌ ๊ฒฐ๊ณผ, ๋ฒ์ฉ ๋ชจ๋ธ์ ์ด๋ฏธ์ง๋ก๋ถํฐ ์๋นํ ์ด๋์ ์ป๋ ๋ฐ๋ฉด, ์๋ฃ ํนํ ๋ชจ๋ธ์ ์๊ฐ ์ ๋ณด ํ์ฉ๋๊ฐ ๋ฎ์ผ๋ฉฐ, ์ด๋ฏธ์ง ์ ๊ฑฐ ํ์๋ ์ ๋ต๋ฅ ์ด ํฌ๊ฒ ๋ณํ์ง ์๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค.
๐ ์์ฌ์ ๋ฐ ํ๊ณ
โข
์๋ฃ ๋ถ์ผ ๋น์ -์ธ์ด ๋ชจ๋ธ์ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์ํ ํ์ค์ ์ด๊ณ ๋ค์ธต์ ์ธ ๋ฒค์น๋งํฌ๋ฅผ ์ ๊ณตํ๋ค.
โข
์ด๋ฏธ์ง ์ ๋ณด๊ฐ ๋ชจ๋ธ์ ๋ต๋ณ์ ๋ฏธ์น๋ ์ํฅ์ ์ง์ ๋ณ๋ก ์ ๋์ ์ผ๋ก ๋ถ์ํ๊ณ , ์๋ฃ ํนํ ๋ชจ๋ธ์ ์๊ฐ ์ ๋ณด ํ์ฉ ๋ฅ๋ ฅ์ ๋ํ ํต์ฐฐ์ ์ ์ํ๋ค.
โข
๋ฒค์น๋งํฌ์ ํฌํจ๋ ์ง๋ฌธ์ ์ค์ ์ํ ๋์ด๋ ๋ฐ ์ต์ ๋ํฅ ๋ฐ์์ ๋ํ ์ง์์ ์ธ ๊ฒ์ฆ ๋ฐ ์ ๋ฐ์ดํธ๊ฐ ํ์ํ๋ฉฐ, ๋ค์ํ ์ธ์ด ๋ฐ ๋ฌธํ๊ถ ์๋ฃ ์์คํ ์ ๋ํ ์ผ๋ฐํ ๊ฐ๋ฅ์ฑ์ ํ๊ตฌํด์ผ ํ๋ค.
PDF ๋ณด๊ธฐ
Made with Slashpage