Sign In

Logics-Parsing-Omni Technical Report

Created by
  • Haebom
Category
Empty

์ €์ž

Xin An, Jingyi Cai, Xiangyang Chen, Huayao Liu, Peiting Liu, Peng Wang, Bei Yang, Xiuwen Zhu, Yongfan Chen, Baoyu Hou, Shuzhao Li, Weidong Ren, Fan Yang, Jiangtao Zhang, Xiaoxiao Xu, Lin Qu

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์˜ ํŒŒ์‹ฑ ๊ณผ์ œ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋‹จํŽธํ™”๋œ ํƒœ์Šคํฌ ์ •์˜์™€ ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ์˜ ์ด์งˆ์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด Omni Parsing ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค. ์ด ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ๋ฌธ์„œ, ์ด๋ฏธ์ง€, ์˜ค๋””์˜ค-๋น„๋””์˜ค ์ŠคํŠธ๋ฆผ์„ ํฌ๊ด„ํ•˜๋Š” ํ†ตํ•ฉ ๋ถ„๋ฅ˜ ์ฒด๊ณ„๋ฅผ ๊ตฌ์ถ•ํ•˜๊ณ , ์ง€๊ฐ๊ณผ ์ธ์ง€๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ์ ์ง„์  ํŒŒ์‹ฑ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๋„์ž…ํ•œ๋‹ค. ํ•ต์‹ฌ ์„ฑ๊ณผ๋Š” ๋‚ฎ์€ ์ˆ˜์ค€์˜ ์‚ฌ์‹ค๊ณผ ๋†’์€ ์ˆ˜์ค€์˜ ์˜๋ฏธ๋ก ์  ์„ค๋ช…์„ ์—„๊ฒฉํ•˜๊ฒŒ ์ผ์น˜์‹œํ‚ค๋Š” ์ฆ๊ฑฐ ๊ณ ์ • ๋ฉ”์ปค๋‹ˆ์ฆ˜์„ ํ†ตํ•ด, ๋น„์ •ํ˜• ์‹ ํ˜ธ๋ฅผ ์œ„์น˜ ํŒŒ์•… ๊ฐ€๋Šฅํ•˜๊ณ  ์—ด๊ฑฐ ๊ฐ€๋Šฅํ•˜๋ฉฐ ์ถ”์  ๊ฐ€๋Šฅํ•œ ํ‘œ์ค€ํ™”๋œ ์ง€์‹์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ํฌ๊ด„์ ์ด๊ณ  ๊ณ„์ธต์ ์ธ ํŒŒ์‹ฑ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ•˜์—ฌ, ์ง€๊ฐ๊ณผ ์ธ์ง€ ๊ณผ์ •์„ ํšจ๊ณผ์ ์œผ๋กœ ํ†ตํ•ฉํ•œ๋‹ค.
โ€ข
์ฆ๊ฑฐ ๊ธฐ๋ฐ˜ ๋…ผ๋ฆฌ์  ๊ท€๋‚ฉ์„ ํ†ตํ•ด ๋น„์ •ํ˜• ๋ฐ์ดํ„ฐ๋ฅผ ๊ธฐ๊ณ„๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋Š” ๊ตฌ์กฐํ™”๋œ ์ง€์‹์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์ƒˆ๋กœ์šด ์ ‘๊ทผ ๋ฐฉ์‹์„ ์ œ์‹œํ•œ๋‹ค.
โ€ข
์ œ์•ˆ๋œ OmniParsingBench๋ฅผ ํ†ตํ•ด ๋ฉ€ํ‹ฐ๋ชจ๋‹ฌ ํŒŒ์‹ฑ ๋Šฅ๋ ฅ์— ๋Œ€ํ•œ ์ •๋Ÿ‰์  ํ‰๊ฐ€์˜ ๋ฐœํŒ์„ ๋งˆ๋ จํ•˜์˜€๋‹ค.
โ€ข
๋ณธ ์—ฐ๊ตฌ์—์„œ ์ œ์•ˆ๋œ ํ”„๋ ˆ์ž„์›Œํฌ์˜ ๋ณต์žก์„ฑ๊ณผ ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ์˜์กด์„ฑ์€ ์‹ค์ œ ์ ์šฉ ์‹œ ๊ณ ๋ คํ•ด์•ผ ํ•  ํ•œ๊ณ„์ ์œผ๋กœ ์ž‘์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋„๋ฉ”์ธ๊ณผ ์–ธ์–ด์— ๋Œ€ํ•œ ํ™•์žฅ์„ฑ ๋ฐ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•˜๋‹ค.
๐Ÿ‘