Sign In

RAPT: Retrieval-Augmented Post-hoc Thresholding for Multi-Label Classification

์ž‘์„ฑ์ž
  • Haebom
์นดํ…Œ๊ณ ๋ฆฌ
Empty

์ €์ž

Lasal Jayawardena, Nirmalie Wiratunga, Ikechukwu Nkisi-Orji, Darren Nicol

๐Ÿ’ก ๊ฐœ์š”

๋ณธ ๋…ผ๋ฌธ์€ ๋‹ค์ค‘ ๋ ˆ์ด๋ธ” ๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ ๋ ˆ์ด๋ธ” ์„ ํƒ์˜ ์ •ํ™•์„ฑ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๊ธฐ์กด ๋ถ„๋ฅ˜๊ธฐ์˜ ๊ฒฐ๊ณผ์— ํ›„์ฒ˜๋ฆฌ(post-hoc) ๋ฐฉ์‹์œผ๋กœ ์ ์šฉ๋˜๋Š” RAPT(Retrieval-Augmented Post-hoc Thresholding) ๋ฐฉ๋ฒ•์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. RAPT๋Š” ๋ฌธ์„œ ํ‘œํ˜„๊ณผ ๋ ˆ์ด๋ธ”๋ณ„ ์‹ ๋ขฐ ์ ์ˆ˜๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์œ ์‚ฌํ•œ ๊ณผ๊ฑฐ ์‚ฌ๋ก€๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ , ์ด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋™์ ์œผ๋กœ ๋ ˆ์ด๋ธ” ์„ ํƒ ๊ธฐ์ค€์„ ์กฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ธฐ์กด์˜ ๊ณ ์ •๋œ ์ž„๊ณ„๊ฐ’ ๋ฐฉ์‹์˜ ๋‹จ์ ์„ ๊ทน๋ณตํ•˜๊ณ , ๋ชจ๋ธ ์žฌํ•™์Šต ์—†์ด๋„ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๐Ÿ”‘ ์‹œ์‚ฌ์  ๋ฐ ํ•œ๊ณ„

โ€ข
RAPT๋Š” ๊ธฐ์กด ๋‹ค์ค‘ ๋ ˆ์ด๋ธ” ๋ถ„๋ฅ˜ ๋ชจ๋ธ์˜ ์žฌํ•™์Šต ์—†์ด๋„ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ํšจ์œจ์ ์ธ ํ›„์ฒ˜๋ฆฌ ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.
โ€ข
๋‹ค์–‘ํ•œ ์ข…๋ฅ˜์˜ ๋ถ„๋ฅ˜๊ธฐ(metric learners, transformers)์™€ ํ•จ๊ป˜ ์‚ฌ์šฉ๋  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ ๋ถˆ๊ฐ€์ง€๋ก ์ ์ธ(model-agnostic) ํŠน์„ฑ์„ ๊ฐ€์ง‘๋‹ˆ๋‹ค.
โ€ข
์‚ฐ์—… ํ˜„์žฅ์˜ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ํŠน์„ฑ(OCR ์˜ค๋ฅ˜, ๋ ˆ์ด๋ธ” ๋ถˆ๊ท ํ˜•, ๊ฐ€๋ณ€์ ์ธ ๋ ˆ์ด๋ธ” ์ˆ˜ ๋“ฑ)์— ๊ฐ•๊ฑดํ•œ ๋ ˆ์ด๋ธ” ์„ ํƒ์„ ์ œ๊ณตํ•˜์—ฌ ์ •๋ณด ์ถ”์ถœ์˜ ์ •ํ™•์„ฑ์„ ๋†’์ด๊ณ  ๊ฒ€์ฆ ๋…ธ๋ ฅ์„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
โ€ข
RAPT์˜ ์„ฑ๋Šฅ์€ ๊ฒ€์ƒ‰ ๋Œ€์ƒ์ด ๋˜๋Š” ๊ณผ๊ฑฐ ์‚ฌ๋ก€(cases)์˜ ํ’ˆ์งˆ๊ณผ ์–‘์— ์˜ํ–ฅ์„ ๋ฐ›์„ ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๊ฒ€์ƒ‰ ๋ฐ ์ง€์—ญ์  ์ง‘๊ณ„ ๊ณผ์ •์˜ ํšจ์œจ์„ฑ ๋˜ํ•œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
๐Ÿ‘