haebom
Sign In
Active Learners as Efficient PRP Rerankers
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Jerem
ias Figueiredo Paschmann, Juan Kaplan, Francisco Nattero, Santiago Barron, Juan Wisznia, Luciano del Corro
π‘ κ°μ
λ³Έ λ Όλ¬Έμ LLMμ μλ³ μ νΈλ νλ¨μ νμ©νλ Pairwise Ranking Prompting(PRP)μ λ¨μ μ 극볡νκΈ° μν΄, μ΄λ₯Ό λ Έμ΄μ¦κ° ν¬ν¨λ μλ³ λΉκ΅λ‘λΆν° νμ΅νλ νμ± νμ΅(active learning) λ¬Έμ λ‘ μ¬μ μνμ΅λλ€. μ μλ νμ± νμ΅ νλ μμν¬λ μ νλ νΈμΆ μμ° νμμ λ λμ NDCG@10 μ±λ₯μ μ 곡νλ©°, λ Έμ΄μ¦μ κ°κ±΄ν νΉμ§μ κ°μ§λλ€. λν, λ¨μΌ LLM νΈμΆλ‘ μμΉ νΈν₯μ μνκ· λ Έμ΄μ¦λ‘ λ³ννλ 무μμ λ°©ν₯ μ€λΌν΄μ λμ νμ¬ νΈν₯ μλ μ§κ³ λνΉμ κ°λ₯νκ² ν©λλ€.
π μμ¬μ λ° νκ³
β’
νμ± νμ΅ μ κ·Ό λ°©μμ ν΅ν΄ LLM κΈ°λ° λνΉ μμ€ν μ ν¨μ¨μ±κ³Ό μ νμ±μ κ°μ ν μ μμ΅λλ€.
β’
μ μλ λ Έμ΄μ¦ κ°κ±΄ νλ μμν¬λ μ€μ LLM μλ΅μ λΆνμ€μ±μ ν¨κ³Όμ μΌλ‘ λ€λ£° μ μμ΅λλ€.
β’
무μμ λ°©ν₯ μ€λΌν΄μ μΆκ°μ μΈ LLM νΈμΆ λΉμ© μμ΄ μμΉ νΈν₯ λ¬Έμ λ₯Ό μννλ μλ‘μ΄ λ°©λ²μ μ μν©λλ€.
β’
μ€νμ μΌλ‘ κ²μ¦λ μ±λ₯ ν₯μμ΄ μμ§λ§, λ€μν LLM λͺ¨λΈ λ° λλ©μΈμ λν μΌλ°ν κ°λ₯μ±μ μΆκ° μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage