haebom
Sign In
The Impact of Off-Policy Training Data on Probe Generalisation
Created by
Haebom
Category
Empty
μ μ
Nathalie Kirch, Samuel Dower, Adrians Skapars, Helen Yannakoudakis, Ekdeep Singh Lubana, Dmitrii Krasheninnikov
π‘ κ°μ
λ³Έ μ°κ΅¬λ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μ°λ €μ€λ¬μ΄ νλ νμ§μ νμ©λλ νλ‘λΉ(probing) κΈ°λ²μμ, μ μ± μΈ(off-policy) νμ΅ λ°μ΄ν°κ° νλ‘λΈμ μΌλ°ν μ±λ₯μ λ―ΈμΉλ μν₯μ 체κ³μ μΌλ‘ λΆμν©λλ€. λ€μν LLM λ° 8κ°μ§ νλμ κ±Έμ³ μ ν λ° μ΄ν μ νλ‘λΈλ₯Ό μ€νν κ²°κ³Ό, λ°μ΄ν° μμ± μ λ΅μ΄ νλ‘λΈ μ±λ₯μ μλΉν μν₯μ λ―ΈμΉλ©°, νΉν μλ΅ "μλ"μ κΈ°λ°ν νλμμ μΌλ°ν μ€ν¨κ° ν¬κ² λνλλ κ²μ λ°κ²¬νμ΅λλ€. μ μ± μΈ λ°μ΄ν°κ° νΉμ 쑰건μμλ μ€νλ € λ μ λ’°ν μ μλ νλ‘λΈλ₯Ό μμ±ν μ μμμ μμ¬ν©λλ€.
π μμ¬μ λ° νκ³
β’
μ μ± μΈ νμ΅ λ°μ΄ν°λ₯Ό μ¬μ©ν κ²½μ°, λ°μ΄ν° μμ± λ°©μμ΄ νλ‘λΈμ μΌλ°ν μ±λ₯μ κ²°μ μ μΈ μν₯μ λ―ΈμΉ μ μμ΅λλ€.
β’
ν μ€νΈ μμ€μ λ΄μ©λ³΄λ€λ μλ΅μ "μλ"λ₯Ό μ μνλ νλ(μ: μ λ΅μ μμμ)μμ νλ‘λΈμ μΌλ°ν μ€ν¨κ° λλλ¬μ§λλ€.
β’
μ μ± μΈ λ°μ΄ν°μ μ λν μ±κ³΅μ μΈ μΌλ°νλ μ μ± λ΄(on-policy) ν μ€νΈ λ°μ΄ν°μ μμμ λμ μ±λ₯μ κ°νκ² μμΈ‘νλ μ§νκ° λ μ μμ΅λλ€.
β’
λ³Έ μ°κ΅¬ κ²°κ³Όλ νμ¬μ μμμ νμ§ νλ‘λΈκ° μ€μ λͺ¨λν°λ§ μλ리μ€μ μΌλ°νλμ§ λͺ»ν κ°λ₯μ±μ μμ¬νλ©°, λͺ¨λ μ’ λ₯μ λΆν¬ λ³νλ₯Ό μ²λ¦¬ν μ μλ κ°μ λ λͺ¨λν°λ§ λ°©λ²λ‘ μ νμμ±μ κ°μ‘°ν©λλ€.
PDF 보기
Made with Slashpage