haebom
Sign In
Golden Layers and Where to Find Them: Improved Knowledge Editing for Large Language Models Via Layer Gradient Analysis
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Shrestha Datta, Hongfu Liu, Anshuman Chhabra
π‘ κ°μ
λ³Έ μ°κ΅¬λ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ νΉμ μ§μ μμ μ μ΅μ μ νΈμ§ μ±λ₯μ 보μ΄λ κ³ μ λ "ν©κΈ λ μ΄μ΄"κ° μ‘΄μ¬νλ€λ κ°μ€μ μ μνκ³ μ΄λ₯Ό κ²μ¦ν©λλ€. μ μλ λ μ΄μ΄ κ²½μ¬λ λΆμ(LGA) κΈ°λ²μ ν¨μ¨μ μΌλ‘ ν©κΈ λ μ΄μ΄λ₯Ό μλ³νμ¬ νλΌλ―Έν° μμ κ³Όμ μμμ μνμ°©μ€λ₯Ό μ€μ΄κ³ , λ€μν LLM λ° μ§μ μμ λ°©λ²λ‘ μ κ±Έμ³ ν¨κ³Όμ μ΄κ³ κ²¬κ³ ν μ±λ₯μ μ μ¦ν©λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μ§μ μμ μ, λͺ¨λ 쿼리μ λν΄ μ΅μ μ μ±λ₯μ μ 곡νλ κ³ μ λ "ν©κΈ λ μ΄μ΄"κ° μ‘΄μ¬νλ©°, μ΄λ κ°λ³ 쿼리λ§λ€ μ΅μ μ λ μ΄μ΄κ° λ¬λΌμ§λ κΈ°μ‘΄ λ°©μμ νκ³λ₯Ό 극볡ν μ μμ΅λλ€.
β’
μ μλ λ μ΄μ΄ κ²½μ¬λ λΆμ(LGA) κΈ°λ²μ νλ‘μ λ°μ΄ν°μ μ νμ©νμ¬ ν©κΈ λ μ΄μ΄λ₯Ό ν¨μ¨μ μΌλ‘ μλ³νκ³ , κ²μ¦ λ°μ΄ν°μ λΏλ§ μλλΌ μ€μ ν μ€νΈ λ°μ΄ν°μ μμλ μ°μν μΌλ°ν μ±λ₯μ 보μ¬μ€λλ€.
β’
νμ¬ μ°κ΅¬λ νΉμ LLM μν€ν μ² λ° μ§μ μμ λ°©λ²λ‘ μ κ΅νλ μ μμΌλ©°, λ λμ λ²μμ λͺ¨λΈ λ° λ³΅μ‘ν μ§μ μμ μλ리μ€μ λν μΆκ°μ μΈ κ²μ¦μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage