haebom
Sign In
Neurons Speak in Ranges: Breaking Free from Discrete Neuronal Attribution
Created by
Haebom
Category
Empty
μ μ
Muhammad Umair Haider, Hammad Rizwan, Hassan Sajjad, Peizhong Ju, A. B. Siddique
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μμ λ°μνλ μ κ²½λ§μ λ€μμ±(polysemanticity)μΌλ‘ μΈν΄ λ°μνλ κ°λ³ μ κ²½λ§-κ°λ μ°κ²°μ μ΄λ €μμ ν΄κ²°νκ³ μ ν©λλ€. μ°κ΅¬μ§μ κ°λ λ³ μ κ²½λ§ νμ±ν κ°λκ° μ€μ²©μ΄ μ μ λλ ·ν λΆν¬λ₯Ό νμ±νλ€λ μ μ μ°©μνμ¬, νμ±ν λ²μλ₯Ό κΈ°λ°μΌλ‘ κ°λ μ ν΄μνκ³ μ‘°μνλ NeuronLens νλ μμν¬λ₯Ό μ μνμ΅λλ€. μ΄λ₯Ό ν΅ν΄ κΈ°μ‘΄μ μ κ²½λ§ λ§μ€νΉ λ°©μλ³΄λ€ λͺ©ν κ°λ μ ν¨κ³Όμ μΌλ‘ μ‘°μνλ©΄μλ λΆμμ μΈ κ°λ λ° λͺ¨λΈ μ±λ₯ μ νλ₯Ό μ΅μννλ μ±κ³Όλ₯Ό 보μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
LLMμ μ κ²½λ§ ν΄μ λ° μ μ΄μ μμ΄ κ°λ³ μ κ²½λ§ λ¨μκ° μλ, κ°λ λ³ νμ±ν λ²μλΌλ μλ‘μ΄ μ κ·Ό λ°©μμ κ°λ₯μ±μ μ μνμ΅λλ€.
β’
NeuronLens νλ μμν¬λ κΈ°μ‘΄μ μ κ²½λ§ λ§μ€νΉ κΈ°λ² λλΉ λΆμμ μΈ μν₯ μμ΄ νΉμ κ°λ μ λμ± μ λ°νκ² μ‘°μν μ μμμ μ€μ¦μ μΌλ‘ 보μ¬μ£Όμμ΅λλ€.
β’
λ€μν LLM μν€ν μ² λ° λ°μ΄ν°μ μ λν κ΄λ²μν λΆμμ ν΅ν΄ μ μ λ°©λ²λ‘ μ μΌλ°ν κ°λ₯μ±μ νμνμμΌλ, μ μλ Gaussian-like λΆν¬μ μΌλ°μ μΈ νΉμ± λ° λͺ¨λ λ€μμ± μν©μ λν μ μ© κ°λ₯μ±μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage