λ³Έ μ°κ΅¬λ νλ νΈλμ€ν¬λ¨Έ κΈ°λ° μ κ²½λ§μμ λ©ν°λͺ¨λ¬ λ°μ΄ν°μ λν μΈμ»¨ν
μ€νΈ νμ΅(In-context Learning)μ μ΄λ‘ μ κΈ°λ°μ νꡬν©λλ€. μ μ¬ μμΈ λͺ¨λΈμμ λ°μνλ λ©ν°λͺ¨λ¬ λ°μ΄ν°λ₯Ό κ°μ νκ³ , λ¨μΌ κ³μΈ΅ μ ν μ
ν μ΄ν
μ
μ΄ λ² μ΄μ¦ μ΅μ μμΈ‘μ λ¬μ±νμ§ λͺ»ν¨μ μ¦λͺ
ν©λλ€. μ΄μ λν ν΄κ²°μ±
μΌλ‘, λ€μΈ΅ κ΅μ°¨ μ΄ν
μ
(Cross-Attention) λ©μ»€λμ¦μ μ μνλ©°, μ΄λ₯Ό κ²½μ¬λ νλ¦(gradient flow)μΌλ‘ μ΅μ νν λ λ² μ΄μ¦ μ΅μ μ±λ₯μ λ¬μ±ν¨μ μ΄λ‘ μ μΌλ‘ μ
μ¦ν©λλ€.