λ³Έ λ
Όλ¬Έμ νΈλμ€ν¬λ¨Έ λͺ¨λΈ(GPT-2)μ΄ νλ ¨ κ³Όμ μμ μ μ°¨μ μΌλ‘ νμ¬ μ»¨ν
μ€νΈ μΈλΆμ μ 보μ λν μμ‘΄λλ₯Ό μ€μ¬λκ°λ©°, μ΄λ κ³μΈ΅μ νκ·μ μ μμ λΆλΆ νλ§(adaptive partial pooling)κ³Ό μ μ¬ν λ°©μμΌλ‘ 컨ν
μ€νΈ λΉλ, μ’
λ₯ λ° λ³λμ±μ μν₯μ λ°λλ€λ κ²μ 보μ¬μ€λλ€. μ¦, νΈλμ€ν¬λ¨Έλ νλ ¨μ΄ μ§νλ μλ‘ λ λΉλ²ν 컨ν
μ€νΈμ λν μ 보λ₯Ό μ νμ μΌλ‘ νμ©νκ³ , μ΄λ¬ν νμ΅ νΉμ±μ΄ ν©λ¦¬μ μ΄κ³ κ²½νμ μΌλ‘λ νλΉν¨μ μ£Όμ₯ν©λλ€.