haebom
Sign In
Improving Automatic Summarization of Radiology Reports through Mid-Training of Large Language Models
Created by
Haebom
Category
Empty
μ μ
Mengxian Lyu, Cheng Peng, Ziyi Chen, Mengyuan Zhang, Jieting Li Lu, Yonghui Wu
π‘ κ°μ
μλ£ μμ νλ λ³΄κ³ μμ μλ μμ½μ μλ£μ§μ λΆλ΄μ μ€μ΄λ λ° νμμ μ λλ€. λ³Έ μ°κ΅¬λ κΈ°μ‘΄μ "μ¬μ νμ΅, λ―ΈμΈ μ‘°μ " λ°©μ λμ , μ€κ° νμ΅(mid-training)μ ν΅ν΄ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ(LLM)μ μμ νλ λ³΄κ³ μ λλ©μΈμ μ μμμΌ μμ½ μ±λ₯μ κ°μ νλ μλ‘μ΄ λ°©λ²μ μ μν©λλ€. μμ λλ©μΈ μ¬μ νμ΅ ν, νΉμ νμ λλ©μΈ(μμ νλ )μ λν μ€κ° νμ΅μ μνν λͺ¨λΈμ΄ μΌλ° μ¬μ νμ΅ λλ μμ λλ©μΈ μ¬μ νμ΅λ§ κ±°μΉ λͺ¨λΈλ³΄λ€ λ°μ΄λ μμ½ μ±λ₯κ³Ό μ¬μ€μ±μ 보μ¬μ£Όμμ΅λλ€.
π μμ¬μ λ° νκ³
β’
μ€κ° νμ΅(mid-training)μ LLMμ νΉμ μλ£ λλ©μΈμ λμ± ν¨κ³Όμ μΌλ‘ μ μμμΌ μλ μμ½ μ±λ₯μ ν¬κ² ν₯μμν¬ μ μμ΅λλ€.
β’
μ€κ° νμ΅μ μλμ λ°μ΄ν°λ‘λ μ°μν μ±λ₯μ λ¬μ±νλ few-shot learning λ₯λ ₯μ ν₯μμν€κ³ , νμ΅ μ΄κΈ°μ μ΄λ €μ(cold start problem)μ μννλ λ° κΈ°μ¬ν©λλ€.
β’
"μ¬μ νμ΅, μ€κ° νμ΅, λ―ΈμΈ μ‘°μ " λ°©μμ΄ κΈ°μ‘΄μ "μ¬μ νμ΅, λ―ΈμΈ μ‘°μ " λ°©μλ³΄λ€ ν¨κ³Όμ μμ μ μ¦νλ©°, ν₯ν LLM μ μ© μ°κ΅¬μ μ€μν λ°©λ²λ‘ μ λ°©ν₯μ μ μν©λλ€.
β’
λ³Έ μ°κ΅¬μμ μ¬μ©λ λ°μ΄ν°μ λ° λͺ¨λΈμ νΉμ λλ©μΈ νΈν₯ κ°λ₯μ±μ λν μΆκ°μ μΈ κ²μ¦ λ° λ€μν μλ£ λλ©μΈμΌλ‘μ νμ₯ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage