Sign In

Improving Automatic Summarization of Radiology Reports through Mid-Training of Large Language Models

Created by
  • Haebom
Category
Empty

μ €μž

Mengxian Lyu, Cheng Peng, Ziyi Chen, Mengyuan Zhang, Jieting Li Lu, Yonghui Wu

πŸ’‘ κ°œμš”

의료 μ˜μƒ νŒλ… λ³΄κ³ μ„œμ˜ μžλ™ μš”μ•½μ€ μ˜λ£Œμ§„μ˜ 뢀담을 μ€„μ΄λŠ” 데 ν•„μˆ˜μ μž…λ‹ˆλ‹€. λ³Έ μ—°κ΅¬λŠ” 기쑴의 "사전 ν•™μŠ΅, λ―Έμ„Έ μ‘°μ •" 방식 λŒ€μ‹ , 쀑간 ν•™μŠ΅(mid-training)을 톡해 λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)을 μ˜μƒ νŒλ… λ³΄κ³ μ„œ 도메인에 μ μ‘μ‹œμΌœ μš”μ•½ μ„±λŠ₯을 κ°œμ„ ν•˜λŠ” μƒˆλ‘œμš΄ 방법을 μ œμ•ˆν•©λ‹ˆλ‹€. μž„μƒ 도메인 사전 ν•™μŠ΅ ν›„, νŠΉμ • ν•˜μœ„ 도메인(μ˜μƒ νŒλ…)에 λŒ€ν•œ 쀑간 ν•™μŠ΅μ„ μˆ˜ν–‰ν•œ λͺ¨λΈμ΄ 일반 사전 ν•™μŠ΅ λ˜λŠ” μž„μƒ 도메인 사전 ν•™μŠ΅λ§Œ 거친 λͺ¨λΈλ³΄λ‹€ λ›°μ–΄λ‚œ μš”μ•½ μ„±λŠ₯κ³Ό 사싀성을 λ³΄μ—¬μ£Όμ—ˆμŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
쀑간 ν•™μŠ΅(mid-training)은 LLM을 νŠΉμ • 의료 도메인에 λ”μš± 효과적으둜 μ μ‘μ‹œμΌœ μžλ™ μš”μ•½ μ„±λŠ₯을 크게 ν–₯μƒμ‹œν‚¬ 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
쀑간 ν•™μŠ΅μ€ μ†ŒλŸ‰μ˜ λ°μ΄ν„°λ‘œλ„ μš°μˆ˜ν•œ μ„±λŠ₯을 λ‹¬μ„±ν•˜λŠ” few-shot learning λŠ₯λ ₯을 ν–₯μƒμ‹œν‚€κ³ , ν•™μŠ΅ 초기의 어렀움(cold start problem)을 μ™„ν™”ν•˜λŠ” 데 κΈ°μ—¬ν•©λ‹ˆλ‹€.
β€’
"사전 ν•™μŠ΅, 쀑간 ν•™μŠ΅, λ―Έμ„Έ μ‘°μ •" 방식이 기쑴의 "사전 ν•™μŠ΅, λ―Έμ„Έ μ‘°μ •" 방식보닀 νš¨κ³Όμ μž„μ„ μž…μ¦ν•˜λ©°, ν–₯ν›„ LLM 적용 연ꡬ에 μ€‘μš”ν•œ 방법둠적 λ°©ν–₯을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
λ³Έ μ—°κ΅¬μ—μ„œ μ‚¬μš©λœ 데이터셋 및 λͺ¨λΈμ˜ νŠΉμ • 도메인 편ν–₯ κ°€λŠ₯성에 λŒ€ν•œ 좔가적인 검증 및 λ‹€μ–‘ν•œ 의료 λ„λ©”μΈμœΌλ‘œμ˜ ν™•μž₯ 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘