Sign In

Named Entity Recognition of Historical Texts via Large Language Model

Created by
  • Haebom
Category
Empty

μ €μž

Shibingfeng Zhang, Giovanni Colavizza

πŸ’‘ κ°œμš”

λ³Έ μ—°κ΅¬λŠ” 역사적 ν…μŠ€νŠΈμ—μ„œ 개체λͺ… 인식(NER)을 μœ„ν•œ λŒ€κ·œλͺ¨ μ–Έμ–΄ λͺ¨λΈ(LLM)의 적용 κ°€λŠ₯성을 νƒκ΅¬ν•©λ‹ˆλ‹€. 전톡적인 지도 ν•™μŠ΅ 방식이 역사적 ν…μŠ€νŠΈμ— ν•„μš”ν•œ 주석 데이터 λΆ€μ‘±μœΌλ‘œ 인해 어렀움을 κ²ͺλŠ” 반면, λ³Έ μ—°κ΅¬λŠ” μ œλ‘œμƒ·(zero-shot) 및 퓨샷(few-shot) ν”„λ‘¬ν”„νŒ… μ „λž΅μ„ ν™œμš©ν•˜μ—¬ LLM의 μ„±λŠ₯을 ν‰κ°€ν–ˆμŠ΅λ‹ˆλ‹€. μ‹€ν—˜ κ²°κ³Ό, LLM은 역사적 ν…μŠ€νŠΈ NER에 λŒ€ν•΄ μƒλ‹Ήν•œ μ„±λŠ₯을 λ³΄μ˜€μœΌλ©°, μ΄λŠ” μ €μžμ› ν™˜κ²½μ—μ„œμ˜ 정보 μΆ”μΆœμ„ μœ„ν•œ 효율적인 λŒ€μ•ˆμ„ μ œμ‹œν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
LLM은 주석 데이터가 λΆ€μ‘±ν•œ 역사적 ν…μŠ€νŠΈμ—μ„œ 개체λͺ… 인식을 μœ„ν•œ 효과적인 μ œλ‘œμƒ·/퓨샷 ν•™μŠ΅ 방법을 μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
LLM은 전톡적인 지도 ν•™μŠ΅ λͺ¨λΈμ— λΉ„ν•΄ μ„±λŠ₯이 λ‹€μ†Œ λ–¨μ–΄μ§€μ§€λ§Œ, μ—­μ‚¬μ μœΌλ‘œ μ€‘μš”ν•œ 자료의 정보 μΆ”μΆœμ„ μœ„ν•œ μ‹€μš©μ μΈ λŒ€μ•ˆμ΄ 될 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
역사적 ν…μŠ€νŠΈμ˜ νŠΉμˆ˜ν•œ 언어적 변이성과 λ…Έμ΄μ¦ˆλ₯Ό μ™„μ „νžˆ κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄μ„œλŠ” 좔가적인 연ꡬ와 λͺ¨λΈ κ°œμ„ μ΄ ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘