# Named Entity Recognition of Historical Texts via Large Language Model

### 저자

Shibingfeng Zhang, Giovanni Colavizza

### 💡 개요

본 연구는 역사적 텍스트에서 개체명 인식(NER)을 위한 대규모 언어 모델(LLM)의 적용 가능성을 탐구합니다. 전통적인 지도 학습 방식이 역사적 텍스트에 필요한 주석 데이터 부족으로 인해 어려움을 겪는 반면, 본 연구는 제로샷(zero-shot) 및 퓨샷(few-shot) 프롬프팅 전략을 활용하여 LLM의 성능을 평가했습니다. 실험 결과, LLM은 역사적 텍스트 NER에 대해 상당한 성능을 보였으며, 이는 저자원 환경에서의 정보 추출을 위한 효율적인 대안을 제시합니다.

### 🔑 시사점 및 한계

- LLM은 주석 데이터가 부족한 역사적 텍스트에서 개체명 인식을 위한 효과적인 제로샷/퓨샷 학습 방법을 제공합니다.

- LLM은 전통적인 지도 학습 모델에 비해 성능이 다소 떨어지지만, 역사적으로 중요한 자료의 정보 추출을 위한 실용적인 대안이 될 수 있습니다.

- 역사적 텍스트의 특수한 언어적 변이성과 노이즈를 완전히 극복하기 위해서는 추가적인 연구와 모델 개선이 필요합니다.

---

[PDF 보기](https://arxiv.org/pdf/2508.18090)

For the site tree, see the [root Markdown](https://slashpage.com/haebom.md).