Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

LLMs for Translation: Historical, Low-Resourced Languages and Contemporary AI Models

Created by
  • Haebom
Category
Empty

저자

Merve Tekgurler

개요

본 논문은 구글의 Gemini와 같은 대규모 언어 모델(LLM)이 18세기 오스만 터키어 원고("불신자의 포로: 티미쇼아라의 오스만 아가의 회고록")를 영어로 번역하는 성능을 분석한 연구입니다. 분석 결과, Gemini의 안전 메커니즘이 원고의 14~23%를 유해한 내용으로 분류하여 번역하지 않아 완전하고 정확한 번역을 방해하는 것으로 나타났습니다. 이를 통해 LLM의 안전 설정이 민감하고 맥락이 풍부한 역사적 자료 처리에 어려움을 겪는다는 점을 실제 사례를 통해 보여줍니다. 현대 전쟁 피해자들의 증언 번역 등 정확하고 포괄적인 번역이 중요한 상황에서 LLM의 한계를 강조합니다.

시사점, 한계점

시사점: LLM의 안전 메커니즘이 민감한 역사적 자료 번역에 있어서 오역이나 누락을 야기할 수 있음을 보여줍니다. LLM의 안전 기능 개선 및 역사적 맥락 고려의 중요성을 강조합니다. 현대적 상황에서 LLM의 번역 정확성에 대한 우려를 제기하며, 법적 절차나 인도주의적 문서화 등에서의 LLM 활용에 대한 신중한 접근을 요구합니다.
한계점: 본 연구는 특정 LLM(Gemini)과 특정 원고에 대한 분석 결과를 바탕으로 하므로, 다른 LLM이나 자료에 대한 일반화에는 한계가 있습니다. LLM의 안전 메커니즘의 세부 동작 원리에 대한 자세한 설명이 부족합니다. 안전 메커니즘의 오류를 개선하기 위한 구체적인 방안 제시는 미흡합니다.
👍