Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

What Are the Facts? Automated Extraction of Court-Established Facts from Criminal-Court Opinions

Created by
  • Haebom
Category
Empty

저자

Klara Bendova, Toma\v{s} Knap, Jan \v{C}erny, Vojt\v{e}ch Pour, Jaromir Savelka, Ivana Kvapilikova, Jakub Drapal

개요

본 논문은 슬로바키아 법원의 공개 판결문에서 범죄 행위에 대한 설명을 추출하는 가능성을 연구한다. 정규 표현식과 대규모 언어 모델(LLM)을 활용한 두 가지 접근 방식을 사용하며, 기존의 단순한 정규 표현식 방식보다 향상된 결과를 보였다. 구체적으로, 고급 정규 표현식은 97%, LLM은 98.75%, 두 가지 방법의 결합은 99.5%의 높은 정확도를 달성했다. 또한, 법학 전공 학생들의 평가를 통해 두 고급 방법이 사람의 주석과 약 90% 일치함을 확인했다.

시사점, 한계점

시사점:
공개된 법원 판결문을 활용하여 범죄 행위에 대한 상세한 정보를 효과적으로 추출할 수 있음을 입증했다.
LLM을 활용하여 텍스트 데이터로부터 유의미한 정보를 추출하는 가능성을 보여주었다.
고급 정규 표현식 및 LLM을 활용한 방법은 기존 방식 대비 현저히 높은 정확도를 달성했다.
두 가지 방법의 결합을 통해 정확도를 더욱 향상시킬 수 있다.
한계점:
연구는 슬로바키아 법원의 판결문에 국한되어 일반화의 한계가 존재한다.
LLM의 성능은 모델 및 훈련 데이터에 따라 달라질 수 있다.
수동 검토를 통해 정확도를 평가했지만, 자동화된 평가 방법의 개발이 필요하다.
법적 전문 지식이 없는 일반 사용자가 결과를 이해하기 어려울 수 있다.
👍