Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Language Models and Logic Programs for Trustworthy Financial Reasoning

Created by
  • Haebom

저자

William Jurayj, Nils Holzenberger, Benjamin Van Durme

개요

본 논문은 미국 국세청에 따르면 평균적으로 미국인이 세금 신고에 270달러와 13시간을 소비한다는 점을 언급하며, 세금 신고가 복잡한 추론과 겹치는 규칙 적용 및 수치 계산을 필요로 한다는 점을 지적합니다. 오류는 큰 비용을 초래할 수 있으므로 자동화 시스템은 높은 정확성과 감사 가능성을 제공해야 하며, 이는 현대의 대규모 언어 모델(LLM)에는 적합하지 않습니다. 따라서 본 논문에서는 세금 의무를 계산하기 위해 LLM과 기호적 솔버를 통합하는 접근 방식을 제안합니다. 어려운 법적 추론 평가(SARA) 데이터셋에서 이 시스템의 변형을 평가하고, 실제 세금 오류에 대한 페널티를 기반으로 시스템 배포 비용을 추정하는 새로운 방법을 포함합니다. 또한 일반 텍스트 규칙을 공식 논리 프로그램으로 사전 변환하고 공식적인 사례 표현에 대한 예시를 지능적으로 검색하는 것을 결합하여 이 작업의 성능을 크게 향상시키고 비용을 실제 평균보다 훨씬 낮출 수 있음을 보여줍니다. 결과는 신뢰할 수 있는 세금 지원에 대한 공정한 접근을 증진하기 위한 신경 기호 아키텍처의 가능성과 경제적 타당성을 보여줍니다.

시사점, 한계점

시사점:
LLM과 기호적 솔버의 통합을 통해 세금 신고 자동화 시스템의 정확성과 감사 가능성을 높일 수 있음을 보여줍니다.
실제 세금 오류 페널티를 기반으로 시스템 배포 비용을 추정하는 새로운 방법을 제시합니다.
일반 텍스트 규칙의 공식 논리 프로그램 변환 및 지능적인 예시 검색을 통해 시스템 성능 향상 및 비용 절감 가능성을 입증합니다.
신뢰할 수 있는 세금 지원에 대한 공정한 접근 증진에 기여할 수 있는 신경 기호 아키텍처의 가능성과 경제적 타당성을 제시합니다.
한계점:
SARA 데이터셋을 사용한 평가 결과의 일반화 가능성에 대한 추가 연구가 필요합니다.
실제 세금 시스템의 복잡성을 완전히 반영하는지에 대한 검토가 필요합니다.
시스템 배포 비용 추정 방법의 정확성 및 범용성에 대한 추가 검증이 필요합니다.
다양한 국가의 세금 제도에 대한 적용 가능성 및 한계에 대한 추가 연구가 필요합니다.
👍