Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

L-MARS: Legal Multi-Agent Workflow with Orchestrated Reasoning and Agentic Search

Created by
  • Haebom

作者

Ziqi Wang, Boqin Yuan

概要

L-MARSは、マルチエージェント推論と検索を通じて、法律質問の回答における幻覚と不確実性を減らすシステムです。シングルパス検索拡張生成(RAG)とは異なり、L-MARSは質問をサブ問題に分解し、異種ソース(Serper Web、ローカルRAG、CourtListener判例)からターゲット検索を実行し、回答の総合前に十分性、管轄権、および時間的検証を行う裁判官エージェントを使用します。これらの反復的な推論 - 検索 - 検証ループは一貫性を維持し、ノイズの多い証拠をフィルタリングし、権威ある法律に答えに基づいています。 2025年、最新のマルチ選択法の質問200の新しいベンチマークであるLegalSearchQAでL-MARSを評価しました。結果は,L-MARSが事実の精度を大幅に改善し,不確実性を低減し,人間の専門家とLLMベースの裁判官の両方に高い好みスコアを達成することを示した。この研究は、エージェント検索によるマルチエージェント推論が、正確な法的検索と審議を必要とする高リスク領域にLLMを展開するための拡張可能で再現可能な青写真を提供することを示しています。

Takeaways、Limitations

Takeaways:
マルチエージェント推論とエージェント検索による法的質問応答の精度と信頼性の向上
LLMを高リスク領域(法律分野)に適用するためのスケーラブルで再現可能なフレームワークの提供。
異種データソースを活用した効果的な情報検索と証拠フィルタリング
人間の専門家とLLMベースの裁判官の両方に高い選好スコアを獲得。
Limitations:
LegalSearchQAベンチマークの規模が比較的小さい(200の質問)。
L-MARSの性能が異なる法律質問応答システムとの比較分析が不足している。
実際の法律環境におけるL-MARSの適用と性能検証が必要です。
裁判官の判断基準とアルゴリズムの詳細な説明の欠如。
👍