Daily Arxiv

世界中で発行される人工知能関連の論文をまとめるページです。
このページはGoogle Geminiを活用して要約し、非営利で運営しています。
論文の著作権は著者および関連機関にあり、共有する際は出典を明記してください。

Segment First, Retrieve Better: Realistic Legal Search via Rhetorical Role-Based Queries

Created by
  • Haebom

作者

Shubham Kumar Nigam, Tanmay Dubey, Noel Shallum, Arnab Bhattacharya

概要

TraceRetrieverは、限られたケース情報だけで動作し、文書全体を要求するのではなく、調査的に重要な部分のみを抽出することによって実際の法的検索を反映する法的先例検索システムです。 BM25、ベクトルデータベース、およびクロスエンコーダモデルを統合して、初期結果を相互ランク融合(Reciprocal Rank Fusion)で結合し、最終的な再ランク付けを実行します。インドの判決文を使用して、訓練を受けた階層型BiLSTM CRF分類器を使用して捜査注釈を作成します。 IL-PCRおよびCOLIEE 2025データセットで評価されたTraceRetrieverは、増加する文書量の問題を解決しながら、実際の検索制約に合わせて部分的なケース情報のみが利用可能な場合でも信頼できる拡張可能な法的先行検索基盤を提供し、法律研究を向上させます。

Takeaways、Limitations

Takeaways:
限られたケース情報だけで効果的な法律先例検索が可能であることを示しています。
実際の法律検索環境に適したアプローチを提示します。
BM25、ベクトルデータベース、クロスエンコーダモデルの効果的な統合
大量の法律文書を検索するための実用的な解決策を提供します。
部分的なケース情報だけでも信頼できる法律研究支援。
Limitations:
使用されるデータセットは、特定の地域(インド)の判決文に限定されています。
他の法体系や言語の一般化の可能性に関するさらなる研究が必要です。
調査的注釈生成モデルの性能の追加検証が必要
Reciprocal Rank Fusion以外の融合法との比較研究が必要
👍