Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Segmentez d'abord, récupérez mieux : recherche juridique réaliste via des requêtes rhétoriques basées sur les rôles

Created by
  • Haebom

Auteur

Shubham Kumar Nigam, Tanmay Dubey, Noel Shallum, Arnab Bhattacharya

Contour

TraceRetriever est un système de recherche de précédents juridiques fonctionnant avec des informations limitées sur les affaires, n'extrayant que les parties pertinentes pour l'enquête plutôt que les documents complets, reproduisant ainsi les recherches juridiques réelles. Il intègre BM25, une base de données vectorielle, et un modèle d'encodage croisé pour combiner les résultats initiaux par fusion de rangs réciproques, puis par reclassement final. Il génère des annotations d'enquête à l'aide d'un classificateur hiérarchique BiLSTM CRF entraîné sur les jugements indiens. Évalué sur les jeux de données IL-PCR et COLIEE 2025, TraceRetriever répond au volume croissant de documents tout en améliorant la recherche juridique en fournissant une base de recherche de précédents juridiques fiable et évolutive, même lorsque seules des informations partielles sont disponibles, répondant ainsi aux contraintes de recherche réelles.

Takeaways, Limitations

Takeaways:
Démontre qu’une recherche efficace de précédents juridiques est possible même avec des informations limitées sur les affaires.
Présentation d’une approche adaptée aux environnements de recherche juridique réels.
Intégration efficace de BM25, de base de données vectorielles et de modèles d'encodeurs croisés.
Fournir une solution pratique pour rechercher de grands volumes de documents juridiques.
Soutenir une recherche juridique fiable avec seulement des informations partielles sur les cas.
Limitations:
L'ensemble de données utilisé est limité aux jugements d'une région spécifique (l'Inde).
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité à d’autres systèmes juridiques et langues.
Une validation supplémentaire des performances du modèle de génération d’annotations d’investigation est nécessaire.
Des études comparatives avec d’autres méthodes de fusion autres que la fusion par rang réciproque sont nécessaires.
👍