Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

L-MARS : Workflow juridique multi-agents avec raisonnement orchestré et recherche agentique

Created by
  • Haebom

Auteur

Ziqi Wang, Boqin Yuan

Contour

L-MARS est un système qui réduit la confusion et l'incertitude dans les réponses aux questions juridiques grâce au raisonnement et à la recherche multi-agents. Contrairement à la génération de recherche augmentée (RAG) en un seul passage, L-MARS décompose les questions en sous-problèmes, effectue des recherches ciblées dans des sources disparates (Web Serper, RAG local, jurisprudence CourtListener) et utilise des agents juges pour valider la suffisance, la compétence et la validité temporelle avant de synthétiser les réponses. Cette boucle itérative d'inférence, de recherche et de vérification garantit la cohérence, filtre les preuves parasites et fonde les réponses sur des lois faisant autorité. Nous avons évalué L-MARS sur LegalSearchQA, un nouveau benchmark composé de 200 questions juridiques à choix multiples de pointe datant de 2025. Les résultats démontrent que L-MARS améliore significativement la précision factuelle, réduit l'incertitude et obtient des scores de préférence plus élevés, tant pour les experts humains que pour les juges titulaires d'un LLM. Cette étude démontre que le raisonnement multi-agents via la recherche d'agents fournit un modèle évolutif et reproductible pour le déploiement du LLM dans des domaines à enjeux élevés nécessitant une recherche et une délibération juridiques précises.

Takeaways, Limitations

Takeaways:
Améliorer la précision et la fiabilité des réponses aux questions juridiques grâce à l’inférence multi-agents et à la recherche d’agents.
Fournir un cadre évolutif et reproductible pour l’application du LLM aux domaines à haut risque (domaines juridiques).
Recherche efficace d'informations et filtrage de preuves à l'aide de sources de données hétérogènes.
Scores de préférence élevés de la part d'experts humains et de juges basés sur le LLM.
Limitations:
Le benchmark LegalSearchQA est relativement petit (200 questions).
Absence d'analyse comparative des performances de L-MARS avec d'autres systèmes de réponses aux questions juridiques.
L’application et la vérification des performances de L-MARS dans des environnements juridiques réels sont nécessaires.
Manque d'explication détaillée des critères de jugement et de l'algorithme de l'agent juge.
👍