Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

L-MARS: Flujo de trabajo multiagente legal con razonamiento orquestado y búsqueda agéntica

Created by
  • Haebom

Autor

Ziqi Wang, Boqin Yuan

Describir

L-MARS es un sistema que reduce la confusión y la incertidumbre en la respuesta a preguntas legales mediante razonamiento y recuperación multiagente. A diferencia de la Generación de Búsqueda Aumentada (RAG) de una sola pasada, L-MARS descompone las preguntas en subproblemas, realiza búsquedas específicas en diversas fuentes (web de Serper, RAG local, jurisprudencia de CourtListener) y utiliza agentes de jueces para validar la suficiencia, la jurisdicción y la validez temporal antes de sintetizar las respuestas. Este ciclo iterativo de inferencia, recuperación y verificación garantiza la consistencia, filtra la evidencia confusa y fundamenta las respuestas en el derecho autorizado. Evaluamos L-MARS en LegalSearchQA, un nuevo punto de referencia compuesto por 200 preguntas legales de opción múltiple de vanguardia a partir de 2025. Los resultados demuestran que L-MARS mejora significativamente la precisión fáctica, reduce la incertidumbre y logra puntuaciones de preferencia más altas tanto para expertos humanos como para jueces con maestría en Derecho (LLM). Este estudio demuestra que el razonamiento de múltiples agentes a través de la búsqueda de agentes proporciona un modelo escalable y reproducible para implementar LLM en áreas de alto riesgo que requieren una búsqueda y deliberación legal precisa.

Takeaways, Limitations

Takeaways:
Mejorar la precisión y confiabilidad de las respuestas a preguntas legales mediante la inferencia de múltiples agentes y la búsqueda de agentes.
Proporcionar un marco escalable y reproducible para aplicar LLM a áreas de alto riesgo (campos legales).
Recuperación efectiva de información y filtrado de evidencia utilizando fuentes de datos heterogéneas.
Altas puntuaciones de preferencia tanto de expertos humanos como de jueces con título de LLM.
Limitations:
El parámetro de referencia de LegalSearchQA es relativamente pequeño (200 preguntas).
Falta de análisis comparativo del desempeño de L-MARS con otros sistemas de respuesta a preguntas legales.
Se requiere la aplicación y verificación del rendimiento de L-MARS en entornos legales reales.
Falta de explicación detallada de los criterios y algoritmo de juicio del agente juez.
👍