Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Segmentar primero, recuperar mejor: búsqueda legal realista mediante consultas retóricas basadas en roles

Created by
  • Haebom

Autor

Shubham Kumar Nigam, Tanmay Dubey, Noel Shallum, Arnab Bhattacharya

Describir

TraceRetriever es un sistema de recuperación de precedentes legales que opera con información limitada de casos, extrayendo solo las partes significativas para la investigación en lugar de requerir documentos completos, replicando así las búsquedas legales del mundo real. Integra BM25, una base de datos vectorial, y un modelo de codificador cruzado para combinar los resultados iniciales mediante fusión de rangos recíprocos, seguida de una reclasificación final. Genera anotaciones de investigación utilizando un clasificador jerárquico CRF BiLSTM entrenado con sentencias indias. Evaluado en los conjuntos de datos IL-PCR y COLIEE 2025, TraceRetriever aborda el creciente volumen de documentos a la vez que optimiza la investigación legal al proporcionar una base confiable y escalable para la recuperación de precedentes legales, incluso cuando solo se dispone de información parcial de los casos, cumpliendo con las limitaciones de búsqueda del mundo real.

Takeaways, Limitations

Takeaways:
Demuestra que es posible realizar una búsqueda eficaz de precedentes legales incluso con información de casos limitada.
Presentamos un enfoque adecuado para entornos de búsqueda legal del mundo real.
Integración efectiva de BM25, bases de datos vectoriales y modelos de codificador cruzado.
Proporciona una solución práctica para buscar grandes volúmenes de documentos legales.
Apoyando una investigación jurídica confiable con sólo información parcial de casos.
Limitations:
El conjunto de datos utilizado se limita a sentencias de una región específica (India).
Se necesitan más investigaciones para determinar la generalización a otros sistemas jurídicos y lenguajes.
Se necesita una mayor validación del rendimiento del modelo de generación de anotaciones de investigación.
Se necesitan estudios comparativos con otros métodos de fusión distintos de la fusión de rangos recíprocos.
👍