Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

TASER: Agentes de tabla para la extracción y recomendación guiadas por esquemas

Created by
  • Haebom

Autor

Nicole Cho, Kirsty Fielding, William Watson, Sumitra Ganesh, Manuela Veloso

Describir

Este artículo propone TASER (Agentes de Tabla para la Extracción y Recomendación Guiadas por Esquemas), un sistema basado en agentes para la extracción de datos de tablas no estructuradas de varias páginas de documentos financieros reales. TASER transforma tablas no estructuradas en resultados regularizados y compatibles con esquemas mediante agentes que realizan la detección, clasificación, extracción y sugerencias de modificación de esquemas. En concreto, TASER incorpora mejoras de esquemas mediante aprendizaje continuo, enfatiza la eficacia del aprendizaje por lotes a gran escala y logra una mejora del rendimiento del 10,1 % con respecto a modelos existentes como Table Transformer. Además, presentamos un novedoso conjunto de datos de tablas financieras, TASERTab, que comprende 22 584 páginas (28 150 449 tokens), 3213 tablas y un total de 731 685 511 687 USD en datos de activos.

Takeaways, Limitations

Takeaways:
Proporciona una solución eficaz al problema de extraer datos de tablas complejos y no estructurados de documentos financieros del mundo real.
Demostración de la eficacia de un sistema de extracción guiado por esquemas y basado en agentes
Enfatizar la importancia de la mejora del rendimiento y la mejora del esquema a través del aprendizaje continuo.
Permitir la investigación mediante la publicación de un conjunto de datos a gran escala, TASERTab, que incluye datos financieros del mundo real.
Mejora del rendimiento del 10,1 % con respecto a Table Transformer
Recomendaciones de esquemas mejoradas y mayor extracción de activos a través del aprendizaje por lotes a gran escala (9,8%).
Limitations:
La información disponible actualmente no es suficiente para proporcionar una descripción detallada de la arquitectura y los algoritmos específicos del sistema TASER.
Se necesita un análisis más profundo de la calidad y el sesgo del conjunto de datos TASERTab.
Se requiere una evaluación del desempeño de generalización para varios tipos de documentos financieros y estructuras de tablas.
Falta de análisis comparativo con otros sistemas basados ​​en agentes.
👍