Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Razonamiento abductivo basado en la consistencia sobre errores perceptuales de múltiples modelos preentrenados en entornos novedosos

작성자
  • Haebom

Autor

Mario Leiva, Noel Ngu, Joshua Shay Kricheli, Aditya Taparia, Ransalu Senanayake, Paulo Shakarian, Nathaniel Bastian, John Corcoran, Gerardo Simari

Describir

Este artículo aborda el problema de la degradación del rendimiento debido a los cambios distribucionales que ocurren al aplicar modelos de reconocimiento pre-entrenados a nuevos entornos. Los enfoques metacognitivos existentes utilizan reglas lógicas para caracterizar y filtrar errores de modelo, pero mejorar la precisión a menudo implica una menor recuperación. Este artículo plantea la hipótesis de que el aprovechamiento de múltiples modelos pre-entrenados puede mitigar esta degradación de la recuperación. Formulamos el problema de identificar y gestionar predicciones conflictivas de diferentes modelos como un problema de inferencia inductiva basado en la consistencia, basado en los conceptos de aprendizaje adaptativo (ABL), pero aplicándolo en el momento de la prueba en lugar del momento del entrenamiento. Las predicciones de entrada y las reglas de detección de errores aprendidas derivadas de cada modelo se codifican en un programa lógico. Luego encontramos una explicación inductiva (un subconjunto de predicciones del modelo) que maximiza la cobertura de la predicción mientras mantiene la tasa de discrepancia lógica (derivada de las restricciones del dominio) por debajo de un umbral especificado. Proponemos dos algoritmos para esta tarea de representación del conocimiento: un método exacto basado en programación entera (PI) y una búsqueda heurística eficiente (HS). Experimentos exhaustivos con conjuntos de datos de imágenes aéreas simuladas que presentan variaciones distribucionales complejas y controladas demuestran que nuestro marco de inferencia inductiva basado en la consistencia supera tanto a los modelos individuales como a las líneas base de conjunto estándar, logrando una mejora de aproximadamente el 13,6 % en la puntuación F1 y del 16,6 % en la precisión, en comparación con el mejor modelo individual en 15 conjuntos de datos de prueba diversos. Estos resultados demuestran que la inferencia inductiva basada en la consistencia puede utilizarse como un mecanismo eficaz para integrar de forma robusta el conocimiento de múltiples modelos imperfectos en nuevos escenarios complejos.

Takeaways, Limitations

Takeaways:
Presentamos un nuevo marco que integra predicciones de múltiples modelos preentrenados a través de inferencia inductiva basada en consistencia.
Sugiriendo la posibilidad de desarrollar un modelo de reconocimiento robusto a los cambios distributivos
Prueba de aplicabilidad a diversas situaciones a través de dos algoritmos: programación entera (PI) y búsqueda heurística (BH).
Mejora del rendimiento con respecto a los métodos existentes en conjuntos de datos de imágenes aéreas simuladas (mejora del 13,6 % en la puntuación F1, mejora del 16,6 % en la precisión)
Limitations:
Se necesita más investigación para determinar la aplicabilidad de este método a entornos del mundo real utilizando conjuntos de datos simulados.
Dependencia de la configuración y definición de las restricciones del dominio
Se necesita más investigación sobre la complejidad computacional y la escalabilidad del algoritmo.
Es necesaria la verificación de generalización para varios tipos de modelos de reconocimiento y conjuntos de datos.
👍