Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

COGITAO: Un marco de razonamiento visual para estudiar la composicionalidad y la generalización

Created by
  • Haebom

Autor

Yassine Taoudi-Benchekroun, Klim Troyan, Pascal Sager, Stefan Gerber, Lukas Tuggener, Benjamin Grewe

Describir

COGITAO es un marco de generación de datos modular y extensible, y un punto de referencia diseñado para estudiar sistemáticamente la composicionalidad y la generalización en el ámbito de la visión. Inspirado en el entorno de problemas ARC-AGI, construye tareas basadas en reglas que aplican un conjunto de transformaciones a objetos en un entorno de malla. Admite configuraciones con profundidad ajustable para 28 transformaciones interoperables y ofrece un amplio control sobre los parámetros de la malla y las propiedades de los objetos. Esta flexibilidad permite la generación de millones de reglas de tarea únicas (mucho más que los conjuntos de datos existentes) con dificultad variable y una generación de muestras prácticamente ilimitada por regla. Experimentos de referencia con modelos de visión de vanguardia demuestran que, a pesar de su excelente rendimiento específico para el dominio, COGITAO no logra generalizar a nuevas combinaciones de elementos familiares. COGITAO es completamente de código abierto, incluyendo todo el código y los conjuntos de datos, para apoyar la investigación continua en esta área.

Takeaways, Limitations

Takeaways:
Proporcionar un nuevo marco de referencia y generación de datos para estudiar el constructivismo y la generalización.
Cree tareas basadas en reglas que sean mucho más grandes y diversas que los conjuntos de datos tradicionales.
Presentar claramente las limitaciones de la capacidad de construcción y generalización de los modelos de visión de última generación.
Proporcionado como código abierto, contribuyendo a la activación de la investigación relacionada.
Limitations:
Actualmente la investigación se limita al ámbito visual.
Debido a su alta dependencia de operaciones basadas en reglas, puede tener limitaciones para resolver problemas complejos en el mundo real.
Es difícil evaluar completamente todas las posibilidades de COGITAO basándose únicamente en los resultados experimentales de referencia presentados.
👍