Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

TrustGeoGen: Motor de datos con verificación formal para la resolución confiable de problemas geométricos multimodales

Created by
  • Haebom

Autor

Daocheng Fu, Jianlong Chen, Renqiu Xia, Zijun Chen, Qi Liu, Yuan Feng, Hongbin Zhou, Renrui Zhang, Shiyang Feng, Peng Gao, Hongyuan Zha, Junchi Yan, Botian Shi, Yu Qiao, Bo Zhang

Describir

Este artículo presenta TrustGeoGen, un motor de datos que genera problemas geométricos formalmente validados para construir un punto de referencia confiable para la resolución matemática de problemas de geometría (GPS). TrustGeoGen integra cuatro innovaciones fundamentales: alineación multimodal, verificación formal, pensamiento conectado y la serie de algoritmos GeoExplore, para generar diversas variantes de problemas con diversas soluciones y capacidades de seguimiento autorreflexivo. Utilizando este motor, generamos el conjunto de datos GeoTrust-200K y el punto de referencia GeoTrust-test, que garantizan la integridad intermodal. Los resultados experimentales demuestran la dificultad de este punto de referencia, ya que el modelo de vanguardia alcanza una precisión de tan solo el 45,83 % en GeoTrust-test. Además, el entrenamiento con datos sintéticos mejora significativamente el rendimiento del modelo en tareas GPS y optimiza la generalización a puntos de referencia fuera del dominio (OOD). El código y los datos están disponibles en https://github.com/Alpha-Innovator/TrustGeoGen .

Takeaways, Limitations

Takeaways:
Contribuir al avance de la investigación en el campo de la resolución de problemas geométricos (GPS) proporcionando conjuntos de datos de problemas geométricos verificados oficialmente y puntos de referencia GeoTrust-200K y GeoTrust-test.
Demostramos que el entrenamiento con datos sintéticos generados a través del motor TrustGeoGen es eficaz para mejorar el rendimiento del modelo para tareas de GPS y mejorar el rendimiento de generalización entre dominios.
Resolver el problema de alucinaciones del LLM Limitations existente y sugerir la posibilidad de construir un conjunto de datos GPS confiable.
Limitations:
Es necesario ampliar aún más la escala del conjunto de datos GeoTrust-200K en el futuro.
Se necesita una validación adicional para garantizar que las capacidades de generación del motor TrustGeoGen puedan manejar completamente todo tipo de problemas geométricos.
Los parámetros de referencia actuales muestran que los modelos de última generación funcionan menos del 50% del tiempo, lo que sugiere que aún quedan muchos desafíos por superar.
👍