Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

¡FRIDA al rescate! Análisis de la efectividad de los datos sintéticos en el razonamiento de sentido común basado en objetos para la respuesta ante desastres.

Created by
  • Haebom

Autor

Mollie Shichman, Claire Bonial, Austin Blodgett, Taylor Hudson, Francis Ferraro, Rachel Rudinger

Describir

Este artículo presenta el potencial de aprovechar las capacidades de razonamiento físico de los modelos de lenguaje a gran escala (LLM) para la interacción humano-robot (HRI) en situaciones de socorro ante desastres. Para abordar las limitaciones de tamaño de los grandes LLM existentes, proponemos un conjunto de datos y una secuencia de comandos para generar un modelo de Agente de Razonamiento de Campo y Decodificación de Instrucciones (FRIDA). Combinando el conocimiento de expertos en la materia y lingüistas, generamos indicaciones de alta calidad y de pocas instancias, que posteriormente se utilizan para perfeccionar un modelo pequeño, optimizado para instrucciones, utilizando datos sintéticos. Demostramos experimentalmente que un modelo FRIDA entrenado exclusivamente con datos de estado físico y características de objetos supera a los modelos entrenados completamente con datos sintéticos y modelos de referencia, lo que demuestra la capacidad de inculcar sentido común físico con datos mínimos.

Takeaways, Limitations

Takeaways:
Se sugiere la posibilidad de utilizar pequeños LLM para dotar a los robots de socorro en casos de desastre de capacidades de razonamiento físico.
Presentamos un método para generar datos de alta calidad y entrenar modelos eficientes a través de la colaboración entre expertos del dominio y lingüistas.
Revelamos que el estado físico y los datos funcionales de los objetos son factores importantes para mejorar el rendimiento de la inferencia física.
Demostramos que es posible realizar un ajuste fino del LLM con datos mínimos.
Limitations:
Se necesitan más investigaciones para evaluar el desempeño de generalización del pipeline FRIDA actualmente propuesto y su aplicabilidad a diversas situaciones de desastre.
Posible degradación del rendimiento debido a limitaciones en la calidad y cantidad de datos sintéticos utilizados.
Falta de validación experimental en entornos de desastre reales.
Se necesita una evaluación del desempeño para tareas de razonamiento físico más diversas y complejas.
👍