Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprovechamiento de datos sintéticos para la respuesta a preguntas con LLM multilingües en el ámbito agrícola

Created by
  • Haebom

Autor

Rishemjit Kaur, Arshdeep Singh Bhankhar, Jashanpreet Singh Salh, Sudhir Rajput, Vidhi, Kashish Mahendra, Bhavika Berwal, Ritesh Kumar, Surangika Ranathunga

Describir

Este artículo presenta un estudio que genera un conjunto de datos sintéticos multilingües en inglés, hindi y punjabi a partir de documentos agrícolas indios y perfecciona un modelo lingüístico a gran escala (LLM) para mejorar el rendimiento de la respuesta a preguntas (QA) en el ámbito agrícola. Para subsanar las deficiencias del asesoramiento agrícola general que ofrecen los LLM existentes, nuestro objetivo es proporcionar información precisa y adaptada a los idiomas y contextos locales. Los resultados de la evaluación, realizada con conjuntos de datos generados por el usuario, muestran que el LLM perfeccionado ofrece un mejor rendimiento que los modelos existentes en términos de veracidad, relevancia y consenso agrícola.

Takeaways, Limitations

Takeaways:
El soporte multilingüe puede ayudar a superar las barreras lingüísticas en la agricultura india y mejorar el acceso de los agricultores a información precisa.
Mejorar el desempeño de las preguntas y respuestas mediante el ajuste del LLM puede contribuir al desarrollo de sistemas de apoyo a la toma de decisiones en el sector agrícola.
Sugiere direcciones para desarrollar LLM especializados para regiones e idiomas específicos.
Limitations:
Actualmente, el conjunto de datos se limita a la agricultura y las lenguas de la India. Se requiere más investigación para ampliarlo a otras regiones e idiomas.
Es necesario verificar la calidad del conjunto de datos sintéticos y las diferencias con los datos de campos agrícolas reales.
Se necesitan más investigaciones sobre la explicabilidad y confiabilidad del LLM.
👍