Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Exploiter les données synthétiques pour répondre aux questions des LLM multilingues dans le domaine agricole

Created by
  • Haebom

Auteur

Rishemjit Kaur, Arshdeep Singh Bhankhar, Jashanpreet Singh Salh, Sudhir Rajput, Vidhi, Kashish Mahendra, Bhavika Berwal, Ritesh Kumar, Surangika Ranathunga

Contour

Cet article présente une étude qui génère un ensemble de données synthétiques multilingues en anglais, hindi et pendjabi à partir de documents agricoles indiens et affine un modèle linguistique à grande échelle (MLL) afin d'améliorer les performances des réponses aux questions agricoles (QA). Pour remédier aux lacunes des conseils agricoles généraux fournis par les LLM existants, nous souhaitons fournir des informations précises et adaptées aux langues et aux contextes locaux. Les résultats de l'évaluation, utilisant des ensembles de données générés par l'homme, montrent que le LLM affiné est plus performant que les modèles existants en termes de factualité, de pertinence et de consensus agricole.

Takeaways, Limitations

Takeaways:
Le support multilingue peut aider à surmonter les barrières linguistiques dans l’agriculture indienne et à améliorer l’accès des agriculteurs à des informations précises.
L’amélioration des performances en matière de réponses aux questions grâce à l’affinement du LLM peut contribuer au développement de systèmes d’aide à la décision dans le secteur agricole.
Il propose des orientations pour le développement de LLM spécialisés dans des régions et des langues spécifiques.
Limitations:
Actuellement, l'ensemble de données se limite à l'agriculture et aux langues indiennes. Des recherches supplémentaires sont nécessaires pour l'étendre à d'autres régions et langues.
Il est nécessaire de vérifier la qualité de l’ensemble de données synthétiques et les différences avec les données des champs agricoles réels.
Des recherches supplémentaires sont nécessaires sur l’explicabilité et la fiabilité du LLM.
👍