Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
PlantVillageVQA: Un conjunto de datos de preguntas y respuestas visuales para evaluar modelos de visión y lenguaje en la ciencia vegetal.
Created by
Haebom
Autor
Syed Nazmus Sakib, Nafiul Haque, Mohammad Zabed Hossain, Shifat E. Arman
Describir
PlantVillageVQA es un conjunto de datos de preguntas y respuestas visuales (VQA) a gran escala basado en el conjunto de datos de imágenes PlantVillage, ampliamente utilizado. Está diseñado para impulsar el desarrollo y la evaluación de modelos de lenguaje visual para la toma de decisiones y el análisis agrícola. Consta de 193.609 pares de preguntas y respuestas (QA) de alta calidad basados en 55.448 imágenes que abarcan 14 especies de cultivos y 38 estados patológicos. Las preguntas se organizan en tres niveles de complejidad cognitiva y nueve categorías distintas. Cada categoría de pregunta se elaboró manualmente con la ayuda de expertos y se generó mediante un proceso automatizado de dos etapas: Etapa 1: síntesis de QA basada en plantillas utilizando metadatos de imágenes; Etapa 2: reconstrucción lingüística en varias etapas. El conjunto de datos fue revisado repetidamente por expertos en el área para garantizar su precisión y relevancia científicas. El conjunto de datos final se evaluó utilizando tres modelos de vanguardia para la evaluación de la calidad. El objetivo de este estudio es proporcionar una base de datos pública, estandarizada y validada por expertos para mejorar la precisión diagnóstica en la identificación de enfermedades de las plantas y promover la investigación científica en agricultura. El conjunto de datos se hará público en https://huggingface.co/datasets/SyedNazmusSakib/PlantVillageVQA .
Takeaways, Limitations
•
Takeaways:
◦
Proporcionar un conjunto de datos VQA a gran escala y de alta calidad para desarrollar y evaluar modelos de lenguaje visual en el campo agrícola.
◦
Contribuye a mejorar la precisión del diagnóstico de enfermedades de las plantas.
◦
Contribuir al avance de la investigación científica en el ámbito agrícola.
◦
Proporcionar conjuntos de datos estandarizados que han sido verificados por expertos.
•
Limitations:
◦
Se necesitan más estudios de validación sobre el tamaño y la calidad del conjunto de datos.
◦
Es necesario un análisis más profundo de las limitaciones del proceso de generación de preguntas.
◦
Posibilidad de desequilibrios en los datos para cultivos o enfermedades específicos.
◦
Se necesita más investigación sobre su aplicabilidad en entornos agrícolas reales.