Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

PadChest-GR: Un conjunto de datos bilingüe de rayos tórax X para la generación de informes de radiología basados ​​en la tierra

Created by
  • Haebom

Autor

Daniel C. Castro, Aurelia Bustos, Shruthi Bannur, Stephanie L. Hyland, Kenza Bouzid, Maria Teodora Wetscherek, Maria Dolores S anchez-Valverde, Lara Jaques-P erez, Lourdes P erez-Rodr iguez, Kenji Takeda, José María Salinas, Javier Alvarez-Valle, Joaquín Galant Herrero, Antonio Pertusa

Describir

PadChest-GR es el primer conjunto de datos anotados manualmente, diseñado para entrenar modelos de generación de informes radiológicos basados ​​en la evidencia (GRRG) para imágenes de la línea X torácica. Contiene 4555 estudios de la línea X torácica (3099 anormales y 1456 normales) y proporciona listas de oraciones que describen hallazgos individuales, tanto positivos como negativos, tanto en inglés como en español. Se incluyen un total de 7037 oraciones de hallazgos positivos y 3422 oraciones de hallazgos negativos, y cada oración de hallazgo positivo está asociada con hasta dos conjuntos independientes de cuadros delimitadores etiquetados por diferentes lectores, junto con etiquetas categóricas para el tipo de hallazgo, la ubicación y la progresión. Este conjunto de datos proporciona un recurso valioso para desarrollar y evaluar modelos GRRG que comprenden e interpretan imágenes radiológicas y texto generado.

Takeaways, Limitations

Takeaways:
Proporcionar el primer conjunto de datos anotados manualmente para entrenar modelos de generación de informes de radiología basados ​​en evidencia (GRRG) para imágenes de rayos X torácicos.
Soporte bilingüe en inglés y español.
Proporciona anotaciones completas e información de ubicación precisa para hallazgos positivos y negativos.
Proporciona recursos útiles para desarrollar y evaluar modelos GRRG.
Limitations:
El conjunto de datos puede ser relativamente pequeño (4.555 estudios).
El acceso al conjunto de datos se basa en solicitudes ( https://bimcv.cipf.es/bimcv-projects/padchest-gr/ ).
La generalización a otras modalidades de imágenes médicas puede ser limitada.
👍