[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

MedPix 2.0: Un conjunto integral de datos biomédicos multimodales para aplicaciones avanzadas de IA con recuperación, generación aumentada y gráficos de conocimiento

Created by
  • Haebom

Autor

Irene Siragusa, Salvatore Contino, Massimo La Ciura, Rosario Alicata, Roberto Pirrone

Describir

Este documento aborda el desafío de la falta de conjuntos de datos de alta calidad debido a las preocupaciones sobre la privacidad, a pesar del creciente interés en desarrollar aplicaciones de IA en el ámbito de la salud. Los avances en los modelos de lenguaje de visión (VLM) han llevado a una creciente necesidad de conjuntos de datos de salud multimodales con informes clínicos y opiniones adjuntas a las exploraciones médicas. Este documento presenta el flujo de trabajo completo para construir el conjunto de datos MedPix 2.0 basado en MedPix®, un conjunto de datos multimodal utilizado principalmente para fines de educación médica continua para médicos, enfermeras y estudiantes de medicina. Una tubería semiautomática para extraer datos visuales y textuales y un procedimiento de curación manual para eliminar muestras de ruido se utilizan para crear una base de datos MongoDB. Junto con el conjunto de datos, desarrollamos una interfaz gráfica de usuario (GUI) para explorar eficientemente la instancia de MongoDB y obtener datos sin procesar que se pueden usar fácilmente para el entrenamiento y/o ajuste del VLM. Presentamos DR-Minerva, un modelo VLM generativo de recuperación aumentada entrenado con MedPix 2.0, y proponemos un modelo extendido de DR-Minerva que utiliza grafos de conocimiento mediante Llama 3.1 Instruct 8B. La arquitectura resultante puede consultarse de principio a fin como un sistema de apoyo a la toma de decisiones sanitarias. MedPix 2.0 está disponible en GitHub.

Takeaways, Limitations

Takeaways:
Ofrecemos MedPix 2.0, un conjunto de datos médicos multimodales de alta calidad esencial para el desarrollo de VLM en el ámbito de la atención médica.
Proporciona una GUI para la exploración y utilización eficiente del conjunto de datos MedPix 2.0.
Presentamos el modelo DR-Minerva y su modelo extendido que puede utilizarse como sistema de apoyo a la toma de decisiones médicas basado en MedPix 2.0.
Hemos hecho que nuestro conjunto de datos sea más accesible a través de GitHub.
Limitations:
Falta de información específica sobre el tamaño y la diversidad del conjunto de datos.
Falta de análisis de posibles sesgos que puedan surgir durante la recogida y procesamiento de datos.
Falta de detalles sobre la evaluación del desempeño del modelo DR-Minerva.
No hay soluciones específicas a las preocupaciones sobre la privacidad (no se hace mención explícita de cómo se tuvo en cuenta la privacidad durante el proceso de construcción del conjunto de datos).
👍