[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

MedPix 2.0 : un ensemble complet de données biomédicales multimodales pour les applications d'IA avancées avec récupération, génération augmentée et graphes de connaissances

Created by
  • Haebom

Auteur

Irène Siragusa, Salvatore Contino, Massimo La Ciura, Rosario Alicata, Roberto Pirrone

Contour

Cet article aborde le problème du manque d'ensembles de données de haute qualité, dû aux préoccupations en matière de confidentialité, malgré l'intérêt croissant pour le développement d'applications d'IA dans le domaine de la santé. Les progrès des modèles de langage visuel (MLV) ont entraîné un besoin croissant d'ensembles de données de santé multimodaux, comprenant des rapports et des avis cliniques joints aux scanners médicaux. Cet article présente le flux de travail complet pour la création de l'ensemble de données MedPix 2.0 basé sur MedPix®, un ensemble de données multimodal principalement utilisé à des fins de formation médicale continue pour les médecins, les infirmières et les étudiants en médecine. Un pipeline semi-automatique d'extraction de données visuelles et textuelles et une procédure de curation manuelle pour la suppression des échantillons de bruit sont utilisés pour créer une base de données MongoDB. Parallèlement à cet ensemble de données, nous développons une interface utilisateur graphique (GUI) permettant d'explorer efficacement l'instance MongoDB et d'obtenir des données brutes facilement exploitables pour l'entraînement et/ou le réglage fin du MLV. Nous présentons DR-Minerva, un modèle VLM génératif augmenté par récupération, entraîné avec MedPix 2.0, et proposons un modèle étendu de DR-Minerva utilisant des graphes de connaissances basés sur Llama 3.1 Instruct 8B. L'architecture résultante peut être interrogée de bout en bout comme un système d'aide à la décision en matière de santé. MedPix 2.0 est disponible sur GitHub.

Takeaways, Limitations

Takeaways:
Nous fournissons MedPix 2.0, un ensemble de données médicales multimodales de haute qualité essentiel au développement VLM dans le domaine de la santé.
Fournit une interface graphique pour une exploration et une utilisation efficaces de l'ensemble de données MedPix 2.0.
Nous présentons le modèle DR-Minerva et son modèle étendu qui peuvent être utilisés comme système d'aide à la décision médicale basé sur MedPix 2.0.
Nous avons rendu notre ensemble de données plus accessible via GitHub.
Limitations:
Manque d’informations spécifiques sur la taille et la diversité de l’ensemble de données.
Manque d’analyse des biais potentiels qui peuvent survenir lors de la collecte et du traitement des données.
Manque de détails sur l'évaluation des performances du modèle DR-Minerva.
Aucune solution spécifique aux problèmes de confidentialité (aucune mention explicite n’est faite de la manière dont la confidentialité a été prise en compte lors du processus de construction de l’ensemble de données).
👍