[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Un método de segmentación de tumores cerebrales basado en CLIP y 3D U-Net con guía semántica intermodal y fusión de características multinivel

Created by
  • Haebom

Autor

Mingda Zhang

Describir

En este artículo, proponemos una arquitectura de fusión multinivel basada en aprendizaje profundo para la segmentación precisa de tumores cerebrales mediante imágenes por resonancia magnética (IRM). A diferencia de los métodos existentes, como 3D U-Net, que se basan únicamente en características visuales extraídas de secuencias de IRM, este estudio utiliza el conocimiento semántico contenido en informes médicos. El modelo de preentrenamiento contrastivo de lenguaje e imagen (CLIP) se utiliza para integrar información a nivel de píxel, a nivel de característica y a nivel semántico para permitir el procesamiento integral de datos de bajo nivel a conceptos de alto nivel mediante fusión multinivel. El modelo propuesto combina la capacidad de comprensión semántica del modelo CLIP con la capacidad de extracción de características espaciales de 3D U-Net a través de tres mecanismos: enlace semántico 3D-2D, guía semántica intermodal y mecanismo de atención semántica. Los resultados experimentales en el conjunto de datos BraTS 2020 muestran que el modelo propuesto alcanza 0,8567, lo que representa una mejora del 4,8 % en el coeficiente de Dice general en comparación con el 3D U-Net existente, y el coeficiente de Dice aumenta en un 7,3 % en la región del tumor realzador (ET) clínicamente importante.

Takeaways, Limitations

Takeaways:
Demostramos que aprovechar la información semántica de los informes médicos puede mejorar el rendimiento de la segmentación de tumores cerebrales.
Proponemos una arquitectura de fusión de múltiples niveles que pueda procesar eficazmente desde datos de bajo nivel hasta conceptos de alto nivel.
Al combinar las fortalezas del modelo CLIP y 3D U-Net, hemos mejorado significativamente la precisión de la segmentación de tumores cerebrales, especialmente en la región ET, clínicamente importante.
Limitations:
Se requiere mayor investigación sobre el rendimiento de generalización del modelo propuesto. Es necesario evaluar su rendimiento en conjuntos de datos distintos del conjunto de datos BraTS 2020.
El rendimiento del modelo puede verse afectado por la calidad y la consistencia de los informes médicos. Es necesario evaluar la robustez de los diferentes tipos de informes médicos.
El modelo CLIP puede ser computacionalmente costoso y podría no ser adecuado para aplicaciones en tiempo real. Se necesita investigación para mejorar la eficiencia computacional.
👍