Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Los modelos de lenguaje grande de Agentic mejoran la respuesta a preguntas de radiología basadas en la recuperación

Created by
  • Haebom

Autor

Sebastian Wind, Jeta Sopa, Daniel Truhn, Mahshad Lotfinia, Tri-Thien Nguyen, Keno Bressem, Lisa Adams, Mirabela Rusu, Harald Kostler , Gerhard Wellein, Andreas Maier, Soroosh Tayebi Arasteh

Describir

Este artículo propone un marco de Recuperación-Generación Aumentada (RAG) basado en agentes para la respuesta a preguntas (QA) en radiología. Para superar las limitaciones de los métodos convencionales de recuperación de un solo paso, construimos un sistema en el que los LLM descomponen de forma autónoma las preguntas de radiología y recuperan iterativamente evidencia clínica específica de la radiopedia para generar dinámicamente respuestas basadas en la evidencia. Evaluamos 24 LLM con diversas arquitecturas, tamaños de parámetros (de 0,5 B a más de 670 B) y paradigmas de aprendizaje (propósito general, optimización de inferencias y ajuste clínico) en 104 preguntas revisadas por expertos de los conjuntos de datos RSNA-RadioQA y ExtendedQA. La recuperación de agentes mejoró significativamente la precisión diagnóstica promedio en comparación con la incitación de disparo cero y la RAG en línea convencional (73 % frente a 64 %, p < 0,001; 73 % frente a 68 %, p < 0,001), especialmente para modelos de tamaño mediano. Además, redujimos las alucinaciones y mejoramos la evidencia factual al recuperar el contexto clínicamente relevante. También se observaron mejoras significativas en los modelos clínicamente ajustados, lo que sugiere funciones complementarias de la búsqueda y el ajuste.

Takeaways, Limitations

Takeaways:
El marco RAG basado en agentes demuestra potencial para mejorar el realismo y la precisión diagnóstica en el control de calidad en radiología.
Es particularmente eficaz en LLM de tamaño mediano y también contribuye a mejorar el rendimiento de los modelos de pequeña escala.
Hemos identificado funciones complementarias de búsqueda y ajuste.
Contribuye a fortalecer la base factual a través de la reducción de alucinaciones y la recuperación de información clínicamente relevante.
Limitations:
Se necesitan más estudios para verificar su utilidad clínica.
Para modelos muy grandes (>200B parámetros), la mejora del rendimiento fue mínima.
Se basa en datos de radiopedia y debe considerarse la influencia del sesgo de los datos.
👍