[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Cuantización optimizada para búsqueda en la alineación de ontologías biomédicas

Created by
  • Haebom

Autor

Oussama Bouaggad, Natalia Grabar

Describir

Este artículo presenta una técnica eficiente de optimización de modelos para resolver los problemas de consumo de energía, uso de memoria y latencia que surgen al implementar modelos de IA a gran escala en entornos con recursos limitados. Proponemos un método sistemático de correspondencia ontológica utilizando un modelo de vanguardia basado en Transformer, aprovechando la similitud semántica basada en coseno entre términos médicos no especializados y el metatesauro UMLS. Realizamos la optimización del modelo utilizando Microsoft Olive y ONNX Runtime, Intel Neural Compressor e IPEX, y la evaluamos aplicándola a dos tareas de la campaña de evaluación DEFT 2020. Como resultado, logramos un aumento promedio de 20 veces en la velocidad de inferencia y una reducción de aproximadamente el 70 % en el uso de memoria, superando el rendimiento de los modelos de vanguardia anteriores.

Takeaways, Limitations

Takeaways:
Presentamos una metodología sistemática para la optimización eficiente de modelos de IA a gran escala.
Alcanzar un nuevo estado del arte para los problemas de alineación ontológica en el ámbito sanitario.
Resultados que mejoran drásticamente la velocidad de inferencia y el uso de la memoria.
Presentación de métodos de utilización efectiva de diversas herramientas de optimización (Microsoft Olive, ONNX Runtime, Intel Neural Compressor, IPEX).
Limitations:
Se necesitan más investigaciones sobre la generalización de la metodología presentada (dependencia de datos y modelos médicos específicos).
Es necesario verificar la aplicabilidad a otros dominios u otros tipos de modelos.
Es necesario revisar las dependencias de versiones específicas de las herramientas de optimización utilizadas y la compatibilidad con versiones futuras.
Es necesario un análisis más profundo de la degradación de la precisión que puede ocurrir durante el proceso de optimización.
👍