Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Aprendizaje continuo para múltiples modalidades

Created by
  • Haebom

Autor

Hyundong Jin y Eunwoo Kim

Describir

Este artículo propone un nuevo marco para el aprendizaje continuo en escenarios que involucran múltiples modalidades (imágenes, video, audio, profundidad y texto). Para superar las limitaciones de los métodos existentes de aprendizaje continuo de modalidad única, empleamos un enfoque que entrena modelos que alinean varias modalidades con texto. Para abordar el problema del olvido del conocimiento existente debido a las diferencias entre modalidades, presentamos un marco que integra el conocimiento dentro de las modalidades e integra información intermodal relevante. Este marco autorregula los cambios en las representaciones aprendidas para incorporar gradualmente nuevo conocimiento e integra selectivamente el conocimiento previamente aprendido de las modalidades con base en sus interrelaciones, mitigando la interferencia entre ellas. Además, presentamos una estrategia para realinear las incrustaciones de modalidad para abordar la alineación sesgada entre modalidades. Evaluamos el método propuesto en una amplia gama de escenarios de aprendizaje continuo en múltiples conjuntos de datos utilizando diferentes modalidades, y demostramos experimentalmente que supera a los métodos existentes, independientemente de si se especifica la identidad de modalidad.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para los problemas de aprendizaje continuo multimodal.
Proponer una estrategia eficaz para la integración del conocimiento intermodal y la mitigación de interferencias.
Abordar los problemas de sesgo mediante la reordenación de la incorporación de modalidades
Se demostró un rendimiento superior al de los métodos existentes en diversos conjuntos de datos y escenarios.
Limitations:
Falta de análisis del coste computacional y la complejidad del método propuesto.
Falta de evaluación del desempeño de generalización para combinaciones de modalidades específicas
Falta de discusión sobre la aplicabilidad y las limitaciones en aplicaciones del mundo real.
👍