Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

APT: Entrenamiento personalizado adaptativo para modelos de difusión con datos limitados

Created by
  • Haebom

Autor

JungWoo Chae, Jiyoon Kim, JaeWoong Choi, Kyungyul Kim, Sangheum Hwang

Describir

La personalización de modelos de difusión con datos limitados plantea desafíos significativos, como el sobreajuste, la pérdida de conocimiento previo y la alineación deficiente del texto. El sobreajuste provoca cambios en la distribución de las predicciones de ruido, lo que dificulta el proceso de eliminación de ruido y hace que el modelo pierda consistencia semántica. En este artículo, proponemos el aprendizaje personalizado adaptativo (APT), un nuevo marco que mitiga el sobreajuste mediante estrategias de aprendizaje adaptativo y la regulación de la representación interna del modelo durante el ajuste fino. El APT consta de tres componentes principales: (1) coordinación del aprendizaje adaptativo, que detecta el grado de sobreajuste en cada intervalo de tiempo mediante la introducción de una métrica de sobreajuste y aplica aumento de datos adaptativo y ponderación de pérdida adaptativa con base en esta métrica; (2) estabilización de la representación, que regula la media y la varianza de los mapas de características intermedios para evitar cambios excesivos en las predicciones de ruido; y (3) preservación del conocimiento previo para la alineación de la atención, que alinea los mapas de atención cruzada del modelo ajustado con los del modelo preentrenado para mantener el conocimiento previo y la consistencia semántica. Amplios experimentos demuestran que la APT supera a los métodos existentes a la hora de mitigar eficazmente el sobreajuste, preservar el conocimiento previo y generar imágenes diversas y de alta calidad con datos de referencia limitados.

Takeaways, Limitations

Takeaways: Presentar una solución efectiva al problema de personalizar modelos de difusión con datos limitados, demostrar la viabilidad de aliviar los problemas de sobreajuste y generar imágenes de alta calidad preservando el conocimiento previo y mejorar el rendimiento del modelo a través de estrategias de aprendizaje adaptativo y regularización de la representación.
Limitations: El rendimiento de APT puede depender de conjuntos de datos específicos o arquitecturas de modelos, los costos computacionales pueden aumentar en aplicaciones prácticas y el rendimiento de generalización debe verificarse para varios tipos de datos y situaciones de sobreajuste.
👍