Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

UAR-NVC: Un marco autorregresivo unificado para la compresión de vídeo neuronal con memoria eficiente

Created by
  • Haebom

Autor

Jia Wang, Xinfeng Zhang, Gai Zhang, Jun Zhu, Lv Tang, Li Zhang

Describir

Este artículo presenta UAR-NVC (Unified AutoRegressive Framework for Memory-Eficient Neural Video Compression), un novedoso framework que aplica el procesamiento fotograma a fotograma de frameworks de compresión de vídeo existentes a las INR para abordar el problema del consumo de memoria en la compresión de vídeo mediante Representaciones Neuronales Implícitas (INR). UAR-NVC integra frameworks de compresión de vídeo basados ​​en INR y existentes desde una perspectiva de modelado autorregresivo temporal, segmentando un vídeo en múltiples clips y utilizando una instancia de modelo INR diferente para cada clip. Diseñamos dos módulos para optimizar la inicialización, el entrenamiento y la compresión de los parámetros del modelo y reducir la redundancia temporal entre clips. La latencia se puede ajustar variando la duración del clip, y los resultados experimentales muestran un rendimiento mejorado en comparación con varios modelos de referencia.

Takeaways, Limitations

Takeaways:
Se presenta un enfoque novedoso para resolver el problema de memoria de la compresión de vídeo basada en INR existente.
Integración de marcos de compresión de vídeo existentes y basados ​​en INR desde una perspectiva de modelado autorregresivo basado en el tiempo.
Ajuste flexible del tiempo de espera mediante el ajuste de la longitud del clip.
Presentando la posibilidad de una compresión de vídeo eficiente en entornos con recursos limitados.
Mejora del rendimiento respecto a los modelos anteriores.
Limitations:
Se necesita más investigación sobre la estrategia de segmentación de clips y la configuración óptima de la longitud de clip del método propuesto.
Es necesaria una evaluación del rendimiento de generalización para varios tipos de vídeo.
Se requiere evaluación y optimización del rendimiento en entornos de aplicaciones reales.
👍