[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Optimización de la compresión de imágenes aprendidas en cuantificación escalar y con restricciones de entropía

Created by
  • Haebom

Autor

Florian Borzechowski, Michael Schafer , Heiko Schwarz, Jonathan Pfaff, Detlev Marpe, Thomas Wiegand

Describir

En este artículo, proponemos un método novedoso para abordar el problema de que, a pesar de la mejora continua de la compresión de imágenes mediante autocodificadores variacionales (VAE), el proceso de cuantificación no se considera con precisión en el proceso de aprendizaje. Los métodos existentes presentan limitaciones, ya que no pueden modelar con precisión el ruido de cuantificación en el proceso de aproximación de la cuantificación, lo que resulta en redes subóptimas. Por lo tanto, proponemos un paso adicional de ajuste fino después del aprendizaje convencional de extremo a extremo, en el que una parte de la red se reentrena utilizando las variables latentes cuantificadas obtenidas en el paso de inferencia. En particular, para cuantificadores con restricciones de entropía, como la cuantificación codificada por Trellis, es particularmente difícil aproximar el efecto de la cuantificación redondeando o añadiendo ruido, ya que las variables latentes cuantificadas se seleccionan de forma interdependiente a través de la búsqueda de trellis basada tanto en el modelo de entropía como en la medida de distorsión. Demostramos que el reentrenamiento con datos cuantificados con precisión proporciona consistentemente una ganancia de codificación adicional, tanto para la cuantificación escalar uniforme como para la cuantificación con restricciones de entropía, sin aumentar la complejidad de la inferencia. Para el conjunto de prueba Kodak, logramos una reducción promedio de la tasa de bits de Bj{\o}ntegaard-Delta del 1% al 2%, y para el conjunto de prueba TecNick, de hasta el 2,2%.

Takeaways, Limitations

Takeaways:
Presentamos un método novedoso para mejorar el rendimiento de la compresión de imágenes basada en VAE considerando con precisión el proceso de cuantificación.
También se puede aplicar eficazmente a técnicas de cuantificación complejas, como la cuantificación con restricciones de entropía.
Se pueden lograr ganancias en la codificación sin aumentar la complejidad de la inferencia.
Se demostraron mejoras sustanciales en el rendimiento en los equipos de prueba Kodak y TecNick.
Limitations:
Se necesitan más estudios para determinar si el método propuesto garantiza el mismo nivel de mejora del rendimiento para todos los tipos de técnicas de cuantificación.
Es necesaria una evaluación del rendimiento en otros conjuntos de datos de imágenes.
Es posible que se necesiten más investigaciones para determinar la configuración óptima de los parámetros para la etapa de ajuste fino.
👍