Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Transmisión de vídeo adaptativa con conciencia semántica mediante modelos de difusión latente para redes inalámbricas

Created by
  • Haebom

Autor

Zijiang Yan, Jianhua Pei, Hongda Wu, Hina Tabassum, Ping Wang

Describir

Este artículo propone un nuevo marco de comunicación semántica (SemCom) para la transmisión de vídeo con tasa de bits adaptativa en tiempo real mediante la integración del Modelo de Difusión Latente (LDM) en técnicas FFmpeg. Para abordar el alto consumo de ancho de banda, la ineficiencia de almacenamiento y la degradación de la QoE asociados a la transmisión CBR y ABR convencional, comprimimos los fotogramas I en un espacio latente para ahorrar espacio de almacenamiento y transmisión semántica, manteniendo al mismo tiempo una alta calidad de imagen. Los fotogramas B y P se conservan como metadatos de coordinación para permitir una reconstrucción de vídeo eficiente en el usuario. Además, se integran técnicas de vanguardia de reducción de ruido e interpolación de fotogramas de vídeo (VFI) para mitigar la ambigüedad semántica y restaurar la coherencia temporal entre fotogramas, incluso en entornos inalámbricos ruidosos. Los resultados experimentales demuestran que el método propuesto logra una transmisión de vídeo de alta calidad con un uso optimizado del ancho de banda y supera a las soluciones más avanzadas en términos de QoE y eficiencia de recursos. Esta investigación abre nuevas posibilidades para la transmisión de vídeo escalable en tiempo real en redes 5G y 5G de próxima generación.

Takeaways, Limitations

Takeaways:
Permite la transmisión de video de alta calidad al tiempo que ahorra ancho de banda y espacio de almacenamiento a través de una compresión I-frame eficiente usando LDM.
La cancelación de ruido y la tecnología VFI proporcionan una transmisión de video estable y de alta calidad incluso en entornos ruidosos.
Contribuir al avance de la tecnología de transmisión de video en tiempo real en redes 5G y de próxima generación.
Mejore la experiencia del usuario mejorando la calidad de la experiencia y la eficiencia de los recursos.
Limitations:
Se necesita analizar y mejorar la complejidad computacional de los procesos de compresión y restauración basados en LDM.
Es necesaria una evaluación del rendimiento de generalización para diversos entornos de red y contenidos de vídeo.
Se necesita investigación y desarrollo adicionales para aplicaciones comerciales prácticas.
Se requiere una evaluación de dependencia para modelos y parámetros LDM específicos.
👍