Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

UniOcc: Un punto de referencia unificado para la previsión y predicción de la ocupación en la conducción autónoma

Created by
  • Haebom

Autor

Yuping Wang, Xiangyu Huang, Xiaokang Sun, Mingxuan Yan, Shuo Xing, Zhengzhong Tu, Jiachen Li

Describir

UniOcc es un conjunto completo de herramientas de referencia para la predicción de ocupación (predicción de la ocupación futura con base en información histórica) y el pronóstico de ocupación (predicción de la ocupación actual con base en imágenes de cámara). Integra conjuntos de datos reales, como nuScenes y Waymo, con datos de simuladores de conducción de alta fidelidad, como CARLA y OpenCOOD, para proporcionar etiquetas de ocupación 2D/3D y una innovadora anotación de flujo píxel a píxel. Al evitar las pseudoetiquetas subóptimas utilizadas en estudios existentes e introducir nuevas métricas de evaluación que no se basan en etiquetas reales, permite una evaluación robusta de aspectos adicionales de la calidad de la ocupación. Amplios experimentos con modelos de vanguardia demuestran que los datos de entrenamiento grandes y diversos, junto con la información explícita sobre el flujo, mejoran significativamente la predicción de ocupación y el rendimiento del pronóstico. Los datos y el código están disponibles en https://uniocc.github.io/ .

Takeaways, Limitations

Takeaways:
Contribuye a la predicción de ocupación y mejora el rendimiento de la predicción mediante la integración de conjuntos de datos grandes y diversos.
Es posible realizar una evaluación más sólida al presentar una nueva métrica de evaluación que no dependa de la etiqueta de respuesta correcta.
Mejore el rendimiento aprovechando la información de flujo por píxel.
La reproducibilidad y el avance de la investigación son posibles gracias a conjuntos de datos y códigos abiertos.
Limitations:
El algoritmo propuesto actualmente, Limitations, no se menciona explícitamente en el artículo. Se requiere más investigación para evaluar su rendimiento de generalización y su vulnerabilidad a entornos específicos.
👍