Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Orientación rápida y percepción proximal humana para la predicción de HOT con pérdida articular regional

Created by
  • Haebom

Autor

Yuxiao Wang, Yu Lei, Zhenao Wei, Weiying Xue, Xinyu Jiang, Nan Zhuang, Qi Liu

Describir

En este artículo, proponemos un nuevo marco para la detección de contacto humano-objeto (HOT), P3HOT. P3HOT combina la guía rápida y el reconocimiento de proximidad humana para dirigir la atención de la red a regiones relevantes según la correlación entre imágenes y textos, y elimina eficazmente las regiones donde no se esperan interacciones mediante parámetros aprendibles. Utiliza información de profundidad para resolver la incertidumbre de la superposición entre personas y objetos en perspectivas 2D, proporciona una perspectiva cuasi-3D e introduce una pérdida de articulación específica de la región (RJLoss) para suprimir categorías anormales dentro de la misma región. Además, proponemos una nueva métrica de evaluación, "AD-Acc.", para abordar las deficiencias de los métodos existentes. Los resultados experimentales muestran que alcanza un rendimiento de vanguardia en las cuatro métricas en dos conjuntos de datos de referencia. En particular, en el conjunto de datos anotados HOT, se logran mejoras de 0,7, 2,0, 1,6 y 11,0 en las métricas SC-Acc., mIoU, wIoU y AD-Acc., respectivamente. El código fuente se encuentra en https://github.com/YuxiaoWang-AI/P3HOT .

Takeaways, Limitations

Takeaways:
Se presenta un nuevo marco de detección de HOT, P3HOT, que combina la guía rápida y el reconocimiento de proximidad humana.
Superar las limitaciones 2D y proporcionar perspectivas cuasi-3D mediante el uso de información de profundidad
Supresión de categoría anormal mediante pérdida conjunta de dominio (RJLoss)
Nueva métrica de evaluación AD-Acc. Propuesta y rendimiento mejorado con respecto a los métodos existentes.
Lograr un rendimiento de vanguardia en una variedad de métricas
Limitations:
Se necesita una validación adicional del rendimiento de generalización del método propuesto.
Se necesita una evaluación de robustez para varios tipos de imágenes y objetos.
Es necesario comprobar si existe un posible sobreajuste en conjuntos de datos específicos
👍