Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Orientación rápida y percepción proximal humana para la predicción de HOT con pérdida articular regional
Created by
Haebom
Autor
Yuxiao Wang, Yu Lei, Zhenao Wei, Weiying Xue, Xinyu Jiang, Nan Zhuang, Qi Liu
Describir
En este artículo, proponemos un nuevo marco para la detección de contacto humano-objeto (HOT), P3HOT. P3HOT combina la guía rápida y el reconocimiento de proximidad humana para dirigir la atención de la red a regiones relevantes según la correlación entre imágenes y textos, y elimina eficazmente las regiones donde no se esperan interacciones mediante parámetros aprendibles. Utiliza información de profundidad para resolver la incertidumbre de la superposición entre personas y objetos en perspectivas 2D, proporciona una perspectiva cuasi-3D e introduce una pérdida de articulación específica de la región (RJLoss) para suprimir categorías anormales dentro de la misma región. Además, proponemos una nueva métrica de evaluación, "AD-Acc.", para abordar las deficiencias de los métodos existentes. Los resultados experimentales muestran que alcanza un rendimiento de vanguardia en las cuatro métricas en dos conjuntos de datos de referencia. En particular, en el conjunto de datos anotados HOT, se logran mejoras de 0,7, 2,0, 1,6 y 11,0 en las métricas SC-Acc., mIoU, wIoU y AD-Acc., respectivamente. El código fuente se encuentra en https://github.com/YuxiaoWang-AI/P3HOT .