Este artículo analiza exhaustivamente los avances recientes en el reconocimiento de gestos y poses de manos en 3D a partir de diversas entradas de cámara, incluyendo imágenes RGB, imágenes de profundidad y vídeos de cámaras monoculares o multilente. Este estudio aborda la falta de un estudio exhaustivo que abarque las tendencias de investigación recientes, las soluciones disponibles y los conjuntos de datos de referencia en un campo de reconocimiento de gestos de manos que cobra cada vez mayor importancia debido a la creciente demanda de interacción persona-computadora. Revisamos los diferentes requisitos metodológicos de los distintos enfoques, ofrecemos una visión general de los conjuntos de datos más utilizados y detallamos sus características clave y áreas de aplicación. Finalmente, destacamos los retos pendientes, como lograr un reconocimiento robusto en entornos reales, gestionar la oclusión, garantizar la generalización entre diversos usuarios y abordar la eficiencia computacional para aplicaciones en tiempo real, sugiriendo futuras líneas de investigación.