本論文は、RGB画像、奥行き画像、単眼カメラ、多眼カメラのビデオなど、さまざまなカメラ入力データからの最近の手のジェスチャーや3D手の姿勢認識の分野の発展を総合的に検討する調査です。人間とコンピュータの相互作用の需要が増加するにつれて、重要性が高まっている手のジェスチャー認識の分野では、最新の研究動向、利用可能なソリューション、ベンチマークデータセットを包括的にカバーするアンケートが不足していることに対処します。さまざまなアプローチの異なる方法論的要件を検討し、広く使用されているデータセットの概要を提供し、各データセットの主な特徴と適用分野について詳しく説明します。最後に、実際の環境での強力な認識の達成、閉塞処理、さまざまなユーザーの一般化の保証、リアルタイムアプリケーションのための計算効率のトラブルシューティングなどのオープンな課題を強調し、今後の研究方向を提示します。