本論文は,小規模歩行異常検知の公的に利用可能なビデオデータを用いた時空間深層学習フレームワークを提案する。 42頭の50個のビデオクリップで構成されたバランスのとれたデータセットを構築して公開し、データ拡張技術を適用して3D CNNとConvLSTM2Dの2つの深層学習モデルを訓練および評価しました。 3D CNNモデルは、90%のビデオレベル分類精度と90.9%の精度、再現率、F1スコアを達成し、ConvLSTM2Dモデル(85%精度)を上回りました。従来の物体検出や姿勢推定などの多段階パイプラインに依存する方法とは異なり、この研究は直接エンドツーエンドビデオ分類アプローチの効果を実証しています。これにより、さまざまなビデオソースから時空間的特徴を効果的に抽出して学習し、実際の農場環境でスケーラブルで効率的な牛の歩行異常検出を可能にします。