Cet article aborde l'importance et les défis de la reconnaissance de concepts abstraits (par exemple, la justice, la liberté et la solidarité) dans la compréhension automatique de contenus vidéo. Contrairement aux recherches précédentes axées sur la reconnaissance d'objets, d'actions et d'événements concrets, cet article se concentre sur la compréhension de concepts abstraits en vidéo en imitant le raisonnement abstrait humain. Nous proposons la possibilité de résoudre ce problème en exploitant des modèles fondamentaux récemment développés, en examinant divers travaux et ensembles de données connexes, et en suggérant des orientations de recherche futures basées sur les expériences passées. Cette approche est importante non seulement pour le progrès technologique, mais aussi pour améliorer la cohérence du modèle avec le raisonnement et les valeurs humaines.