Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

PianoVAM : un ensemble de données multimodales sur les performances au piano

Created by
  • Haebom

Auteur

Yonghyun Kim, Junhyung Park, Joonhyung Bae, Kirak Kim, Taegyun Kwon, Alexander Lerch, Juhan Nam

Contour

PianoVAM est un ensemble complet de données de performance pianistique couvrant plusieurs modes (vidéo, audio, MIDI, repères de main, notations du manche et métadonnées riches). Il a été enregistré sur un piano Disklavier lors de séances d'entraînement quotidiennes par des pianistes amateurs, capturant des données audio et MIDI ainsi que des vidéos synchronisées en vue de dessus dans divers environnements de performance réels. Les repères de main et les notations du manche ont été extraits à l'aide d'un modèle d'estimation de la posture des mains pré-entraîné et d'un algorithme de notation du manche semi-automatique. Nous abordons les difficultés rencontrées lors de la collecte et de l'alignement des données entre différents modes, ainsi qu'une méthode de notation du manche basée sur des repères de main extraits de vidéos. Nous présentons des résultats de référence pour la transcription de piano audio et audiovisuelle à l'aide de l'ensemble de données PianoVAM, et abordons d'autres applications potentielles.

Takeaways, Limitations

Takeaways :
Contribuer à l'avancement de la recherche dans le domaine du MIR en fournissant un ensemble complet de données de performance au piano contenant des données de divers modes.
Une recherche réaliste est possible avec un ensemble de données qui reflète l’environnement de performance réel.
Fournit des résultats d'analyse comparative pour la transcription audio uniquement et audiovisuelle au piano.
Une nouvelle méthode de notation du manche basée sur les repères de la main est présentée.
Limitations:
L'ensemble de données est limité aux données de performance des pianistes amateurs.
Il existe une possibilité d'erreurs en raison de l'utilisation d'un algorithme de notation semi-automatique du manche.
Des difficultés de collecte de données et d'harmonisation entre les modes ont été constatées. Le point spécifique Limitations nécessite des explications supplémentaires.
👍