Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

AImoclips : une référence pour évaluer la transmission des émotions dans la conversion de texte en musique

Created by
  • Haebom

Auteur

Gyehun Go, Satbyul Han, Ahyeon Choi, Eunjin Choi, Juhan Nam, Jeong Mi Park

Contour

Cet article présente AImoclips, une référence pour l'évaluation de l'expressivité émotionnelle des systèmes de conversion de texte en musique (TTM). Six systèmes TTM de pointe ont été utilisés pour générer plus de 1 000 clips musicaux basés sur 12 intentions émotionnelles, et 111 participants ont été invités à évaluer la valence et l'éveil de chaque clip sur une échelle de Likert à 9 points. Les résultats expérimentaux ont montré que les systèmes commerciaux avaient tendance à produire une musique plus agréable que prévu, tandis que les systèmes open source présentaient la tendance inverse. Tous les systèmes ont retransmis les émotions avec plus de précision en état d'éveil élevé, et tous les systèmes ont affiché un biais vers la neutralité émotionnelle. AImoclips fournit un aperçu des caractéristiques expressives émotionnelles de chaque modèle et soutient le développement futur de systèmes TTM émotionnellement congruents.

Takeaways, Limitations

Takeaways:
ÉTablissement de critères d'évaluation quantitatifs des capacités d'expression émotionnelle des systèmes TTM (benchmark AImoclips).
Analyse comparative des caractéristiques d'expression émotionnelle des systèmes TTM commerciaux et open source (les systèmes commerciaux ont tendance à produire des émotions plus agréables, tandis que les systèmes open source ont tendance à produire des émotions contraires aux intentions)
La communication émotionnelle est plus efficace dans un état d’excitation élevée.
Confirmation du biais de neutralité émotionnelle du système TTM
Limitations:
Les benchmarks AImoclips peuvent être limités à des émotions et des modèles spécifiques.
L’évaluation des émotions en utilisant uniquement la valence et l’excitation peut ne pas refléter pleinement la diversité des émotions.
Le nombre de participants peut être limité (111 personnes)
Des recherches supplémentaires sont nécessaires pour comprendre les causes et les solutions au biais de neutralité émotionnelle.
👍