Cet article présente AImoclips, une référence pour l'évaluation de l'expressivité émotionnelle des systèmes de conversion de texte en musique (TTM). Six systèmes TTM de pointe ont été utilisés pour générer plus de 1 000 clips musicaux basés sur 12 intentions émotionnelles, et 111 participants ont été invités à évaluer la valence et l'éveil de chaque clip sur une échelle de Likert à 9 points. Les résultats expérimentaux ont montré que les systèmes commerciaux avaient tendance à produire une musique plus agréable que prévu, tandis que les systèmes open source présentaient la tendance inverse. Tous les systèmes ont retransmis les émotions avec plus de précision en état d'éveil élevé, et tous les systèmes ont affiché un biais vers la neutralité émotionnelle. AImoclips fournit un aperçu des caractéristiques expressives émotionnelles de chaque modèle et soutient le développement futur de systèmes TTM émotionnellement congruents.