Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

TERRE : Structurer l'évolution créative grâce à l'erreur de modèle dans l'IA générative

Created by
  • Haebom

Auteur

Yusen Peng, Shuhua Mao

Contour

Cet article propose le cadre EARTH pour atteindre une véritable créativité en IA. EARTH est un pipeline génératif composé de cinq étapes : génération d'erreurs, amplification, sélection affinée, transformation et exploitation du feedback. Il transforme les erreurs de génération de modèles en ressources créatives. S'appuyant sur les sciences cognitives et la modélisation générative, il utilise des invites structurées, des scores sémantiques et des évaluations participatives, partant du principe que « le potentiel créatif réside dans l'échec ». Le cadre est implémenté à l'aide de LLaMA-2-7B-Chat, SBERT, BERTScore, CLIP, BLIP-2 et Stable Diffusion, utilisant une fonction de récompense composite basée sur la nouveauté, la surprise et la pertinence. L'étape d'affinement a entraîné une augmentation de 52,5 % des scores de créativité et une amélioration de 70,4 % du résultat final. Le slogan affiné était 48,4 % plus court, présentait une augmentation de 40,7 % de la nouveauté et une diminution de 4,0 % de la pertinence. Les tests multimodaux ont démontré une forte congruence entre le slogan et l'image. Les résultats générés par les évaluations humaines ont montré une grande qualité créative et une clarté expressive.

Takeaways, Limitations

Takeaways:
Démontrer empiriquement que la génération axée sur les erreurs et basée sur le feedback améliore la créativité.
Le cadre EARTH présente le potentiel de développement d’une IA évolutive, auto-évolutive, centrée sur l’humain et créative.
Un cadre pratique utilisant divers outils (LLaMA-2-7B-Chat, SBERT, BERTScore, CLIP, BLIP-2, Stable Diffusion) est présenté.
Démontrer l’excellence des résultats générés par une évaluation quantitative et qualitative.
Limitations:
Dépendance à des modèles et ensembles de données spécifiques. La généralisabilité à d'autres modèles et ensembles de données doit être vérifiée.
La subjectivité de l'évaluation humaine. La nécessité de mesures d'évaluation plus objectives.
La complexité du cadre. Difficultés de mise en œuvre et d'application.
Des recherches supplémentaires sont nécessaires sur les capacités d’auto-évolution à long terme.
👍