Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Mesurer la diversité dans les ensembles de données synthétiques

Created by
  • Haebom

Auteur

Yuchang Zhu, Huizhe Zhang, Bingzhe Wu, Jintang Li, Zibin Zheng, Peilin Zhao, Liang Chen, Yatao Bian

Contour

Cet article propose DCScore, une nouvelle méthode de mesure de la diversité des ensembles de données synthétiques générés à l'aide de modèles linguistiques à grande échelle (MLH). Pour relever les défis liés à la mesure de la diversité dans les ensembles de données synthétiques existants, DCScore formalise l'évaluation de la diversité comme une tâche de classification d'échantillons, exploitant les relations inter-échantillons. La validation théorique démontre que DCScore satisfait les axiomes liés à la diversité. Les résultats expérimentaux sur des ensembles de données synthétiques démontrent que DCScore présente une corrélation plus élevée avec diverses pseudo-vérités que les méthodes existantes, tout en réduisant les coûts de calcul. Le code est disponible sur GitHub.

Takeaways, Limitations

Takeaways:
Nous présentons une nouvelle méthode (DCScore) pour mesurer efficacement et efficacement la diversité des ensembles de données synthétiques basés sur LLM.
Démonstration de performances de mesure de diversité améliorées et d'efficacité de calcul par rapport aux méthodes existantes.
Assurer la validité du DCScore sur la base de bases théoriques.
Reproductibilité et convivialité accrues grâce au code ouvert.
Limitations:
Les résultats expérimentaux présentés peuvent être limités à des ensembles de données synthétiques spécifiques.
Il est nécessaire de prendre en compte différentes perspectives pour définir et mesurer la diversité.
Une évaluation plus approfondie des performances de DCScore dans des applications réelles est nécessaire.
👍