Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

L'illusion de personnalité : révéler la dissociation entre auto-évaluation et comportement dans les masters de droit

Created by
  • Haebom

Auteur

Pengrui Han, Rafal Kocielnik, Peiyang Song, Ramit Debnath, Dean Mobbs, Anima Anandkumar, R. Michael Alvarez

Contour

Cet article analyse systématiquement les traits de personnalité dans les modèles linguistiques à grande échelle (MLH), évaluant la dynamique de leur expression à travers les étapes d'apprentissage, la validité prédictive des traits autodéclarés et l'impact d'interventions telles que l'infusion de personnalité. Nos résultats démontrent que l'ajustement pédagogique (par exemple, RLHF) stabilise l'expression des traits et renforce leurs corrélations, comme dans les données humaines. Cependant, les traits autodéclarés ne prédisent pas de manière fiable le comportement, et les corrélations observées ne correspondent souvent pas aux schémas humains. L'infusion de personnalité oriente efficacement les autodéclarations dans la direction souhaitée, mais a des effets limités, voire incohérents, sur le comportement réel. Par conséquent, en distinguant l'expression superficielle des traits de la cohérence comportementale, nous remettons en question les hypothèses sur la personnalité dans les LHH et soulignons la nécessité d'une évaluation plus approfondie de l'alignement et de l'interprétabilité.

Takeaways, Limitations

Takeaways:
Au cours de ma formation LLM, j’ai découvert que l’alignement directif joue un rôle crucial dans l’augmentation de la stabilité et de la cohérence de l’expression des traits de personnalité.
Les traits de personnalité autodéclarés par les LLM montrent des limites dans la prédiction du comportement réel.
Nous avons constaté que des interventions telles que l’infusion de personnalité influençaient les auto-évaluations LLM mais avaient des effets limités sur le changement de comportement réel.
Limitations:
Il est possible que les traits de personnalité des candidats au LLM aient été évalués uniquement sur la base d'auto-évaluations et d'observations comportementales. Des méthodes d'évaluation plus diversifiées et plus sophistiquées pourraient être nécessaires.
Les résultats peuvent varier selon le type de LLM utilisé dans l'étude et les caractéristiques des données d'apprentissage. Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité.
La relation complexe entre les traits de personnalité et les comportements en LLM n'est peut-être pas entièrement expliquée. Une analyse et une interprétation plus approfondies sont nécessaires.
👍