[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Forêts de conversation : la clé pour affiner les modèles de langage volumineux destinés aux conversations médicales multi-tours réside dans la ramification.

Created by
  • Haebom

Auteur

Thomas Savage

Contour

Dans cet article, nous proposons Savage Conversation Forests (SCF), un cadre d'apprentissage par renforcement permettant d'affiner les modèles de langage à grande échelle (MLL) pour des tâches de conversation à plusieurs tours. Les méthodes existantes, telles que DPO et GRPO, sont efficaces pour les tâches à un seul tour, mais ne conviennent pas aux tâches à plusieurs tours, telles que les entretiens de diagnostic médical, où les premiers tours de conversation influencent les résultats. SCF génère plusieurs continuations de conversation possibles pour chaque tour, permettant au modèle d'apprendre comment les réponses initiales affectent les interactions ultérieures et les résultats du diagnostic. Lors d'expériences de simulation sur des conversations médecin-patient, SCF atteint une précision diagnostique supérieure aux structures de conversation linéaires, ce qui suggère que la structure d'apprentissage ramifiée est une stratégie importante pour affiner les LLM pour des tâches de conversation complexes à plusieurs tours.

Takeaways, Limitations

Takeaways:
Un nouveau cadre d'apprentissage par renforcement SCF est présenté pour améliorer les performances du LLM dans les tâches de conversation à plusieurs tours.
Suggérant la possibilité d'obtenir des résultats diagnostiques plus précis en considérant l'influence du cycle de conversation initial à travers une structure de conversation ramifiée
Suggère l'applicabilité à une variété de tâches de conversation complexes à plusieurs tours, y compris celles dans le domaine médical
Fournit un moyen efficace d'apprendre comment les réponses initiales impactent les interactions ultérieures
Limitations:
Les résultats expérimentaux actuellement présentés se limitent à la simulation d'une conversation médecin-patient. Une vérification en milieu médical réel est nécessaire.
Il n'est pas clair si l'amélioration des performances du SCF est due à la structure ramifiée ou à d'autres facteurs. Une analyse complémentaire est nécessaire.
Des recherches supplémentaires sont nécessaires sur la généralisabilité à d’autres tâches de conversation multi-sessions.
👍