Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Système de réécriture des termes AlphaPhysics pour la notation des expressions algébriques aux examens de physique

Created by
  • Haebom

Auteur

Peter Baumgartner, Lachlan McGinness

Contour

Cet article présente une méthode d'automatisation de la notation des examens de physique combinant un système de calcul formel, un solveur SMT et un système de réécriture de termes. Un modèle de langage à grande échelle (LLM) est utilisé pour supprimer les erreurs des réponses des étudiants et les réécrire dans un format lisible par machine. L'exactitude de ces réponses est ensuite évaluée à l'aide de techniques automatisées de démonstration de théorèmes (résolution SMT et système de réécriture de termes adapté aux problèmes de physique). Le système est évalué à l'aide de plus de 1 500 réponses réelles d'étudiants de l'Olympiade australienne de physique de 2023. Une description détaillée du développement du système de réécriture de termes et de la détermination de ses propriétés de finalité et de confluence est notamment fournie.

Takeaways, Limitations_

Takeaways:
Une nouvelle méthode pour automatiser la notation des examens de physique
Combinaison efficace de LLM, de solveur SMT et de système de réécriture de termes
Validation expérimentale à l'aide d'un ensemble de données réelles à grande échelle
Application des techniques de preuve automatique de théorèmes à la résolution de problèmes de physique
Limitations:
Difficultés dans le développement et la caractérisation d'un système de réécriture
Dépendance à l'exactitude du LLM
Biais possible pour certains types de problèmes de physique
Des recherches supplémentaires sont nécessaires pour déterminer la généralisabilité du système.
👍