Cette page résume et organise les publications en intelligence artificielle du monde entier. Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif. Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.
La science à travers les langues : évaluation de la traduction multilingue d'articles scientifiques dans le cadre d'un master en droit
Created by
Haebom
Auteur
Hannah Calzi Kleidermacher, James Zou
Contour
Cet article aborde le fait que la plupart des revues universitaires sont publiées uniquement en anglais, ce qui constitue un obstacle pour les locuteurs non anglophones. Il propose un système de traduction automatique d'articles universitaires utilisant un modèle linguistique à grande échelle (LLM). Tout en conservant le format XML JATS, nous avons traduit des articles de divers domaines scientifiques en 28 langues et mesuré la précision de la traduction (95,9 % en moyenne) grâce à une méthode d'évaluation unique basée sur le questionnaire-réponse (QA). Une étude utilisateur menée auprès de 15 chercheurs a confirmé la précision des traductions et a également révélé des différences de préférences pour la surtraduction de certains termes techniques. De plus, nous démontrons l'adaptabilité et l'utilité de la traduction basée sur le LLM en utilisant des techniques d'apprentissage contextuel pour atténuer le problème de surtraduction. Le code source et les articles traduits sont disponibles à l' adresse https://hankleid.github.io/ProjectMundo .
Takeaways, Limitations
•
Takeaways:
◦
Présentation de la faisabilité d'un système de traduction automatique de documents universitaires utilisant LLM.
◦
Applicabilité accrue aux revues universitaires du monde réel en maintenant le format JATS XML.
◦
ÉValuation objective de l’exactitude de la traduction grâce à une méthode d’évaluation basée sur des questions-réponses.
◦
Large accessibilité grâce à la prise en charge de plusieurs langues (28 langues).
◦
Améliorer la qualité de la traduction et offrir des possibilités de personnalisation aux utilisateurs grâce à l'apprentissage en contexte.
•
Limitations:
◦
Problèmes de traduction excessifs pour certains termes techniques et nécessité d'ajustements supplémentaires en fonction des préférences de l'utilisateur.
◦
La taille de l’étude auprès des utilisateurs était relativement petite (15 personnes).
◦
Des recherches supplémentaires sont nécessaires pour déterminer s’il existe des biais dans des domaines spécifiques.
◦
Architecture système dépendante des performances du LLM.