Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
Ciencia en diferentes idiomas: evaluación de la traducción multilingüe de artículos científicos para el Máster en Derecho
Created by
Haebom
Autor
Hannah Calzi Kleidermacher, James Zou
Describir
Este artículo aborda el hecho de que la mayoría de las revistas académicas se publican únicamente en inglés, lo que supone una barrera para quienes no lo tienen como lengua materna. Este artículo propone un sistema de traducción automática para artículos académicos mediante un modelo de lenguaje a gran escala (LLM). Manteniendo el formato JATS XML, tradujimos artículos de diversos campos científicos a 28 idiomas y medimos la precisión de la traducción (un promedio del 95,9 %) mediante un método de evaluación único basado en preguntas y respuestas (QA). Un estudio de usuarios con 15 investigadores confirmó la precisión de las traducciones y también reveló diferencias en las preferencias por la sobretraducción de ciertos términos técnicos. Además, demostramos la adaptabilidad y la utilidad de la traducción basada en LLM mediante el uso de técnicas de aprendizaje en contexto para mitigar el problema de la sobretraducción. El código fuente y los artículos traducidos están disponibles en https://hankleid.github.io/ProjectMundo .
Takeaways, Limitations
•
Takeaways:
◦
Presentar la viabilidad de un sistema de traducción automática de artículos académicos utilizando LLM.
◦
Mayor aplicabilidad a revistas académicas del mundo real al mantener el formato XML JATS.
◦
Evaluación objetiva de la precisión de la traducción mediante un método de evaluación basado en preguntas y respuestas.
◦
Amplia accesibilidad mediante soporte para múltiples idiomas (28 idiomas).
◦
Mejorar la calidad de la traducción y ofrecer posibilidades de personalización al usuario a través del aprendizaje en contexto.
•
Limitations:
◦
Problemas excesivos de traducción de algunos términos técnicos y necesidad de ajustes adicionales según las preferencias del usuario.
◦
El tamaño del estudio de usuarios fue relativamente pequeño (15 personas).
◦
Se necesitan más investigaciones para determinar si existe sesgo en áreas específicas.
◦
Arquitectura del sistema dependiente del rendimiento de LLM.