haebom
Sign In
MGSM-Pro: A Simple Strategy for Robust Multilingual Mathematical Reasoning Evaluation
Created by
Haebom
Category
Empty
μ μ
Tianyi Xu, Kosei Uemura, Alfred Malengo Kondoro, Tadesse Destaw Belay, Catherine Nana Nyaah Essuman, Ifeoma Okoh, Ganiyat Afolabi, Ayodele Awokoya, David Ifeoluwa Adelani
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λ€κ΅μ΄ μν μΆλ‘ νκ°λ₯Ό μν MGSM-Pro λ°μ΄ν°μ μ μ μνλ©°, μ΄λ κΈ°μ‘΄ MGSM λ°μ΄ν°μ μ GSM-Symbolic μ κ·Όλ²μ νμ₯ν κ²μ λλ€. λ€μν μ΄λ¦, μ«μ, κ΄λ ¨ μλ λ§₯λ½ λ³νλ₯Ό ν΅ν΄ λμΌ μ§λ¬Έμ λν μ¬λ¬ μΈμ€ν΄μ€λ₯Ό μμ±νμ¬ λͺ¨λΈμ κ²¬κ³ μ±μ νκ°ν©λλ€. μ€ν κ²°κ³Ό, νΉν μ μμ μΈμ΄μμ μ«μ λ³νμ λ°λ₯Έ μ±λ₯ μ νκ° ν¬λ©°, κ³ μμ μΈμ΄μμμ κ²¬κ³ μ±μ΄ μ μμ μΈμ΄λ‘ μ΄μ΄μ§μ§ μμμ 보μ¬μ€λλ€.
π μμ¬μ λ° νκ³
β’
λ€κ΅μ΄ μν μΆλ‘ λͺ¨λΈ νκ° μ, λ¨μν μ§λ¬Έ μΈμ λ€μν μ«μ λ³νλ₯Ό ν¬ν¨ν μ¬λ¬ μΈμ€ν΄μ€λ‘ νκ°ν΄μΌ λ³΄λ€ νμ€μ μ΄κ³ κ²¬κ³ ν μ±λ₯ μΈ‘μ μ΄ κ°λ₯ν©λλ€.
β’
κ³ μμ μΈμ΄(HRL)μμμ μ°μν μ±λ₯μ΄ μ μμ μΈμ΄(LRL)λ‘ λ°λμ μ μ΄λμ§ μμΌλ―λ‘, κ° μΈμ΄λ³ νΉμ±μ κ³ λ €ν νκ°μ λͺ¨λΈ κ°λ°μ΄ μ€μν©λλ€.
β’
μΌλΆ μμ© λͺ¨λΈ(Gemini 2.5 Flash, GPT-4.1)μ μ«μμ λ κ²¬κ³ ν λ°λ©΄, Gemini 3.0 Pro λ° μ€ν μμ€ λͺ¨λΈ(GPT-OSS 120B, DeepSeek v3)μ λ λμ κ²¬κ³ μ±μ 보μμ΅λλ€.
β’
μ μλ MGSM-Pro λ°μ΄ν°μ μ μΈμ΄λ³, μ«μ λ³νμ λ°λ₯Έ λͺ¨λΈμ κ²¬κ³ μ±μ μ¬μΈ΅μ μΌλ‘ λΆμν μ μλ λꡬλ₯Ό μ 곡ν©λλ€.
β’
ν₯ν κ³Όμ λ‘λ λ λ€μν μΈμ΄μ μΆλ‘ μ νμ λν λ°μ΄ν°μ νμ₯ λ° λͺ¨λΈμ κ²¬κ³ μ± ν₯μμ μν μλ‘μ΄ νμ΅ λ°©λ²λ‘ κ°λ°μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage