haebom
Sign In
Omni-R1: Towards the Unified Generative Paradigm for Multimodal Reasoning
Created by
Haebom
Category
Empty
μ μ
Dongjie Cheng, Yongqi Li, Zhixin Ma, Hongru Cai, Yupeng Hu, Wenjie Wang, Liqiang Nie, Wenjie Li
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λ€μν λ©ν°λͺ¨λ¬ μΆλ‘ μμ μ λ¨μΌ μμ± ν¨λ¬λ€μμΌλ‘ ν΅ν©νλ Omni-R1μ μ μν©λλ€. Omni-R1μ μΆλ‘ κ³Όμ μμ μ€κ° μ΄λ―Έμ§λ₯Ό μμ±νμ¬ μ€μΈ, κ°μ²΄ νμ λ± λ€μν λ©ν°λͺ¨λ¬ μΆλ‘ λ₯λ ₯μ ν΅μΌν©λλ€. μ μλ νλ μμν¬λ SFT+RL κΈ°λ°μΌλ‘, κΈ°λ₯μ μΈ μ΄λ―Έμ§ μμ±μ κ°λ₯νκ² νλ©°, νΉν Omni-R1-Zeroλ λ©ν°λͺ¨λ¬ μ£Όμ μμ΄λ ν μ€νΈ κΈ°λ° μΆλ‘ λ°μ΄ν°λ§μ μ¬μ©νμ¬ μ μ¬νκ±°λ λ λμ μ±λ₯μ λ¬μ±ν©λλ€.
π μμ¬μ λ° νκ³
β’
λ€μν λ©ν°λͺ¨λ¬ μΆλ‘ μμ μ μ€κ° μ΄λ―Έμ§ μμ±μ ν΅ν΄ λ¨μΌ μμ± ν¨λ¬λ€μμΌλ‘ ν΅ν©ν μ μμμ 보μ¬μ€λλ€.
β’
λ©ν°λͺ¨λ¬ μ£Όμ μμ΄λ ν μ€νΈ κΈ°λ° μΆλ‘ λ°μ΄ν°λ§μ νμ©νμ¬ κ°λ ₯ν λ©ν°λͺ¨λ¬ μΆλ‘ λͺ¨λΈμ ꡬμΆν μ μλ κ°λ₯μ±μ μ μν©λλ€.
β’
μ μλ λ°©λ²λ‘ μ μ€μ μμ© μ, μμ±λλ μ€κ° μ΄λ―Έμ§μ νμ§κ³Ό ν¨μ¨μ±μ΄ μΆλ‘ μ±λ₯μ λ―ΈμΉλ μν₯μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμν©λλ€.
PDF 보기
Made with Slashpage