haebom
Sign In
TTE-Flash: Accelerating Reasoning-based Multimodal Representations via Think-Then-Embed Tokens
μμ±μ
Haebom
μΉ΄ν κ³ λ¦¬
Empty
μ μ
Jianpeng Cheng, Xian Wu, Jiangfan Zhang, Wentao Bao, Chaitanya Ahuja, Shlok Kumar Mishra, Hanchao Yu, Yang Gao, Fan Xia, Qi Guo, Shaodan Zhai, Xiangjun Fan, Jun Xiao
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λ©ν°λͺ¨λ¬ μΆλ‘ μ λ°μνλ λμ κ³μ° λΉμ© λ¬Έμ λ₯Ό ν΄κ²°νκΈ° μν΄ κΈ°μ‘΄μ λͺ μμ μκ° κ³Όμ (Chain-of-Thought, CoT)μ μ μ¬μ 'μκ° ν ν°'μΌλ‘ λ체νλ TTE-Flash λ°©λ²μ μ μν©λλ€. μ μ¬μ μκ° ν ν°μ CoT μμ± μμ€λ‘ μ΅μ ννκ³ μλ² λ© ν ν°μ λμ‘° νμ΅ μμ€λ‘ μ΅μ νν¨μΌλ‘μ¨, μΆλ‘ μ μΌμ ν λΉμ©μΌλ‘ κ³ μ±λ₯μ μΆλ‘ κΈ°λ° λ©ν°λͺ¨λ¬ ννμ μμ±ν μ μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
κΈ°μ‘΄ CoT κΈ°λ° λ©ν°λͺ¨λ¬ μλ² λ©μ λμ κ³μ° λΉμ© λ¬Έμ λ₯Ό ν΄κ²°νλ ν¨μ¨μ μΈ λμμ μ μν©λλ€.
β’
μ μ¬μ μκ° ν ν°μ ν΅ν΄ ν μ€νΈ λ° μκ°μ μΌλ‘ ν΄μ κ°λ₯ν μΆλ‘ κΈ°λ° λ©ν°λͺ¨λ¬ νν λͺ¨λΈ(TTE-Flash-2B)μ κ°λ°νμ¬ μ±λ₯μ μ μ¦νμ΅λλ€.
β’
μκ° ν ν° κ°μ μ¦κ°μ λ°λ₯Έ νμ₯μ±μ νμΈνκ³ , μμ μꡬμ¬νμ λ°λΌ μκ° ν ν° μμ°μ λμ μΌλ‘ ν λΉνλ λ°©μμ λν μ΄κΈ° μ°κ΅¬λ₯Ό μ μν©λλ€.
β’
μ μ¬μ μκ° ν ν°μ μμ± λ° νμ΅ λ°©μμ λν μΆκ°μ μΈ μ°κ΅¬μ λ λ€μν λ©ν°λͺ¨λ¬ νμ€ν¬μμμ μ±λ₯ κ²μ¦μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage