haebom
Sign In
Reason to Contrast: A Cascaded Multimodal Retrieval Framework
Created by
Haebom
Category
Empty
μ μ
Xuanming Cui, Hong-You Chen, Hao Yu, Hao Yuan, Zihao Wang, Shlok Kumar Mishra, Hanchao Yu, Yonghuan Yang, Jun Xiao, Ser-Nam Lim, Jianpeng Cheng, Qi Guo, Xiangjun Fan
π‘ κ°μ
λ³Έ λ Όλ¬Έμ κΈ°μ‘΄μ μλ² λ© μ°¨μμ μμ‘΄νλ λ€μ€ λͺ¨λ¬ κ²μ μμ€ν μ νκ³λ₯Ό 극볡νκΈ° μν΄, μΆκ°μ μΈ μ 보 ν ν° μμ±μ ν΅ν΄ κ²μ μ±λ₯μ ν₯μμν€λ Think-Then-Embed (TTE)μ νμ μ°κ΅¬μΈ TTE-v2λ₯Ό μ μνλ€. TTE-v2λ λͺ¨λΈμ΄λ μλ² λ© ν¬κΈ°κ° μλ, μΆκ°μ μΈ ν ν° μμ°μ κΈ°λ°ν μΆλ‘ μ€μ¬μ μ±λ₯ νμ₯μ λμ νλ©°, μΆλ‘ λ¨κ³λ₯Ό μΆκ°νμ¬ μΏΌλ¦¬μ ν보 κ°μ μνΈμμ©μ λμ± μ κ΅νκ² λ§λ λ€. μ΄λ¬ν κ³λ¨μ μ€κ³λ μ€κ° μΆλ‘ ν ν°μ νμ₯μ ν΅ν΄ ν μ€νΈ μ μλΉν μ±λ₯ ν₯μμ λ¬μ±νλ©°, MMEB-V2 λ²€μΉλ§ν¬μμ μλ‘μ΄ μ΅κ³ μ±λ₯μ κΈ°λ‘νλ€.
π μμ¬μ λ° νκ³
β’
μΆκ°μ μΈ μ λ ₯ ν ν° μμ°μ νμ©νμ¬ λ€μ€ λͺ¨λ¬ κ²μ μ±λ₯μ νμ₯νλ μλ‘μ΄ ν¨λ¬λ€μμ μ μν©λλ€.
β’
μΆλ‘ λ¨κ³λ₯Ό ν΅ν μ¬μμν(reranking)κ° μΏΌλ¦¬-ν보 μνΈμμ©μ νλΆνκ² νκ³ , νλ λ€κ±°ν°λΈ λ§μ΄λ λ° μλͺ»λ λ€κ±°ν°λΈ νν°λ§μ μν λ―ΈμΈν κ°λ κΈ°λ₯μ μ 곡ν©λλ€.
β’
λͺ¨λΈ ν¬κΈ°λ μλ² λ© μ°¨μ μ¦κ° μμ΄λ ν ν° μμ€μ νμ₯μ ν΅ν΄ κ²½μλ ₯ μλ μ±λ₯μ λ¬μ±ν μ μμμ 보μ¬μ€λλ€.
β’
μ μλ λ°©λ²λ‘ μ ν¨μ¨μ± λ° μΌλ°μ±μ λ€μν λ€μ€ λͺ¨λ¬ κ²μ μμ λ° λ°μ΄ν°μ μμ μΆκ°μ μΌλ‘ κ²μ¦ν νμκ° μμ΅λλ€.
PDF 보기
Made with Slashpage