haebom
Sign In
Audit After Segmentation: Reference-Free Mask Quality Assessment for Language-Referred Audio-Visual Segmentation
Created by
Haebom
Category
Empty
μ μ
Jinxing Zhou, Yanghao Zhou, Yaoting Wang, Zongyan Han, Jiaqi Ma, Henghui Ding, Rao Muhammad Anwer, Hisham Cholakkal
π‘ κ°μ
λ³Έ λ Όλ¬Έμ μμ°μ΄ μ€λͺ μ κΈ°λ°μΌλ‘ μ€λμ€-λΉλμ€ κ°μ²΄ λΆν (Ref-AVS) μμ μμ μμ±λ λΆν λ§μ€ν¬μ νμ§μ νκ°νλ μλ‘μ΄ κ³Όμ μΈ MQA-RefAVSλ₯Ό μ μν©λλ€. λ³λμ μ λ΅ λ§μ€ν¬ μ°Έμ‘° μμ΄λ λ§μ€ν¬μ IoU μΆμ , μ€λ₯ μ ν μλ³, νμ§ κ΄λ¦¬ κ²°μ μ λ΄λ¦¬λ κ²μ λͺ©νλ‘ ν©λλ€. μ΄λ₯Ό μν΄ λ€μν μ€λ₯ λͺ¨λλ₯Ό ν¬ν¨νλ MQ-RAVSBench λ²€μΉλ§ν¬λ₯Ό ꡬμΆνκ³ , λ€μ€ λͺ¨λ μ 보λ₯Ό νμ©νλ MLLM κΈ°λ° κ°μ¬μμΈ MQ-Auditorλ₯Ό μ μνμ¬ κΈ°μ‘΄ μμ€ν λ³΄λ€ λ°μ΄λ μ±λ₯μ 보μμ΅λλ€.
π μμ¬μ λ° νκ³
β’
Ref-AVS μμ μ ν΄μ κ°λ₯μ±μ λμ¬ λΆν λ§μ€ν¬μ νμ§ μ§λ¨ λ° κ°μ μ μν κΈ°λ°μ λ§λ ¨νμ΅λλ€.
β’
μ λ΅ μ°Έμ‘° μμ΄λ λ§μ€ν¬ νμ§μ νκ°ν μ μλ ν¨μ¨μ μΈ λ°©λ²μ μ μνμ¬ μ€μ μ μ© κ°λ₯μ±μ λμμ΅λλ€.
β’
MQ-Auditorλ λ€μ€ λͺ¨λ μ 보μ λ§μ€ν¬ μ체 μ 보λ₯Ό μ’ ν©μ μΌλ‘ κ³ λ €νμ¬ μ λμ , μ μ±μ νκ°λ₯Ό μνν©λλ€.
β’
MQ-RAVSBench λ²€μΉλ§ν¬μ λ€μμ±κ³Ό λνμ±μ΄ μ€μ λ€μν Ref-AVS μμ€ν μ μ€λ₯ λͺ¨λλ₯Ό μΌλ§λ μ ν¬κ΄ν μ μλμ§μ λν μΆκ° κ²μ¦μ΄ νμν©λλ€.
PDF 보기
Made with Slashpage