haebom
Sign In
AudioCapBench: Quick Evaluation on Audio Captioning across Sound, Music, and Speech
Created by
Haebom
Category
Empty
μ μ
Jielin Qiu, Jianguo Zhang, Zixiang Chen, Liangwei Yang, Ming Zhu, Juntao Tan, Haolin Chen, Wenting Zhao, Rithesh Murthy, Roshan Ram, Akshara Prabhakar, Shelby Heinecke, Caiming, Xiong, Silvio Savarese, Huan Wang
π‘ κ°μ
λ³Έ λ Όλ¬Έμ λκ·λͺ¨ λ©ν°λͺ¨λ¬ λͺ¨λΈμ μ€λμ€ μΊ‘μ λ λ₯λ ₯μ νκ°νκΈ° μν λ²€μΉλ§ν¬μΈ AudioCapBenchλ₯Ό μ μνλ€. μ΄ λ²€μΉλ§ν¬λ νκ²½μ, μμ , μμ± λ± μΈ κ°μ§ μ€λμ€ λλ©μΈμμ 1,000κ°μ νκ° μνμ ν¬ν¨νλ©°, μ°Έμ‘° κΈ°λ° μ§νμ LLM-as-Judge νλ μμν¬λ₯Ό μ¬μ©νμ¬ 13κ° λͺ¨λΈμ νκ°νλ€. μ°κ΅¬ κ²°κ³Ό, Gemini λͺ¨λΈμ΄ μ λ°μ μΈ μΊ‘μ λ νμ§μμ OpenAI λͺ¨λΈλ³΄λ€ μ°μνμΌλ©°, λͺ¨λ λͺ¨λΈμ΄ μμ± μΊ‘μ λμμ κ°μ₯ μ’μ μ±λ₯μ 보μλ€.
π μμ¬μ λ° νκ³
β’
AudioCapBenchλ λ€μν μ€λμ€ λλ©μΈμ κ±Έμ³ μ€λμ€ μΊ‘μ λ λͺ¨λΈμ μ±λ₯μ 체κ³μ μΌλ‘ νκ°ν μ μλ νμ€νλ λ°©λ²λ‘ μ μ 곡νλ€.
β’
Gemini λͺ¨λΈμ΄ OpenAI λͺ¨λΈλ³΄λ€ μ λ°μ μΌλ‘ μ°μν μ±λ₯μ 보μμΌλ©°, νΉν μμ± μΊ‘μ λμμ κ°μ μ λνλλ€.
β’
μμ μΊ‘μ λμ λͺ¨λ λͺ¨λΈμκ² κ°μ₯ μ΄λ €μ΄ κ³Όμ μμΌλ©°, μ΄λ μμ μ 볡μ‘μ±κ³Ό μ£Όκ΄μ±μ κΈ°μΈν μ μλ€.
β’
hallucination(νκ°) νκ°λ λͺ¨λΈμ μ λ’°μ±μ μΈ‘μ νλ λ° μ€μν μ§νλ‘ νμ©λ μ μλ€.
β’
λ³Έ λ²€μΉλ§ν¬ λ° νκ° μ½λλ₯Ό 곡κ°νμ¬ ν₯ν μ€λμ€ μ΄ν΄ μ°κ΅¬μ μ¬νμ±μ λμ΄κ³ λ°μ μ μ΄μ§ν μ μλ€.
β’
νκ° μνμ μμ΄ μλμ μΌλ‘ μ κ³ , νΉμ μ νμ μ€λμ€μ νΈμ€λ κ°λ₯μ±μ΄ μμ΄ λ ν¬κ΄μ μΈ λ°μ΄ν°μ ꡬμΆμ΄ νμνλ€.
β’
LLM-as-Judge νλ μμν¬λ νκ°μ κ° μΌκ΄μ± λ° νκ°μ κ°κ΄μ±μ λν μΆκ°μ μΈ μ°κ΅¬κ° νμνλ€.
PDF 보기
Made with Slashpage