λ³Έ λ
Όλ¬Έμ μ¬μ νλ ¨λ κ³ λΆκ°κ°μΉ VLM(Vision-Language Model)μ μ§μ μ¬μ°κΆ(IP) 보νΈλ₯Ό μν λμ κΆν λΆμ¬ νλ μμν¬μΈ AoD-IPλ₯Ό μ μν©λλ€. AoD-IPλ μ¨λ맨λ κΆν λΆμ¬μ ν©λ²μ± μΈμμ ν΅ν΄ VLMμ λ°°ν¬λ₯Ό νκ°λ λλ©μΈ λ΄λ‘ μ ννκ³ λ¬΄λ¨ μ΄μ μ λ°©μ§νλ κ²μ λͺ©νλ‘ ν©λλ€. μ μλ λ°©λ²λ‘ μ μ μ°ν μ¬μ©μ μ μ΄ κΆν λΆμ¬λ₯Ό κ°λ₯νκ² νκ³ , μ
λ ₯μ ν©λ²μ± λ° μμ
λ³ μΆλ ₯μ 곡λμΌλ‘ μμΈ‘νλ λμΌ ν¨μ€ μΆλ‘ λ©μ»€λμ¦μ ν΅ν΄ λμ νκ²½μμμ μ μμ λ°°ν¬λ₯Ό μ§μν©λλ€.