Sign In

OVOD-Agent: A Markov-Bandit Framework for Proactive Visual Reasoning and Self-Evolving Detection

Created by
  • Haebom
Category
Empty

μ €μž

Chujie Wang, Jianyu Lu, Zhiyuan Luo, Xi Chen, Chu He

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ³ μ •λœ λ²”μ£Ό 이름에 μ˜μ‘΄ν•˜λŠ” κΈ°μ‘΄ κ°œλ°©ν˜• μ–΄νœ˜ 객체 탐지(OVOD)의 ν•œκ³„λ₯Ό κ·Ήλ³΅ν•˜κΈ° μœ„ν•΄, ν…μŠ€νŠΈ μ΅œμ ν™”λ₯Ό μ‹œκ°μ  μΆ”λ‘  및 자체 λ°œμ „ νƒμ§€λ‘œ ν™•μž₯ν•˜λŠ” OVOD-Agentλ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. Chain-of-Thought (CoT) νŒ¨λŸ¬λ‹€μž„μ—μ„œ μ˜κ°μ„ 받은 μ‹œκ°μ  CoT와 μ•½ν•œ 마λ₯΄μ½”ν”„ κ²°μ • κ³Όμ •(w-MDP)을 ν™œμš©ν•˜μ—¬ μ—μ΄μ „νŠΈμ˜ μƒνƒœ, κΈ°μ–΅, μƒν˜Έμž‘μš© 역학을 λͺ¨λΈλ§ν•©λ‹ˆλ‹€. μ œν•œλœ 감독 ν•˜μ—μ„œ 탐색 μ‹ ν˜Έλ₯Ό μƒμ„±ν•˜λŠ” Bandit λͺ¨λ“ˆμ€ μ—μ΄μ „νŠΈκ°€ λΆˆν™•μ‹€ν•œ μ˜μ—­μ— μ§‘μ€‘ν•˜κ³  탐지 정책을 μ μ‘ν•˜λ„λ‘ λ•μŠ΅λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
OVOD-AgentλŠ” ν…μŠ€νŠΈ κ³΅κ°„μ˜ 잠재λ ₯을 νƒμƒ‰ν•˜μ—¬ κΈ°μ‘΄ OVOD λ°©λ²•λ‘ μ˜ μ„±λŠ₯을 μΌκ΄€λ˜κ²Œ ν–₯μƒμ‹œν‚€κ³ , 특히 희귀 λ²”μ£Ό 탐지에 νš¨κ³Όμ μž…λ‹ˆλ‹€.
β€’
μ‹œκ°μ  CoT와 w-MDPλ₯Ό κ²°ν•©ν•œ ν”„λ ˆμž„μ›Œν¬λŠ” λŠ₯동적인 μ‹œκ°μ  μΆ”λ‘  및 자체 λ°œμ „ νƒμ§€λΌλŠ” μƒˆλ‘œμš΄ μ ‘κ·Ό 방식을 μ œμ‹œν•©λ‹ˆλ‹€.
β€’
LLM 기반 관리가 λΉ„νš¨μœ¨μ μΈ κ²½λŸ‰ OVOD에 λŒ€ν•œ 효과적인 관리 μ „λž΅μ„ μ œκ³΅ν•©λ‹ˆλ‹€.
β€’
(ν•œκ³„μ  λ˜λŠ” ν–₯ν›„ 과제) Bandit λͺ¨λ“ˆμ˜ 탐색 μ‹ ν˜Έ 생성과 Reward Model (RM) μ΅œμ ν™” κ°„μ˜ μ™„μ „ν•œ 폐쇄 루프λ₯Ό κ΅¬μΆ•ν–ˆμ§€λ§Œ, μ‹€μ œ λ³΅μž‘ν•œ μ‹œλ‚˜λ¦¬μ˜€μ—μ„œμ˜ ν™•μž₯μ„± 및 μ‹€μ‹œκ°„ 적용 κ°€λŠ₯성에 λŒ€ν•œ 좔가적인 연ꡬ가 ν•„μš”ν•©λ‹ˆλ‹€.
πŸ‘