Sign In

Zoom In, Reason Out: Efficient Far-field Anomaly Detection in Expressway Surveillance Videos via Focused VLM Reasoning Guided by Bayesian Inference

Created by
  • Haebom
Category
Empty

μ €μž

Xiaowei Mao, Bowen Sui, Weijie Zhang, Yawen Yang, Shengnan Guo, Shilong Zhao, Jiaqi Lin, Tingrui Wu, Youfang Lin, Huaiyu Wa

πŸ’‘ κ°œμš”

λ³Έ 논문은 κ³ μ†λ„λ‘œ CCTV μ˜μƒμ—μ„œ λ°œμƒν•˜λŠ” λ―Έλ¬˜ν•œ 이상 μ°¨λŸ‰ μ›€μ§μž„μ„ νƒμ§€ν•˜λŠ” 데 λ°œμƒν•˜λŠ” 어렀움을 ν•΄κ²°ν•˜κΈ° μœ„ν•΄ Vision-Language Model (VLM)κ³Ό 베이즈 좔둠을 κ²°ν•©ν•œ VIBES ν”„λ ˆμž„μ›Œν¬λ₯Ό μ œμ•ˆν•©λ‹ˆλ‹€. VIBESλŠ” 온라인 베이즈 좔둠을 톡해 정상적인 μ£Όν–‰ ν–‰λ™μ˜ ν™•λ₯ μ  경계λ₯Ό λ™μ μœΌλ‘œ μ—…λ°μ΄νŠΈν•˜κ³ , 이λ₯Ό 트리거둜 ν™œμš©ν•˜μ—¬ VLM이 이상 μ§•ν›„κ°€ λ°œμƒν•œ κ΅­μ†Œ μ˜μ—­μ—λ§Œ μ§‘μ€‘ν•˜λ„λ‘ ν•¨μœΌλ‘œμ¨ 주의λ ₯ 희석 문제λ₯Ό ν•΄κ²°ν•˜κ³  계산 λΉ„μš©μ„ μ ˆκ°ν•©λ‹ˆλ‹€. 이λ₯Ό 톡해 λ‹€μ–‘ν•œ κ³ μ†λ„λ‘œ ν™˜κ²½μ—μ„œλ„ 높은 탐지 정확도, μ‹€μ‹œκ°„ νš¨μœ¨μ„± 및 μ„€λͺ… κ°€λŠ₯성을 λ‹¬μ„±ν•©λ‹ˆλ‹€.

πŸ”‘ μ‹œμ‚¬μ  및 ν•œκ³„

β€’
원거리 및 λ―Έλ¬˜ν•œ 이상 탐지 λŠ₯λ ₯ ν–₯상: 베이즈 μΆ”λ‘  기반의 동적 정상 행동 λͺ¨λΈλ§κ³Ό VLM의 κ΅­μ†Œμ  집쀑을 톡해 μ›κ±°λ¦¬μ—μ„œ λ°œμƒν•˜λŠ” λ―Έλ¬˜ν•œ 이상 μ›€μ§μž„μ„ 효과적으둜 탐지할 수 μžˆμŠ΅λ‹ˆλ‹€.
β€’
계산 νš¨μœ¨μ„± 및 μ‹€μ‹œκ°„ 처리 λŠ₯λ ₯ κ°•ν™”: 전체 ν”„λ ˆμž„ λŒ€μ‹  트리거된 νŠΉμ • μ˜μ—­λ§Œμ„ VLM이 μ²˜λ¦¬ν•¨μœΌλ‘œμ¨ 계산 λΆ€ν•˜λ₯Ό λŒ€ν­ 쀄여 μ‹€μ‹œκ°„ μ²˜λ¦¬κ°€ κ°€λŠ₯ν•˜κ²Œ ν•©λ‹ˆλ‹€.
β€’
λ‹€μ–‘ν•œ ν™˜κ²½μ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯ 확보: 온라인 베이즈 μΆ”λ‘  λͺ¨λ“ˆμ΄ μ§€μ†μ μœΌλ‘œ 정상 μ£Όν–‰ 행동을 ν•™μŠ΅ν•˜κ³  μ—…λ°μ΄νŠΈν•˜λ―€λ‘œ, λ‹€μ–‘ν•œ κ³ μ†λ„λ‘œ ν™˜κ²½μ— λŒ€ν•œ μΌλ°˜ν™” μ„±λŠ₯이 ν–₯μƒλ©λ‹ˆλ‹€.
β€’
트리거 λ©”μ»€λ‹ˆμ¦˜μ˜ μ •ν™•μ„± 및 이상 νƒμ§€μ˜ 민감도: 베이즈 μΆ”λ‘  기반 트리거 λ©”μ»€λ‹ˆμ¦˜μ˜ 정확도가 VIBES의 전체적인 이상 탐지 μ„±λŠ₯에 λ―ΈμΉ˜λŠ” 영ν–₯, 그리고 맀우 ν¬κ·€ν•˜κ±°λ‚˜ μ˜ˆμƒμΉ˜ λͺ»ν•œ 이상 행동에 λŒ€ν•œ 탐지 민감도 κ°œμ„ μ΄ ν–₯ν›„ 과제둜 λ‚¨μŠ΅λ‹ˆλ‹€.
πŸ‘