Daily Arxiv

전 세계에서 발간되는 인공지능 관련 논문을 정리하는 페이지 입니다.
본 페이지는 Google Gemini를 활용해 요약 정리하며, 비영리로 운영 됩니다.
논문에 대한 저작권은 저자 및 해당 기관에 있으며, 공유 시 출처만 명기하면 됩니다.

Lattice Boltzmann Model for Learning Real-World Pixel Dynamicity

Created by
  • Haebom

저자

Guangze Zheng, Shijie Lin, Haobo Zuo, Si Si, Ming-Shan Wang, Changhong Fu, Jia Pan

개요

본 논문은 시각적 추적을 위해 격자 볼츠만 모델(LBM)을 제안합니다. LBM은 시각적 표현을 동적 픽셀 격자로 분해하고, 충돌-스트리밍 과정을 통해 픽셀의 움직임 상태를 해결합니다. 다층 예측-업데이트 네트워크를 사용하여 대상 픽셀의 고차원 분포를 획득하여 픽셀 위치와 가시성을 추정합니다. 예측 단계에서는 대상 픽셀의 공간적 이웃 간의 격자 충돌을 공식화하고, 시간적 시각적 컨텍스트 내에서 격자 스트리밍을 개발합니다. 업데이트 단계에서는 온라인 시각적 표현으로 픽셀 분포를 수정합니다. TAP-Vid 및 RoboTAP과 같은 벤치마크에서 LBM의 효율성을 검증하고, TAO, BFT, OVT-B와 같은 대규모 개방형 객체 추적 벤치마크에서 실용성을 입증했습니다.

시사점, 한계점

온라인 및 실시간 방식으로 실제 응용 가능성을 보여줌
TAP-Vid, RoboTAP, TAO, BFT, OVT-B와 같은 다양한 벤치마크에서 효율성 및 실용성 검증
구체적인 한계점은 논문에 명시되지 않음 (추후 연구 필요)
👍