visual object tracking(3)
-
[논문리뷰] Exploring Enhanced Contextual Information for Video-Level Object Tracking. AAAI'25
LaSOT benchmark 상위권 논문들을 읽어보는 중입니다. 앞서 리뷰한 SAMURAI과 DAM4SAM은 memory management 개선만으로 추가적인 학습 없이 SAM 2의 성능을 올릴 수 있음을 보여주는 연구였는데요, 이번에 리뷰할 MCITrack은 Mamba를 활용한 새로운 구조의 모델을 제안합니다.Problem기존 visual trackers [1, 2, 3, 4, 5]는 target의 initial appearance만 고려했기 때문에 video sequence 동안 물체의 외형 변화에 취약했습니다. (a) 성능 향상을 위해 dynamic template을 사용하여 target의 appearance의 변화를 고려할 수 있었지만, context를 고려하는 것은 아니였습니다 [6, 7, 8..
2025.01.13 -
[논문리뷰] SAMURAI: Adapting Segment Anything Model for Zero-Shot Visual Tracking with Motion-Aware Memory. arXiv'2411
ProblemSegment Anything Model (SAM) 2 [1]는 object segmentation에는 좋은 성능을 보여주었지만, visual object tracking, 특히 빠르게 움직이거나 가려진 물체로 가득찬 scene에서는 아쉬운 성능을 보여주곤 했습니다.source: https://github.com/yangchris11/samurai이는 appearance similarity에는 집중했지만 spatial 및 temporal consistency에는 소홀해 motion cue를 적절히 활용하지 못했기 때문입니다 (Case 1). 또 다른 문제점으로는 SAM 2는 streaming memory architecture를 도입했는데요, memories간 quality의 차이를 고려하..
2024.12.31 -
Visual Object Tracking Benchmarks
VastTrackVastTrack: Vast Category Visual Object Tracking. NeurIPS'24The number of sequences: 50610The average sequence length: 83 framesThe number of object categories: 2115특징: 짧지만 많은 수의 video sequences와 다양한 object categoriesVOTS2024The Second Visual Object Tracking Segmentation VOTS2024 Challenge Results. ECCVW'24The number of sequences: 144The average sequence length: 2000 frames (min: 63, max..
2024.12.30