多目標跟蹤是指在連續(xù)的圖像中,通過目標檢測算法識別出每一幀中的目標,并在時間上跟蹤它們的位置和狀態(tài)。但目標會不斷發(fā)生尺度、形變、遮擋等變化,而且還會有目標出現(xiàn)和消失的情況,再加上視頻采集端的相機所處環(huán)境可能受到外界影響導致抖動的情況(例如無人機高空檢測),就會給多目標跟蹤造成一定的困難。由于我們不能控制目標,所以只能從視頻采集端維護跟蹤的穩(wěn)定性。
鏡頭抖動導致多目標跟蹤易跟丟的原因:
1. 檢測框偏移:鏡頭抖動時,整個場景內(nèi)的所有物體都會相對移動,會導致目標檢測器輸出的目標框位置發(fā)生較大偏移。如果這種偏移超過了算法設定的閾值,就很容易導致前后幀目標關聯(lián)失敗進而導致目標丟失。
2. 特征匹配困難:多目標跟蹤算法依賴于目標外觀特征的一致性來進行幀間匹配。鏡頭抖動可能會改變目標在連續(xù)幀之間的外觀表現(xiàn),導致特征匹配失敗,從而影響跟蹤性能。
3. 遮擋問題:鏡頭抖動可能導致短時間內(nèi)目標被場景中的其他元素遮擋,進而使得目標暫時從視野中消失,超過算法設定的閾值后再次出現(xiàn)時難以正確關聯(lián)。
4. 輸入數(shù)據(jù)質(zhì)量下降:劇烈的鏡頭抖動還可能導致輸入圖像的質(zhì)量下降,如模糊或像素化,這些都會增加檢測和跟蹤的難度
多目標檢測跟蹤和單目標檢測跟蹤作為兩個不同的方向,解決的方法自然也不同。
因此,成都慧視針對于多目標檢測跟蹤抖動丟失的優(yōu)化方法是:
1. 改進目標檢測, 使用更加魯棒的目標檢測算法。
2. 增強特征描述,利用深度學習提取更高級別的語義特征,這些特征對于小范圍內(nèi)的視角變化具有更好的不變性
3. 改進運動模型,在算法中加入對攝像頭運動的估計,通過補償攝像頭運動來減小目標真實運動與預測之間的差距。
4. 數(shù)據(jù)關聯(lián)策略,設計更靈活的數(shù)據(jù)關聯(lián)算法,允許更大的距離閾值來匹配候選目標。