識(shí)別算法的性能提升依靠大量的圖像標(biāo)注,傳統(tǒng)模式下,需要人工對(duì)同一識(shí)別目標(biāo)的數(shù)據(jù)集進(jìn)行一步一步手動(dòng)拉框,但是這個(gè)過(guò)程的痛苦只有做過(guò)的人才知道。
越多素材的數(shù)據(jù)集對(duì)于算法的提升越有幫助,常規(guī)情況下,一個(gè)20秒時(shí)長(zhǎng)30幀的視頻就多達(dá)兩三百?gòu)埉?huà)面需要標(biāo)注,如果視頻時(shí)長(zhǎng)或者視頻的幀速率增加,需要標(biāo)注的幀畫(huà)面將會(huì)更多。小編曾試過(guò)標(biāo)注一個(gè)時(shí)長(zhǎng)為1分30秒幀速率為60的視頻,需要標(biāo)注的畫(huà)面竟然多達(dá)5000多張,當(dāng)我標(biāo)注到500張的時(shí)候,整個(gè)人都已經(jīng)麻木,并且出現(xiàn)情緒波動(dòng),望著剩下的4500多張待標(biāo)注畫(huà)面,看著都頭皮發(fā)麻,怎么都不想繼續(xù)了。
長(zhǎng)時(shí)間一直進(jìn)行這樣的圖像標(biāo)注工作,那無(wú)疑是枯燥而乏味的,手酸不說(shuō),更多的是精神上的折磨,進(jìn)而效率大打折扣。
但這又是算法提升的必要途徑,無(wú)法跳過(guò),當(dāng)項(xiàng)目緊急時(shí),甚至需要多人加班加點(diǎn)趕進(jìn)度。
這樣的痛苦現(xiàn)狀急需改變!
慧視光電的算法工程師為了提高這一的效率,開(kāi)發(fā)了一個(gè)深度學(xué)習(xí)算法開(kāi)發(fā)平臺(tái)SpeedDP。它的基本邏輯是基于一個(gè)手動(dòng)標(biāo)注一定量的數(shù)據(jù)集進(jìn)行訓(xùn)練,形成一個(gè)可用的預(yù)選模型(如果已有模型可以直接使用),然后訓(xùn)練一定階段后,可以評(píng)估此模型的能力,如果能夠滿足使用就可以對(duì)相同目標(biāo)的新數(shù)據(jù)集(未進(jìn)行任何標(biāo)注)進(jìn)行AI自動(dòng)化標(biāo)注。這一過(guò)程的省去了大量需要對(duì)新數(shù)據(jù)集的手動(dòng)拉框工作,同時(shí)也在不斷反哺此模型算法,幫助提升性能。
如此反復(fù),工作效率將大大提升。
SpeedDP主要支持YOLO系列目標(biāo)檢測(cè)算法,包括YOLOx、YOLOv8、YOLOv10等,目前仍在不斷更新升級(jí)以滿足更多市場(chǎng)需求。