識(shí)別算法性能提升的背后手動(dòng)標(biāo)注的苦誰(shuí)懂？

慧視深度學(xué)習(xí)算法開(kāi)發(fā)平臺(tái)SpeedDP基本邏輯是基于一個(gè)手動(dòng)標(biāo)注一定量的數(shù)據(jù)集進(jìn)行訓(xùn)練，形成一個(gè)可用的預(yù)選模型（如果已有模型可以直接使用），然后訓(xùn)練一定階段后，可以評(píng)估此模型的能力，如果能夠滿足使用就可以對(duì)相同目標(biāo)的新數(shù)據(jù)集（未進(jìn)行任何標(biāo)注）進(jìn)行AI自動(dòng)化標(biāo)注。這一過(guò)程的省去了大量需要對(duì)新數(shù)據(jù)集的手動(dòng)拉框工作，同時(shí)也在不斷反哺此模型算法，幫助提升性能。

識(shí)別算法的性能提升依靠大量的圖像標(biāo)注，傳統(tǒng)模式下，需要人工對(duì)同一識(shí)別目標(biāo)的數(shù)據(jù)集進(jìn)行一步一步手動(dòng)拉框，但是這個(gè)過(guò)程的痛苦只有做過(guò)的人才知道。

越多素材的數(shù)據(jù)集對(duì)于算法的提升越有幫助，常規(guī)情況下，一個(gè)20秒時(shí)長(zhǎng)30幀的視頻就多達(dá)兩三百?gòu)埉?huà)面需要標(biāo)注，如果視頻時(shí)長(zhǎng)或者視頻的幀速率增加，需要標(biāo)注的幀畫(huà)面將會(huì)更多。小編曾試過(guò)標(biāo)注一個(gè)時(shí)長(zhǎng)為1分30秒幀速率為60的視頻，需要標(biāo)注的畫(huà)面竟然多達(dá)5000多張，當(dāng)我標(biāo)注到500張的時(shí)候，整個(gè)人都已經(jīng)麻木，并且出現(xiàn)情緒波動(dòng)，望著剩下的4500多張待標(biāo)注畫(huà)面，看著都頭皮發(fā)麻，怎么都不想繼續(xù)了。

長(zhǎng)時(shí)間一直進(jìn)行這樣的圖像標(biāo)注工作，那無(wú)疑是枯燥而乏味的，手酸不說(shuō)，更多的是精神上的折磨，進(jìn)而效率大打折扣。

但這又是算法提升的必要途徑，無(wú)法跳過(guò)，當(dāng)項(xiàng)目緊急時(shí)，甚至需要多人加班加點(diǎn)趕進(jìn)度。

這樣的痛苦現(xiàn)狀急需改變！

慧視光電的算法工程師為了提高這一的效率，開(kāi)發(fā)了一個(gè)深度學(xué)習(xí)算法開(kāi)發(fā)平臺(tái)SpeedDP。它的基本邏輯是基于一個(gè)手動(dòng)標(biāo)注一定量的數(shù)據(jù)集進(jìn)行訓(xùn)練，形成一個(gè)可用的預(yù)選模型（如果已有模型可以直接使用），然后訓(xùn)練一定階段后，可以評(píng)估此模型的能力，如果能夠滿足使用就可以對(duì)相同目標(biāo)的新數(shù)據(jù)集（未進(jìn)行任何標(biāo)注）進(jìn)行AI自動(dòng)化標(biāo)注。這一過(guò)程的省去了大量需要對(duì)新數(shù)據(jù)集的手動(dòng)拉框工作，同時(shí)也在不斷反哺此模型算法，幫助提升性能。