網易AI Lab問鼎ACCV 2020細粒度網絡圖像識別賽

近日,第十五屆亞洲計算機視覺學術會議ACCV 2020(Asian Conference on Computer Vision)國際細粒度網絡圖像識別賽公佈最終成績,本站AI Lab以71.4%的準確率擊敗了來自全球的569個頂尖計算機視覺團隊,從超過1000份方案中脫穎而出,一舉斬獲大賽冠軍。這是本站AI Lab繼語音、自然語言處理(NLP)等領域大賽奪冠之後,在計算機視覺領域的又一突破,彰顯了本站AI Lab在人工智能領域的綜合技術實力。

(本站AI Lab榮獲ACCV 2020國際細粒度網絡圖像識別賽第一名的獎狀)

ACCV是國際計算機視覺領域的重要學術會議之一,每兩年舉辦一次,吸引來自全球的一流學者、研究者和開發者參與,共同探討計算機視覺領域的前瞻學術研究與應用。本次ACCV 2020國際細粒度網絡圖像識別賽,主要目的在於使用網絡數據訓練細粒度識別模型,減輕細粒度識別任務對大規模有標籤訓練數據的依賴,以增強模型算法的實用性和擴展性。

此次競賽的數據集規模巨大,訓練數據集包含557169張圖片,測試數據集包含100000張圖片,涵蓋各類動植物,共計5000個類別。所有數據來自網絡,未經人工標註,因此包含大量噪聲和錯誤數據,且數據存在長尾分佈現象,導致不同類別樣本可能同時存在欠擬合和過擬合等問題,對參賽選手提出了巨大挑戰。而本站AI Lab提出了一種基於類別平衡的去噪方法,配合基於BBN的原創模型訓練方案,無需過度依賴高質量的標註數據,能夠直接從網絡數據中獲得更好的模型表達能力。採用比賽準確率(accuracy)作爲評測指標,本站AI Lab解決方案的accuracy達到71.4%,遠超過比賽方所提供的基線模型(accuracy=41.905%)。

細粒度圖像識別不同於通用圖像分析任務,需要對屬於同一基礎類別的圖像進行更加細緻的子類劃分,因此對模型的要求更高、難度更大。而現有深度學習方法通常需要依賴大規模高質量標註數據,其獲取難度較高且成本高昂,一定程度上限制了現實場景下的應用。本站AI Lab在此次競賽中使用的原創模型,能夠在面對大量低質量樣本的情況下,快速找到適用於特定場景的解決方案,降低了圖像識別對於人工標註的依賴,爲通用物品識別、圖像或視頻標籤等應用場景落地帶來了更多可能性。

成立於2017年的本站AI Lab,目前在計算機視覺研究領域有着豐富的技術累積,在落地應用上也擁有着諸多的實踐經驗。此前,本站AI Lab圖像識別技術已成功應用於敏感內容審覈、遊戲反外掛、人臉屬性識別、手勢識別等場景。