☰

網易AI Lab問鼎ACCV 2020細粒度網絡圖像識別賽

近日，第十五屆亞洲計算機視覺學術會議ACCV 2020（Asian Conference on Computer Vision）國際細粒度網絡圖像識別賽公佈最終成績，本站AI Lab以71.4%的準確率擊敗了來自全球的569個頂尖計算機視覺團隊，從超過1000份方案中脫穎而出，一舉斬獲大賽冠軍。這是本站AI Lab繼語音、自然語言處理（NLP）等領域大賽奪冠之後，在計算機視覺領域的又一突破，彰顯了本站AI Lab在人工智能領域的綜合技術實力。

（本站AI Lab榮獲ACCV 2020國際細粒度網絡圖像識別賽第一名的獎狀）

ACCV是國際計算機視覺領域的重要學術會議之一，每兩年舉辦一次，吸引來自全球的一流學者、研究者和開發者參與，共同探討計算機視覺領域的前瞻學術研究與應用。本次ACCV 2020國際細粒度網絡圖像識別賽，主要目的在於使用網絡數據訓練細粒度識別模型，減輕細粒度識別任務對大規模有標籤訓練數據的依賴，以增強模型算法的實用性和擴展性。

此次競賽的數據集規模巨大，訓練數據集包含557169張圖片，測試數據集包含100000張圖片，涵蓋各類動植物，共計5000個類別。所有數據來自網絡，未經人工標註，因此包含大量噪聲和錯誤數據，且數據存在長尾分佈現象，導致不同類別樣本可能同時存在欠擬合和過擬合等問題，對參賽選手提出了巨大挑戰。而本站AI Lab提出了一種基於類別平衡的去噪方法，配合基於BBN的原創模型訓練方案，無需過度依賴高質量的標註數據，能夠直接從網絡數據中獲得更好的模型表達能力。採用比賽準確率（accuracy）作爲評測指標，本站AI Lab解決方案的accuracy達到71.4%，遠超過比賽方所提供的基線模型（accuracy=41.905%）。

細粒度圖像識別不同於通用圖像分析任務，需要對屬於同一基礎類別的圖像進行更加細緻的子類劃分，因此對模型的要求更高、難度更大。而現有深度學習方法通常需要依賴大規模高質量標註數據，其獲取難度較高且成本高昂，一定程度上限制了現實場景下的應用。本站AI Lab在此次競賽中使用的原創模型，能夠在面對大量低質量樣本的情況下，快速找到適用於特定場景的解決方案，降低了圖像識別對於人工標註的依賴，爲通用物品識別、圖像或視頻標籤等應用場景落地帶來了更多可能性。

成立於2017年的本站AI Lab，目前在計算機視覺研究領域有着豐富的技術累積，在落地應用上也擁有着諸多的實踐經驗。此前，本站AI Lab圖像識別技術已成功應用於敏感內容審覈、遊戲反外掛、人臉屬性識別、手勢識別等場景。

網易AI Lab問鼎ACCV 2020細粒度網絡圖像識別賽

相關資訊