騰訊優圖發佈2021十大人工智能趨勢,AI算法的公平性和隱私保護問題受關注
近日,2021全球人工智能技術大會在杭州成功舉辦,在計算機視覺論壇上,騰訊優圖實驗室副總經理黃飛躍正式宣佈,騰訊優圖聯合廈門大學人工智能研究院正式發佈《2021十大人工智能趨勢》(以下簡稱趨勢報告),該趨勢報告基於騰訊優圖和廈門大學人工智能研究院長期對人工智能尤其是計算機視覺的研究洞察,提出3D視覺技術、數字內容產業、AI深度學習算法、人工智能內核芯片等方向的前沿預測。
騰訊優圖實驗室副總經理 黃飛躍
趨勢報告指出,自動機器學習的自動化程度與可解釋性得到進一步提升,AutoML整個體系架構的日趨完善,將推動新一代普適性AutoML平臺的建設,並實現機器學習的大衆化。過去幾年,深度學習所取得的巨大成功離不開大規模標註的數據集,但隨着業務規模的不斷擴大,數據標註成本成爲制約企業降本增效的主要因素之一,無監督、弱監督學習將成爲企業降本增效的新利器。
大會上,黃飛躍表示,隨着算法和硬件能力的不斷升級,3D視覺智能技術將推動商業發展和個人消費升級;深度學習邁向多模態融合,邊緣計算與人工智能加速融合,AI算法的公平性研究將推動AI應用走向普惠。
以下爲《2021十大人工智能趨勢》詳細內容:
1、自動機器學習的自動化程度與可解釋性得到進一步提升
自動機器學習(AutoML)目前已經在多個領域中初步實現對機器學習方法的自動化設計過程,但其仍然存在自動化程度不足,可解釋性不強的問題。如神經網絡結構搜索(NAS)在一些應用領域中取得了可以與人類機器學習專家可比較的水平,然而現有的NAS方法實際需要基於人工設計的神經網絡基礎結構。此外,AutoML的自動化過程往往被認爲是一種 “黑箱”,缺乏可解釋性。今後自動化程度及可解釋性仍然是AutoML研究的熱點問題,通過提高AutoML中的超參數選擇,特徵表示與機器學習算法的確定和神經網絡結構搜索的自動化程度及可解釋性,AutoML將實現對機器學習涉及的每個環節的真正的自動化設計過程。AutoML整個體系架構的日趨完善,將推動新一代普適性AutoML平臺的建設,並實現機器學習的大衆化。
2、無監督/弱監督學習逐漸成爲企業降本增效新利器
在過去的幾年中,深度學習所取得的巨大成功離不開大規模標註的數據集。大規模標註的背後,是傳統的監督學習對於每一個訓練樣本完備標籤的要求。隨着業務規模的不斷擴大,越來越多的企業發現數據的標註開始成爲擡高交付成本、制約效果提升的主要因素之一。在此背景下,無監督學習和弱監督學習通過不使用標籤或減少對標籤數量、質量的要求來迅速降低深度模型對於數據的標註需求,使得原本無法利用的數據如今都可以加入到模型的訓練中去,進而由量變引發質變。在NLP領域,基於Transformer的無監督訓練模型已持續霸榜各種NLP任務數據集;在CV領域,最新的MPL方法也通過額外的無標註數據集首次將ImageNet的Top-1分類準確率提升到了90%+的水平。可以預見的是,將有越來越多的人工智能企業會面臨從前期的迅速擴張到穩定期高效化運作的新階段,而在這個過程中,無監督/弱監督學習無疑將成爲他們過渡到這個階段的重要手段之一。
作爲視覺AI領域多年熱點研究方向之一,3D視覺技術的核心任務是對三維空間、物體及環境進行真實還原與重建。隨着相關算法與硬件計算能力的不斷升級, 3D視覺算法效果得到大幅提升,三維幾何重建更加精細,表面紋理重建更加清晰,帶來更加逼真的視覺觀感。近年來,諸多3D視覺研究成果爲低成本高質量的3D內容生成提供了良好技術支撐,基於3D虛擬形象的舞臺演出、直播帶貨、教育互動等應用層出不窮,成爲AI內容產業全新發展方向。以此爲基礎,結合5G時代流量帶寬的全面升級,帶有交互功能的3D虛擬現實、增強現實、混合現實的3D視覺應用將用戶體驗向真實與虛擬的完美融合進一步邁進。用戶會因爲虛擬偶像生動自然的舞臺表演進行打賞,會由於虛擬主播“賣力”地帶貨促銷而下單購買,而線上平臺則依靠3D視覺技術大大降低內容製作和IP運營成本,最終帶來社會商業發展模式與個人消費習慣的顛覆與變革。展望未來,3D視覺技術將持續在包括遊戲娛樂、影視製作、電商直播、醫療整 形等衆多領域廣泛應用,虛擬與現實的邊界將不斷淡化。
4、多模態融合加速AI認知升維
深度學習在多個人工智能的細分領域(如視覺,自然語言處理等)已日趨成熟化和規模化,然而要真正實現通用人工智能,必然要將這些細分領域各自所針對的信息模態整合利用,即多模態融合。多模態融合的目標是建立在圖像、文字、語音等的多模態信息識別的基礎上,實現不同模態信息的統一表徵框架,從而起到1+1>2的作用。典型的場景之一是通過圖文語音聯合識別,實現對隱晦和暗示性,招嫖廣告,兒童不良表情包等圖文混合內容識別,支持審覈業務深度打擊不良內容。除了圖文融合等跨域模態融合,同域內的不同信息維度同樣可以融合,如隨着深度生成技術的發展,當前的人臉識別除了傳統的RGB圖外,還需要融合深度圖、紅外圖等信息來更好的防禦越來越多元化的人臉僞造攻擊,實現更強的人臉防禦。隨着人工智能認知能力的提升,多模態融合也將會從圖文等實質性模態,逐漸拓展到如物理關係,邏輯推斷,因果分析等知識性模態,從感知智能邁向認知智能。
5、人工智能推動數字內容生成向新範式演進
隨着數字文化產業的蓬勃發展,尤其是二次元文化滲透出圈,數字內容產業面臨新一輪的需求升級,伴隨着5G商業化進程的不斷加深,多元化、精品化的優質數字內容將面臨更快的消費節奏,與此同時,供給側仍存在巨大的產能缺口,數字內容產業正處於勞動密集型向科技密集型的轉型階段。AI與數字內容產業的深度耦合,將有希望爲行業釋放更大的科技勢能,以GPT-3、DALL-E爲代表的AI技術,已在文本、語音、圖像、視頻等內容生成中取得了令人驚豔的結果,然而在精確性、泛化性、合理性方面仍然面臨挑戰,目前的前沿研究一方面探索從模型結構(自動化搜索等),訓練形式(無監督對比學習等)等方面提升精度效果;另一方面引入知識圖譜領域知識,向機器介紹常識和其他特定領域的知識進而提升常識推理效果。伴隨着技術的持續升級演進,我們預見AI將逐步在數字內容生成領域釋放引擎級的影響力,在內容、平臺、技術多方合力引導下,構築數字內容生成新範式。
6、邊緣計算與人工智能加速融合
近年來,隨着深度學習算法的迅猛發展,計算機視覺、自然語言處理、搜索推薦廣告等各種領域的任務性能得到不斷刷新。同時,隨着邊緣智能設備的廣泛普及和硬件改進,基於深度學習的人工智能技術在邊緣端應用落地成爲了可能。然而,在邊緣端上部署深度學習模型具有很大的難度。其主要挑戰表現在,邊緣端等智能設備在計算、存儲、功耗等方面有很大的限制。因此,邊緣端模型必須滿足低計算複雜度、小模型尺寸、低模型功耗等要求。未來將趨向硬件友好型的剪枝加速。根據邊緣硬件的CPU類型來設計特定的網絡稀疏化模式,適配不同硬件的模型壓縮與優化加速技術是未來研究熱點趨勢。其次,基於自動化的1-bit量化方法有上百倍的理論性能提升,因此也是未來研究熱點趨勢。
7、人工智能內核芯片向類腦神經計算方向演進
人工智能內核芯片已經成爲人工智能時代的關鍵技術之一,在某些領域中的具體任務上人工智能內核芯片能夠實現超越人腦的表現,但針對人工智能內核芯片的研究依然落後於人工智能的發展,人工智能內核芯片無法同時滿足多種人工智能算法的加速要求,並且面對各種新型人工智能技術不斷涌現的局面,人工智能內核芯片與人腦相比其自我學習能力與可擴展性存在明顯不足。未來人工智能內核芯片將在結構上更接近人腦的神經構造,獲得類神經計算的能力,通過不斷整合最新的人工智能技術,定製型人工智能內核芯片將逐漸演變爲通用型人工智能內核芯片,在提高自我學習能力的同時,實現對不同人工智能技術在不同任務上的加速計算,從而推動人工智能內核芯片實現真正的落地。
8、算法公平性研究推動AI應用走向普惠無偏見
由於數據偏差、算法本身缺陷、甚至是人爲偏見的存在,現有AI算法普遍存在對於某些特定
由於數據偏差、算法本身缺陷、甚至是人爲偏見的存在,現有AI算法普遍存在對於某些特定人羣效果不公平的"歧視性現象"。隨着AI算法在社會各行業的廣泛落地應用,作爲輔助人們決策的重要工具,算法的公平性問題正受到越來越多的關注。過去的幾年業界已在逐步探索一些針對性的解決方案,包括構建更公正的數據集、算法訓練中引入公平性約束損失、提高機器學習算法的可解釋性等。但就整體而言,當前公平性研究在精度和公平性的平衡、不同場景的泛化性有效性等問題上正處於方興未艾的階段。隨着歐盟發佈《人工智能白皮書》、《人工智能倫理:問題和倡議》,中國發布《協同落實人工智能治理原則的行動建議》,人工智能的治理正成爲一個愈加熱門的議題,而算法的公平性正是人工智能治理的關鍵問題。我們預見算法公平性的研究將持續深化,在人臉識別等最廣泛的AI應用領域取得突破,爲不同人羣帶來更加普惠無偏見的效果。
9、隱私保護AI落地實用幫助算法可持續進化
人工智能和機器學習算法的廣泛應用,在爲人們提供便利的同時,也帶來了極大的隱私泄露風險。這種隱私泄露包括用戶數據在授權範圍以外被處理共享、機器學習算法訓練後存在數據記憶等現象。AI算法開發中的數據隱私保護問題受到的關注以及監管日益增長,美國於2020年生效《加利福利亞消費者隱私法案》,中國於2020年公佈《個人信息保護法(草案)》。針對機器學習中上述隱私保護問題,研究工作近年來逐步深入走向成熟,發展出了數據匿名化、聯邦學習、差分隱私等一系列方法。我們預見能夠保護用戶數據隱私的更加靈活高效的AI學習方法將在金融、醫療、社交等場景實用化落地,消減用戶的隱私擔憂,幫助AI算法在場景中可持續地進化。
10、人工智能技術向安全智能方向邁進
隨着人工智能技術在各行各業的廣泛應用,濫用或惡意破壞人工智能系統將會給社會帶來巨大的負面影響。近年來算法後門攻擊、對抗樣本攻擊、模型竊取攻擊等針對人工智能算法的攻擊技術持續發展,通過篡改構造特殊數據誘騙人工智能應用產生不可信的錯誤結果,帶來了更大的算法安全風險,因此保障人工智能應用安全可靠的需求日漸迫切。未來人工智能技術將向着安全智能方向持續演化,一方面從算法的可解釋性入手提升模型的魯棒性,另一方面化被動爲主動,通過主動安全檢測機制對各類攻擊進行偵測與攔截,最終實現人工智能可用性與可信性雙軌並重的現實需求,推動人工智能技術在更廣泛領域的安全落地。
作爲騰訊旗下頂級的人工智能實驗室,騰訊優圖始終專注基礎研究、產業落地兩條腿走路的發展戰略,通過騰訊雲持續輸出頂尖的視覺AI能力。目前,優圖實驗室已擁有超過1000餘項AI相關國內外專利,300餘篇論文被CVPR、AAAI、ICCV等國際頂級AI會議收錄,輸出超過30個行業解決方案,在推動產業互聯網發展中提供源源不斷的動力。