字節跳動模型訓練傳遭實習生攻擊 損失或達千萬美元
字節跳動商業化團隊模型訓練遭傳被實習生攻擊,消息指,其損失或達千萬美元。(路透)
大陸網上近日流傳關於字節跳動發生大模型訓練被實習生「投毒」事件的消息,有消息指出,事件發生在字節跳動商業化團隊,因田姓實習生對團隊資源分配不滿,利用huggingface平臺的漏洞,透過共享模型寫入破壞程式碼,導致團隊模型訓練成果受損,無法產生預期的訓練成果。據悉,此次遭到入侵的代碼已注入8,000多張卡,損失或達千萬美元。
據第一財經報導,字節跳動知情人士透露,近期公司確實發生過破壞模型訓練一事,但傳聞存在誇張和虛構的部分,該事件實際發生在今年6月底,田姓實習生是在公司商業化技術團隊實習,因爲對團隊資源分配不滿,使用攻擊程式碼破壞團隊的模型訓練任務,不過,該名人士強調千萬美元損失的數字也有所誇大。
該人士還稱,「受程式碼入侵影響的業務不是豆包大模型,而是商業化技術團隊的模型訓練任務」,這影響了字節跳動的廣告部門部分技術工作,實習生透過共享模型進行入侵的部分也不屬於集團大模型。目前實習生已被辭退,公司也將相關情況同步給產業聯盟與實習生學校。
報導認爲,此事件暴露出字節跳動技術訓練中存在的安全管理問題,包括權限隔離、共用程式碼的稽覈等。一位業者說道,進行權限隔離與審計利於保護公司核心資料與智慧財產權,防止資料外泄提高資料與系統的安全性。如即時監控權限使用情況,及時發現權限濫用和異常操作;定期審計權限,檢查團隊成員的權限是否符合授權策略,是否有權限濫用的情況等,但這件事也有難度,包括跨部門合作成本、經常性維護與更新的資源投入等。
另,鳳凰網引述一名前員工透露,字節跳動的實習生權限與正職員工差異不大,也導致這次事件發生,他憂心表示,這次事件可能造成公司警惕,「之後肯定會大大收縮實習生的權限」。
在消息曝出後,涉事實習生試圖在社羣上闢謠,並將責任推給他人,然而,他的說法很快便遭到接近字節跳動的人士否認。據相關知情人士稱,「(田姓實習生)在長達2個月的時間裡對集羣代碼進行惡意攻擊,對公司近30位各級員工造成巨大傷害,讓同事近一季的工作白費。」
同時,上述人士還分享調查人員對田姓實習生的詢問錄音檔稱,在錄音中出現田姓實習生的迴應承認其「透過update使得code帶有了攻擊性」,這些審查紀錄都是不爭的事實。
最新字節跳動大模型資訊公開發生在10月15日,火山引擎在視訊雲端技術大會上發佈大模型訓練視訊預處理方案,助力解決視訊大模型訓練的成本、品質和效能等方面的技術挑戰。目前,該技術方案已應用於豆包視訊生成模型。