☰

字節跳動模型訓練傳遭實習生攻擊損失或達千萬美元

字節跳動商業化團隊模型訓練遭傳被實習生攻擊，消息指，其損失或達千萬美元。(路透)

大陸網上近日流傳關於字節跳動發生大模型訓練被實習生「投毒」事件的消息，有消息指出，事件發生在字節跳動商業化團隊，因田姓實習生對團隊資源分配不滿，利用huggingface平臺的漏洞，透過共享模型寫入破壞程式碼，導致團隊模型訓練成果受損，無法產生預期的訓練成果。據悉，此次遭到入侵的代碼已注入8,000多張卡，損失或達千萬美元。

據第一財經報導，字節跳動知情人士透露，近期公司確實發生過破壞模型訓練一事，但傳聞存在誇張和虛構的部分，該事件實際發生在今年6月底，田姓實習生是在公司商業化技術團隊實習，因爲對團隊資源分配不滿，使用攻擊程式碼破壞團隊的模型訓練任務，不過，該名人士強調千萬美元損失的數字也有所誇大。

該人士還稱，「受程式碼入侵影響的業務不是豆包大模型，而是商業化技術團隊的模型訓練任務」，這影響了字節跳動的廣告部門部分技術工作，實習生透過共享模型進行入侵的部分也不屬於集團大模型。目前實習生已被辭退，公司也將相關情況同步給產業聯盟與實習生學校。

報導認爲，此事件暴露出字節跳動技術訓練中存在的安全管理問題，包括權限隔離、共用程式碼的稽覈等。一位業者說道，進行權限隔離與審計利於保護公司核心資料與智慧財產權，防止資料外泄提高資料與系統的安全性。如即時監控權限使用情況，及時發現權限濫用和異常操作；定期審計權限，檢查團隊成員的權限是否符合授權策略，是否有權限濫用的情況等，但這件事也有難度，包括跨部門合作成本、經常性維護與更新的資源投入等。

另，鳳凰網引述一名前員工透露，字節跳動的實習生權限與正職員工差異不大，也導致這次事件發生，他憂心表示，這次事件可能造成公司警惕，「之後肯定會大大收縮實習生的權限」。

在消息曝出後，涉事實習生試圖在社羣上闢謠，並將責任推給他人，然而，他的說法很快便遭到接近字節跳動的人士否認。據相關知情人士稱，「（田姓實習生）在長達2個月的時間裡對集羣代碼進行惡意攻擊，對公司近30位各級員工造成巨大傷害，讓同事近一季的工作白費。」

同時，上述人士還分享調查人員對田姓實習生的詢問錄音檔稱，在錄音中出現田姓實習生的迴應承認其「透過update使得code帶有了攻擊性」，這些審查紀錄都是不爭的事實。

最新字節跳動大模型資訊公開發生在10月15日，火山引擎在視訊雲端技術大會上發佈大模型訓練視訊預處理方案，助力解決視訊大模型訓練的成本、品質和效能等方面的技術挑戰。目前，該技術方案已應用於豆包視訊生成模型。

字節跳動模型訓練傳遭實習生攻擊 損失或達千萬美元

相關資訊

字節跳動模型訓練傳遭實習生攻擊損失或達千萬美元