字節跳動大模型訓練被實習生攻擊:損失超千萬,涉事者已辭退

10月18日,多個微信羣流傳一則消息:“某頭部大廠的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。”

據知情人士透露,該頭部大廠爲字節跳動。此事發生在今年6月,起因是某高校的博士在字節跳動商業化技術團隊實習,因對團隊資源分配不滿,該實習生利用了HF(huggingface)的漏洞,使用攻擊代碼破壞團隊的模型訓練任務。目前,該實習生已被辭退。

一位技術安全專家表示,HF漏洞產生肯定是單一性集中訓練,此事暴露了字節跳動技術訓練存在安全管理問題。公司既沒做權限隔離,也沒有做好共用代碼的審計。正常情況下,每次大的代碼變動必須做審計,無論誰做操作都有痕跡記錄,一個人想動代碼是不可能的。

上述技術安全專家表示,目前行業通用的做法是做三級隔離導向性部署,每一級只有鏡像,每次先掃描。調用按次算、必須密鑰。每一級完成後,才能進入下一級,而上一級自動刪除,進行分級訓練。

(綜合:界面新聞,濟寧新聞網,財聯社等)