路透:字節跳動新AI模型主要以華為晶片來訓練

字節跳動不僅已是華爲AI晶片的主要買家,也是輝達(NVIDIA)專爲大陸市場設計的H20 AI晶片的最大買家。路透

路透引述知情人士報導,TikTok的大陸母公司字節跳動新開發的人工智慧(AI)模型,計劃改以華爲晶片爲主,減少對輝達(NVIDIA)晶片的依賴。

美國2022年開始管制高階AI晶片出口以來,字節跳動已經分散轉向國內供應商尋求貨源,並加速發展自有的AI技術。

知情人士告訴路透,字節跳動在AI競賽中的下一階段,將採用華爲的Ascend 910B晶片來訓練大型語言AI模型。但也有消息人士透露,字節跳動正在規劃一個新的AI模型,但無法確認是否會使用華爲的晶片。

路透引述消息人士報導,字節跳動已經採用Ascend 910B用於運算需求較低的推理任務,這些工作採用預訓的AI模型來做預測。

消息人士透露,字節跳動今年已採購超過10萬顆Ascend 910B晶片,但截至7月拿到的還不到3萬顆,交貨進度太慢,無法滿足公司的需求。

據報導,字節跳動不僅已是華爲AI晶片的主要買家,也是輝達專爲大陸市場設計的H20 AI晶片的最大買家。據消息人士透露,字節跳動也是微軟在亞洲透過雲端運算來採用輝達晶片的最大客戶。

消息人士指出,字節跳動無法爲新模型確定進度,即因爲國內晶片供貨有限,且相較於H20 晶片的運算能力不足。

字節跳動目前的AI技術應用於2023年8月推出的旗艦大型語言模型,此模型後來更名爲聊天機器人「豆包」,並廣泛應用於其他多種應用程式,包括文字轉影片工具「即夢」。本月,字節跳動推出了兩款專注於影片的豆包模型,要和OpenAI競爭。

今年初以來,相關應用使用量激增,字節跳動的聊天機器人成爲中國廣受歡迎的應用工具,每月活躍用戶超過1,000萬人。