AI抄襲背後的硅谷“不光彩文化”

“‘作假,直至成功’,這是硅谷不光彩的文化。”美國斯坦福大學人工智能實驗室主任克里斯托弗·曼寧3日就該校某些研究人員抄襲中國清華大學等機構成果的行爲這樣評論說。他在社交媒體上還指出,該研究團隊應該深刻認識自己的錯誤。

確信“套殼”連做錯的樣例都一樣

5月29日,斯坦福大學一個研究團隊發佈名爲Llama3-V的大模型,聲稱只要500美元的預訓練成本,就能用它獲得比肩GPT-4V等著名大模型的效果。這一消息在社交媒體和人工智能學術界被廣泛轉發。  但業內人士很快發現,該大模型涉嫌抄襲清華大學等機構發佈的MiniCPM-Llama3-V 2.5大模型。它們都是基於開源的Llama3大模型,但清華團隊進行了獨特的訓練,包括利用“清華簡”(清華大學收藏的一批戰國竹簡)訓練它識別古代中國文字的能力。測試顯示,斯坦福大學這個團隊發佈的大模型居然也能識別“清華簡”。  “已經比較確信,斯坦福這個團隊‘套殼’了我們的大模型研究成果。”清華大學計算機系長聘副教授劉知遠對新華社記者說。  “我們從‘清華簡’逐字掃描並標註的數據集從未公開,而Llama3-V展現出了一模一樣的識別‘清華簡’能力,連做錯的樣例都一樣。”劉知遠是清華這個大模型團隊成員。他介紹說,在質疑聲發酵後,對方已經在網上刪除了此前發佈的數據庫和宣傳文章,“從證據和對方反應來看,抄襲性質已比較確定”。

“作假成功”津津樂道的負面文化

曼寧發聲批評後,斯坦福該團隊的兩名成員夏爾馬和加格也在社交媒體上正 式 道 歉 ,並 表 示 要 完 全 撤 下Llama3-V模型。  在當前的人工智能熱潮中,這個事件引發廣泛關注。有觀點認爲美國的人工智能全面領先,但該事件說明,雖然美國科技仍然整體領先,但遠非全能,也不應迷信美國單方宣佈的“重大成果”。  斯坦福大學所處的硅谷地區被認爲是美國科技創新的重鎮,既孕育了許多先進技術,也有“作假,直至成功”等被津津樂道的負面文化。  比如,從斯坦福大學退學創業的伊麗莎白·霍姆斯曾吹噓有顛覆性檢測技術可“抽指血查癌症”,一度成爲全球聞名的科技創業明星,但後來被發現造假並因欺詐投資者罪名獲刑。放眼整個美國科技領域,近年來波音客機事故頻發等暴露了更多、更大的問題。  在人工智能領域,前段時間還有個“著名”事件,在用中文問谷歌人工智能模型“雙子座”Pro版(Gemini Pro)它是誰時,它會回答自己是“文心一言”,這個問題很快被谷歌消除。業界人士認爲,其原因可能是谷歌在訓練大模型的中文時“參考”了中國百度公司的大模型“文心一言”相關數據。  可見,中國科技近年來快速發展,一些獨特的優勢越來越引人注目,被美國同行“參考”甚至抄襲。  “中國人工智能研究的國際影響力越來越大”,劉知遠說,“這次抄襲事件也從側面反映了我們的創新成果正在受到國際關注”。他說,從橫向來看,中國研究與國際頂尖成果仍有顯著差距,但從縱向來看,中國已快速成長爲人工智能科技創新的重要推動者。

據新華社