GPT-4o 打《黑神話·悟空》!AI「馬嘍」拿捏 Boss ,勝率超人類

我承認,當朋友對我發出這樣的質疑時,那一刻,我破防了。

從意識到必拿下楊戩,到必撐死虎先鋒,我只花了不到半天的時間,而如果想通關《黑神話》,我們能夠指望 AI 嗎?

翻滾閃避,拉開距離,精怪的行動盡收眼底。

時機一到,天命人猛地揮出重棍。

藉助 AI 的力量,一套絲滑連招下來,Boss 被拿捏得毫無還手之力,不知饞哭多少遊戲手殘黨。

阿里研究團隊最近提出了一個 VARP 智能體框架。而這個 AI「馬嘍」正是出自他們之手。

可以說,不是外掛,卻勝似外掛。

直面大聖的 GPT 們,還真不比人類差

AI 直面大聖,其實也沒那麼複雜。

傳統上,遊戲 AI 靠的是遊戲 API 來獲取環境信息和可執行的動作數據。但問題是,並不是每個遊戲都願意提供開放的 API,或者即使提供,有的 API 也缺胳膊少腿,很難滿足實際需求。

而且,傳統方法也總感覺少點什麼,無法完全模擬人類玩家的真實遊戲體驗。

基於此,阿里研究團隊提出了一個新的 VARP(Vision Action Role-Playing)智能體框架。

VARP 智能體框架在接收輸入的遊戲屏幕截圖後,通過運用一組 VLMs 進行推理,最終生成 Python 形式的代碼來操控遊戲角色,包括一系列原子命令的組合,如輕攻擊、躲避、重攻擊和回血等。

VARP 包含三個知識庫:情境庫、動作庫和人類引導庫,以及兩個系統:動作規劃系統和人類引導軌跡系統。

簡單來說,動作規劃系統相當於圖書館管理員,負責從情境庫和可更新的動作庫中找出最合適的資料。

系統根據輸入的遊戲屏幕截圖,挑選或生成符合當前情境的動作,然後這些動作和情境會被存入或更新到這兩個庫中。

而人類引導軌跡系統則利用人類操作數據集來提升 VARP 在複雜任務中的表現,比如尋路任務和高難度戰鬥任務等。

在動作庫中,「def new_func_a()」表示由動作規劃系統生成的新動作,而「def new_func_h()」表示由人類引導軌跡系統生成的新動作。「def pre_func()」表示預定義的動作。

在上文提到的《黑神話·悟空》遊戲中,研究團隊設定了 12 個任務,其中 75% 涉及戰鬥,並使用包括 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 pro 等 VLMs 進行了基準測試。

結果顯示,VARP 在基本任務和簡單到中等難度的戰鬥中,勝率高達 90 %。但在面對高難度任務時,VARP 的表現容易掉鏈子,整體水平仍然不如人類玩家。

此外,VARP 智能體在處理遊戲中的決策時,因爲依賴於視覺語言模型(VLM)的推理速度,所以不能夠實時地分析每一個遊戲幀(即遊戲畫面)。

換句話說,它不能像人類玩家那樣,幾乎瞬間對屏幕上發生的一切作出反應。相反,它只能每隔幾秒鐘處理一次遊戲畫面,選擇一些重要的幀(關鍵幀)來進行分析和決策。

《黑神話·悟空》上線時曾被吐槽沒有明確的地圖,且存在大量的「空氣牆」,所以在沒有研究人員的輔助下,AI 也會像無頭蒼蠅一樣找不到 Boss。

生成式 AI 點燃了世界變革的火種,而在它尚未涌入大衆視野之時,普通人對 AI 更直觀的羈絆或許大多源於遊戲。

在電子遊戲史上,AI 遠比我們想象的重要

可能很多人都沒想到,最早一批搭上 AI 快車的遊戲會是經典街機遊戲《吃豆人》。

玩家勝利的前提是吃掉迷宮內的所有豆子,而哪些看似傻乎乎的彩色鬼魂則擁有不同的追擊算法,它們會以不同的路徑和方式對玩家展開圍追堵截。

每個鬼魂的算法招數異常簡單,也缺乏任何學習能力,一旦玩家摸透了這些規律,遊戲的挑戰難度便會直線下降。

1987 年推出的《合金裝備》則標誌着遊戲 AI 的另一個重要里程碑。

遊戲中的 AI 角色開始展現出更爲複雜的行爲模式,並首次引入了對玩家的敵對反應機制。在這款遊戲中,如果玩家被敵人發現,敵人會觸發警報系統,呼叫增援,改變巡邏路線,甚至設置陷阱。

再後來,如果粗淺地將 AI 與遊戲的發展歷程用一連串標誌性事件羅列出來,大致如下:

置於當下的遊戲環境中審視,遊戲依然主打一個陪伴,而 AI 則如同一臺放大器,將這份陪伴放大了無數倍。

在今年的 CES 展會上,英偉達使用 Avatar Cloud Engine(ACE)讓遊戲 NPC「活」起來,也藉此火爆出圈。

在名爲 Kairos 的演示中,玩家能夠與拉麪店老闆 Jin 進行互動。雖然 Jin 只是一個 NPC,但在生成式 AI 的幫助下,像真人一樣回答問題。

AI 與遊戲的結合也總是讓人感到既愛又恨。

就拿競技類遊戲來說吧,過往的做法只是生硬地調整難度,而現在則是模仿人的操作,讓遊戲體驗更加真實。

支持者認爲,當模擬人類的 AI 成爲對手或隊友的時候,反過來也能提升因缺乏真人玩家所帶來的遊戲競技感。

而弊端也正在於此,玩家的的留存率是提高了,但在系統的操控下,玩家們也逃脫不了被 AI 玩弄的漩渦。

前期豪言壯語,中期胡言亂語,後期沉默不語。

當我們熬夜通宵只爲再贏一把的時候,已經很難說清楚究竟是我們在玩這個遊戲,還是這個遊戲在玩我們。尤其當你意識到隊友可能是 AI 時,那種無力感就像是拳頭打在了棉花上。

心裡也軟綿綿的,毫無着力點。

老黃預言家!未來遊戲或將由 AI 生成?

即便是代碼小白,也能用 AI 手搓遊戲。

這放在幾年前,估計只能在夢裡想想了,但生成式 AI 到來讓這一切有了落地的實際空間。

往小了說,創建一個 GPTs 玩起故事劇本殺,再大了點說,那就是 AI 輔助生成的小程序遊戲,雖然互動性差點意思,但勝在畫面精美豐富。

再往大了說,甚至未來連 3A 大作級別的遊戲,都有可能直接通過 AI 渲染生成。

去年英偉達創始人黃仁勳曾預言,未來遊戲中的每一個像素都將被生成,而不是渲染。當時這話說的時候,但大家可能還半信半疑,但現在,越來越多的研究成果給這個落地找到了可能性。

通常,製作一款小型遊戲的環境可能需要一週時間,對於工作室項目,創建遊戲環境可能需要更長的時間,具體取決於設計的複雜程度。

上個月,Google DeepMind 公佈了首個「AI 遊戲引擎」GameNGen。

它能夠在單個 TPU 芯片上以超過 20 幀每秒的速度實時模擬經典射擊遊戲《毀滅戰士》。其工作原理是利用擴散模型實時預測每一幀,這意味着,遊戲中的每一刻都是根據玩家的操作和環境的複雜互動實時生成的。

當時,英偉達高級科學家 Jim Fan 不禁感慨,被黑客們在各種地方瘋狂運行的《毀滅戰士》,竟然在純粹的擴散模型中實現了,每個像素都是生成的。

再後來,類似更多成果也正在涌現。

前不久,騰訊也放了大招,推出了一款專門面向 3A 開放世界遊戲的大模型——GameGen-O。

GameGen-O 可不簡單,它能夠模擬各類 3A 遊戲,比如《巫師 3》、《賽博朋克 2077》《刺客信條》以及《黑神話:悟空》裡的角色、動態環境,以及複雜動作等,生成的遊戲場景質量也很高。

爲了構建數據集,下血本的騰訊蒐集了超過 32000 個遊戲視頻,每個視頻短則幾分鐘,長則幾小時,然後經過人工數據標註挑選了 15000 個可用視頻。

這些精選的視頻通過場景檢測被切割成片段,然後按照美學、光流分析和語義內容進行了嚴格的排序和過濾。

美國遊戲開發商 Electronic Arts 最近也通過一段「從想象到創造」視頻,向業界展示了未來 AI 在遊戲開發落地的美好願景。

視頻中,玩家僅憑簡單的指令,就能使用 AI 工具創建遊戲場景、角色和其他內容。

CEO Andrew Wilson 稱未來生成式 AI 可改進公司一半以上開發流程,預計將在三至五年內設計創造更大、更身臨其境的遊戲世界。

AI 不僅能夠提升現有遊戲的開發效率,還可能創造出全新的遊戲體驗。

也許你會說,不管遊戲用的是什麼高大上的技術,歸根結底,好玩纔是王道。

但在 GTA 6 反覆跳票,遲遲不見蹤影的情況下,我們或許也會萌生一種自己動手、豐衣足食的念頭。

畢竟,如果未來能親手打造一個「罪惡都市」,感覺好像也還不錯。