☰

山姆-奧特曼怒噴谷歌，GPT-4o搶了Gemini風頭

這些天的硅谷，亂成了一鍋粥。

OpenAI CEO山姆-奧特曼直接在社交平臺公開嘲諷谷歌的審美過於差勁，他表示：我努力不去過多思考我們的競爭對手，但我無法不去思考OpenAI和谷歌之間的美學差異。

下面附着的兩張發佈會現場圖，左邊是OpenAI，右邊是谷歌。言下之意，就是OpenAI乾淨明瞭，極具科技感；而谷歌則離人羣非常遠，十分過時。

山姆-奧特曼如此氣急敗壞，還是因爲在上週，OpenAI和谷歌同時發佈AI新品，雙方打的你來我往：你說GPT-4o全球最先進，我說Gemini家族能覆蓋全生態全路徑。

兩家硅谷巨頭的直接對抗，把科技競賽的強度拉滿，就連CEO本人都坐不住了。

谷歌AI全家桶上線

山姆-奧特曼嘲諷谷歌並不是無的放矢，這場谷歌I/O大會在觀看性上，確實難以令人滿意。

首先是時間太長，谷歌I/O大會足足有接近兩個小時，主持人連續提起了121次AI字眼，甚至有觀衆在社交平臺抱怨自己都快睡着了。

然後就是產品太多，比起OpenAI僅有GPT-4o一款新品，谷歌這次則推出了十餘種Gemini大模型的升級及新品，可以說是"AI全家桶"。

發佈AI搜索：Google Search；

升級了Gemini大模型：Gemini 1.5 Flash（100 萬上下文）、Gemini Pro（200 萬上下文）；

新發布了手機版Gemini App：以手機應用程序形式，支持和AI視頻對話；

發佈視覺語言模型Project Astra：擁有Imagen3（圖像）、Music AI Sandbox（音樂）、Veo（視頻生成）三種能力。

雖然谷歌AI全家桶看上去格外炫酷，但實際上對比OpenAI的GPT-4o依然差上很多，更多是硬件性升級，單純給大模型升級一下參數。

最令人印象深刻的兩項功能，是AI搜索Google Search和AI助理Project Astra。

首先是Google Search，搜索作爲谷歌起家的根本，這些年遭受到了微軟的重創。微軟的Bing已經藉助ChatGPT，給傳統搜索引擎帶來了"億點點"AI降維打擊。

甚至就連OpenAI也在盛傳將推出AI搜索類產品，來搶佔Google搜索市場。

壓力之下，谷歌推出Google Search來穩定自家護城河，下定決心重塑搜索體驗。

據演示視頻來看，Google Search最核心的功能，就是搜索摘要功能AI Overview。

所謂的"搜索摘要功能"，就是谷歌之前提出來的"搜索生成式體驗（SGE）"。

用戶在搜索框內鍵入文本，直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對搜索結果的總結和概括，以及推薦的鏈接。

AI Overview還內置了"多步推理功能Multi-Step Reasoning"、"計劃功能Planning in Search"、"視頻提問Ask With Video"。

另外一個發佈會亮點，就是谷歌推出的AI助理Project Astra。

Project Astra就是一個完全對標GPT-4o的產品，產品形態和使用邏輯基本和ChatGPT無二。用戶可以和它實時對話、視頻聊天。

並且，和GPT-4o一樣，Project Astra也提供文生圖、文生視頻兩項功能。只不過不叫DALL·E和Sora，而是叫做Imagen 3和Veo。

唯一有點不一樣的，就是Project Astra提供了音樂生成模型Music AI Sandbox。

用戶可以上傳一小段音樂demo，Music AI Sandbox能在此基礎上拓展延長。用戶還可以輸入提示詞，進一步調整音樂風格，進行樂曲的二度創作。

總之，用一句話來概括谷歌AI全家桶，就是：東西很多，精品很少。

我們能在一系列AI新產品裡，不斷看到ChatGPT的影子，但單純是在GPT-4o做好的框架裡縫縫補補，升級一下算力，換個新框架。

能給用戶帶來震撼感的產品呢？

依然沒有看到。

越來越像人類的GPT-4o

比起谷歌的多到凌亂，OpenAI則是簡潔明瞭。

僅僅只有半個多小時，全程由公司CTO和兩位工程師face to face，以對話形式展示產品，非常具有電影感。

甚至CEO山姆-奧特曼都沒有現身發佈會，完全用產品力來震撼用戶。

現場的演示嘉賓拿着手機攝像頭，讓GPT-4o識別自己的表情，來判斷自己的情緒。

GPT-4o很快識別完成，說：你看起來很開心，帶着燦爛的笑容，甚至有一絲興奮，你能分享你快樂的來源嗎？

演示嘉賓在紙上寫了"i love you"給GPT-4o，GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應着人類的"愛意"。

GPT-4o能感受到你的呼吸節奏、能"看出"你文字當中包含的情緒、甚至可以打斷它的話，重新爲話題增加新的語境，它也能作出完美迴應……

這樣的人工智能，讓你想到了什麼？

是的，一個完美戀人。

就像是2013年上映的好萊塢電影《Her》，斯嘉麗配音的人工智能和人類談起了戀愛。

這一幕，逐漸成爲現實。誰會不喜歡一個熱情洋溢、事事有迴應、提供豐富情緒價值的伴侶呢？

哪怕它是AI。

GPT-4o給後來者谷歌一個下馬威，也給出未來AI大模型的一個滿分答案：不管是生成式AI大模型也好，聊天機器人也好，不用再去關心什麼硬件什麼參數，AI的最終方向就是越來越像人類。

OpenAI並沒有過多描述自己的算力、自己的硬件升級，只是由首席技術官穆裡·穆拉蒂 (Muri Murati) 表示，GPT-4o將提供與GPT-4同等水平的智能，但在文本、圖像以及語音處理方面均取得了進一步提升，"GPT-4o可以綜合利用語音、文本和視覺信息進行推理。"

現階段的GPT-4o已經擺脫了對文本、圖片或語音的束縛，它的識別能力進化到了"聽覺"和"視覺"。

用"聽"來捕捉情緒變化，比如能判斷對方急促的呼吸方式不對；用"看"來識別你寫在紙上的方程式數學問題，一步步教你解題步驟。

甚至它還可以通過手機攝像頭，回答你"這個人穿什麼牌子的襯衫？"

比起谷歌眼花繚亂、不知從哪下手的AI全家桶，GPT-4o已經領先到大氣層了。

免費，但又不完全免費

GPT-4o除了在能力上，給了谷歌一個下馬威外，OpenAI還放了大招：

穆裡-穆拉蒂表示，GPT-4o將免費提供給所有用戶使用，不但當下免費，甚至以後OpenAI做產品就是要免費優先，爲的就是讓更多的人能使用。

就連OpenAI CEO山姆奧特曼表示，新的GPT-4o是OpenAI有史以來最好的模型，它可供所有ChatGPT用戶使用，無論是免費版本還是付費GPT-4版。

不得不說，當服務免費時，用戶就是產品。

如果GPT-4o真的能徹底取消付費制度，那麼OpenAI獲得的數據量會超出想象。

可惜的是，OpenAI還是缺少"用免費改變世界"的魄力，背後還是有不少的貓膩。

首先，OpenA在官網公告上明確說明，免費用戶在使用GPT-4o時，OpenAI做出了權限上的分級。

免費用戶可以使用GPT-4o的分析數據、創建報表、處理照片、上傳文件、使用記憶功能等，基本上GPT-4o涵蓋了GPT4所有的付費功能。

但是免費用戶會有消息數量的限制，PIUS用戶的消息將是免費用戶的5倍，Team和Enterprise用戶限制將會更高。

每天能用多久？每天能發幾條？GPT-4o並沒有詳細說明。

或許，我們可以參考OpenAI上一代GPT-4，限制每個用戶每天的使用時間在3小時以內，並限制每天生成的信息數量不超過25條。

雖然說這一限制在一定程度上，提高了信息的質量和用戶的注意力。但還是要感嘆一句，互聯網的免費，永遠不是真免費。

哪怕到了AI時代，這個法則也同樣適用。

山姆-奧特曼怒噴谷歌，GPT-4o搶了Gemini風頭

相關資訊