谷歌版Her大翻車:試了3次且換手機才成功…網友:我手動只需10秒
翻車,大翻車。
就在今天凌晨,谷歌版Her——Gemini Live正式發佈。
畢竟明顯是對標OpenAI家的GPT-4o,可以說是吸足了科技圈的眼球。
在官網發佈的demo中,拍照問答功能的效果是這樣的:
它大致實現的功能,是用手機拍攝演唱會的海報,並讓Gemini查看用戶的日曆,看看行程是否適合參加。
以及還可以基於此進行一系列後續的操作,包括定時間查票價等等。
然而……當來到發佈會現場演示環節的時候,畫風卻180°大變樣。
請看VCR:
視頻地址:https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
嗯……小哥表情,肉眼可見的有點慌。
就連知名科技媒體TechCrunch都配上了這樣的emoji:
甚至還有網友開啓了辣評模式:
當然,這只是今天Made by Google的一個小插曲。
關於Gemini Live的更多內容,我們繼續往下看。
正如我們剛纔提到的,Gemini Live和GPT-4o的功能十分相似。
除了“拍照問答”之外,它也可以做到實時對話,甚至在Gemini回覆過程中進行打斷。
據瞭解,目前Gemini Live的功能已經在安卓系統中向Advanced訂閱者開放(僅限英語)。
未來幾周,這個功能會陸續擴展到更多語言並且向iOS開放。
在對話聲音方面,Gemini Live推出了10種新的聲音供選擇,效果是這樣的:
視頻地址:https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
在操作方面,由於Gemini已經完全集成到了系統中,所以只需長按電源按鈕或說“Hey Google”,就可以調用了。
例如在寫郵件的過程中,讓Gemini幫你生成配圖,效果如下:
不過對於這項功能,外媒們的評價卻是褒貶不一。
例如The Verge的一位作者在親測後給出的標題是——
Gemini Live比Google快,但更尷尬。
具體原因是作者在一次爲期三天的公路旅行中,汽車的音頻系統突然失效。
使用原先的谷歌助手尋找解決方案花費了至少五分鐘,而Gemini Live僅耗時15秒。
但對話過程中的Gemini Live的持續發言和需要用戶主動打斷的交互方式,卻讓作者感到尷尬。
他認爲:
無獨有偶,對於Gemini Live在雲端運行這個點,華爾街日報也給出了犀利的評價——
對話上的進步,功能上的退步。
具體到技術層面,GPT-4o是一個端到端的系統,但從谷歌發佈的內容來看,Gemini Live則並非如此。
而是將STT、VAD、LLM和TTS系統做了集成:
除此之外,谷歌所發佈的新Pixel系列手機中,也出現了Gemini Live的身影。
包括Pixel 9 Pro Fold、Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL。
AI功能方面,谷歌的Pixel手機在拍照上增加了一個叫“Add Me”的功能。
可以用增強現實(AR)和AI技術,可以把兩張不同照片中的人物“塞”到一起。
雖然谷歌這次發佈Gemini Live,算是對OpenAI GPT-4o的一種應戰,但自從大模型時代拉開序幕以來,我們可以看到一個非常明顯的一種趨勢——
谷歌,跟不上OpenAI的腳步。
首先是在最爲關鍵的ChatGPT發佈的這個節點上,OpenAI成爲了開拓者,但谷歌隨後發佈的Bard,和這次Gemini Live很相似,後續出現了翻車情況。
而後近一年半多的時間來,似乎所有重磅模型、重磅應用的發佈,都是OpenAI在引領。
反觀谷歌這邊,不僅是技術呈現出步步慢的狀態;甚至在輿論上,還出現了被OpenAI用一個人事變動(Ilya離職)消息蓋過谷歌年度最大活動(I/O大會)熱度的情況。
那麼谷歌在大模型時代爲什麼不行了?
對此,前谷歌CEOEric Schmidt(2001年至2011年任職)在斯坦福最新的演講中表達了他的觀點:
視頻地址:https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
甚至還有網友爆料稱:
那麼你對此怎麼看,歡迎在評論區留言討論。
參考鏈接:[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg[2]https://x.com/GoogleDeepMind/status/1823409674739437915[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones