ChatGPT「語音助理」來了! 少數Plus用戶搶先試用

▲OpenAI預計8月初公佈GPT-4o功能。(圖/路透)

記者陳香菱/綜合報導

美國人工智慧公司OpenAI推出「語音助理」,從29日起,將向部分付費的ChatGPT Plus客戶推出語音功能,預計所有的ChatGPT Plus客戶在今秋前就能使用。即將推出的視訊功能將可以直接「打斷」它的回答,同時有更多「情緒化」的回覆,「就像與人交談一樣」。

OpenAI在聲明中指出,SearchGPT這是新搜尋功能的原型,希望將AI與網路最新資訊結合,透過搜索不同資料整合來提供快速、及時的答案,也會附上來源的連結,讓用戶能快速找出更多相關資訊,還可以透過問答對話進行交流,辨識使用者的語調,來產生不同的聲音。

「透過逐步推出,我們可以密切監控使用情況,並基於真實世界的回饋,不斷改良模型能力和安全性。」OpenAI表示,會持續推出更多新功能及產品,視訊與螢幕共享的功能還在研發中。

OpenAI在X上宣佈,將開始向部分付費的ChatGPT Plus客戶推出語音功能,語音模式將提供「更自然、即時的對話,允許你隨時打斷,並能感應並回應你的情緒」,被選到的用戶會收到一封電子郵件,裡面包含使用說明及相關資訊,預計讓所有Plus用戶在「今年秋季前」使用到新功能。

We’re starting to roll out advanced Voice Mode to a small group of ChatGPT Plus users. Advanced Voice Mode offers more natural, real-time conversations, allows you to interrupt anytime, and senses and responds to your emotions. pic.twitter.com/64O94EhhXK

語音功能是5月發佈GPT-4o時的核心項目,他們也計劃在8月初發布GPT-4o的功能、限制和安全評估的詳細報告,除了改善ChatGPT的體驗模式,GPT-4o將更直覺化的讓消費者可以透過這項服務完成各種任務,同時增加其運作效率,會比GPT-4-turbo快上約2倍以上,但價格只需要原先的一半。

在發表會的直播中,官方也直接示範當提出問題時,可以「打斷」它的回答,同時將會有更多「情緒化」的回覆,甚至可以透過辨識使用者的語調,來產生不同的聲音。OpenAI指出,語音功能將支援45種語言,爲了保護個人隱私,訓練模板只會使用4種預設聲音說話。

OpenAI研究人員在視訊活動中展示,新功能讓使用者在與ChatGPT進行對話時,可以毫無延遲地獲得即時回答,甚至能在ChatGPT講話時打斷它,這兩項逼真對話的特點在聊天機器人上前所未見。

Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqNText and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx