等了300天,Sora正式發佈!網友測評:人物手部不自然、文字亂碼仍然存在,不如中國的可靈和海螺
12月10日凌晨,OpenAI的12天特別活動的第3天,備受外界期待的視頻生成工具Sora終於正式登場。
Sora的首次預告是在2月16日,當時OpenAI提供了數十個演示視頻,展示了一個令人驚歎的未來:任何人都可以通過在計算機程序中輸入簡單的文本提示來製作高質量的短片。
然而,在隨後的300天內,Sora始終停留在預告階段,未能面世。而在這期間,包括Meta、谷歌和亞馬遜在內的幾家大型科技公司都展示了自己的視頻生成模型,國內的可靈和海螺也在海外大放異彩,成爲外網一度討論最熱烈的視頻生成模型。
採用最新發布的Sora Turbo,用戶可以通過文字、圖像或其他視頻素材,生成長達20秒的視頻。目前,該工具已在美國和其他部分市場面向ChatGPT Plus和Pro用戶開放。
Sora官網上線後,用戶蜂擁而入,火爆的需求很快就導致網站崩潰,公司CEO山姆·奧爾特曼(Sam Altman)表示:“我們嚴重低估了Sora的需求,要讓每個人都能訪問還需要一段時間。”
而拿到訪問權限的用戶也在網上陸續分享Sora生成的視頻,不難看出,Sora還是有不少驚喜,但有用戶也反饋稱,Sora對物理規律的理解並不夠好,仍會出現人的手部不自然、文字亂碼、動物跑着跑着就飛起來等情況。
整整300天后,Sora正式發佈
12月10日凌晨,OpenAI正式發佈Sora Turbo。這距離該公司首次公開發布這一產品的預覽已經過去300天。
目前,http://sora.com網站已經上線,美國及其他市場的ChatGPT付費用戶可以通過該網站開始使用Sora,但在歐洲大部分地區和英國還需要一段時間才能使用。相比最初預告的Sora版本,Sora Turbo模型增加了文本生成視頻、動畫圖像和混合視頻等功能。
OpenAI表示,ChatGPT Plus訂閱用戶可以生成最多50個視頻,分辨率最高可達720p,時長爲5秒。而通過上週推出的“史上最貴”的、每月收費200美元的ChatGPT Pro服務,用戶最多可以生成500個視頻,可以同時生成5個視頻,時長爲20秒,分辨率最高爲1080p,並且,訂閱者可以下載沒有水印的視頻。
圖片來源:OpenAI
奧爾特曼與Sora團隊負責人比爾·皮布爾斯(Bill Peebles)、阿迪亞·拉梅什(Aditya Ramesh)進行了約20分鐘的直播對Sora進行介紹。在直播中,他們展示了Sora的新探索頁面,其中包含一些用戶製作的AI生成的視頻。
OpenAI重點介紹了一項名爲“故事板”的功能,該功能可讓用戶根據一系列提示生成視頻,以及將照片轉換爲視頻。OpenAI還演示了一個“混合”工具,可讓您使用文本提示調整Sora的輸出,還可以將兩個場景“混合”在一起生成一個新的場景。
圖片來源:X
對於Sora的發佈以及意料之外的視頻編輯功能,著名AI評論員Rowan Cheung評價道:“聖誕節提前來到了AI世界”。
圖片來源:X
針對之前一直被提及的安全問題,OpenAI表示,使用Sora生成的視頻將帶有可見的水印和C2PA元數據,以表明它們是使用AI製作的。在將圖像或視頻上傳到Sora之前,OpenAI會提示您勾選一項協議,該協議規定您上傳的內容不包含未成年人、露骨或暴力內容以及受版權保護的材料。OpenAI表示,“濫用媒體上傳”可能會導致帳戶被禁止或暫停。
Sora的產品負責人Rohan Sahai表示:“我們面臨着巨大的壓力,我們希望防止Sora的非法活動,但我們也希望在創造性表達與非法活動之間取得平衡。”
奧爾特曼在直播中表示,對於OpenAI而言,Sora不僅僅是一項技術,更是一種賦能創意人士的工具。在OpenAI的文化基因中,用AI激發人類創造力也很重要。通過Sora,OpenAI看到了AI和人類共同創造的全新協作模式。文本曾是人機交互主要形式,但他們堅信這遠遠不夠,視頻能夠傳遞更多的情感和細節。同時,Sora對於OpenAI而言,不僅僅是一個視頻生成工具,更是AGI(通用人工智能)之路的重要里程碑。
服務器被擠爆,Sora到底有多強
Sora官網上線後,不少用戶蜂擁而入,希望成爲第一批體驗該模型的幸運兒。結果,由於需求量太大,OpenAI不得不暫時關閉了Sora帳戶的創建功能。
奧爾特曼在X平臺上發文稱,“我們嚴重低估了Sora的需求,要讓每個人都能訪問還需要一段時間。正在試圖找出如何儘快做到這一點!”
圖片來源:X
OpenAI暫時沒有迴應在關閉之前到底有多少人成功創建賬戶,也沒有透露何時恢復創建賬戶功能,但獲得了訪問權限的用戶正在社交媒體上分享他們的作品。
有用戶完全模擬了一個玫瑰從花蕾綻放到盛開的延時視頻,看上去就和紀錄片裡的一模一樣。
圖片來源:X
還有網友模擬了80年代日本繁忙的街頭。
圖片來源:X
知名科技博主MKBHD也放出了一段模擬真實新聞的視頻。除了字幕有一點亂碼以外,其他和真實新聞場景看上去沒有什麼區別。
圖片來源:X
OpenAI員工Will Depue也放出了一段它模擬的生成的一段虛假的歷史視頻,真實和虛幻之間感覺已經快分不開了。
圖片來源:X
不過也有人反饋,Sora對物理規律的理解並不夠好,仍會出現人的手部不自然、文字亂碼、動物跑着跑着就飛起來等情況。比如,在上面僞造的歷史視頻中,如果仔細看其實會發現中間有一個騎兵是倒着騎馬的。
Sora VS競爭對手
還有網友將Sora和在之前在國外大火的海螺模型和Sora做比較,用相同的提示詞來生成一段末日機器人視頻。
圖片來源:X
Sora版本
海螺版本
更有人直接把海外最熱門的幾個生成模型(可靈,Sora,Runway,海螺)拉在一起比較,最後得出結論:從電影製作的角度來看,可靈的效果最實用;Sora的效果最好(但如果鏡頭不正確,一切都不正確);海螺在某些情況下很好,但感覺很弱且不一致;Runway在工作流程方面是最好的,但它並不可控的。AI視頻生成本身就是迭代的,因此與緩慢、漂亮但不正確的相比,快速和精簡是一個不錯的功能。
圖片來源:X
Sora版本
可靈版本
海螺版本
怪不得有網友評論道:“每個人都對OpenAI Sora感到興奮,但目前對我來說,最適合製作視頻還得是海螺和可靈”。
圖片來源:X
隨着Sora的面世,視頻生成大模型的賽道競爭無疑將會越來越激烈。上週,騰訊也發佈了參數量高達130億的元寶AI視頻生成模型,是當前最大的視頻開源模型。
圖片來源:騰訊元寶