MiniMax公佈首個AI高清視頻生成模型,閆俊傑:做技術其實是一件很“奢侈”的事|鈦媒體AGI
MiniMax公司創始人、CEO閆俊傑
繼Sora、Runway之後,國內又一款AI視頻生成模型來了!
鈦媒體App獲悉,8月31日舉行的首屆MiniMax Link夥伴日上,MiniMax創始人、CEO閆俊傑發佈MiniMax首款 AI 高清視頻生成模型技術:abab-video-1。
據悉,用戶目前可以在海螺 AI 官網免費體驗生成包含文字的視頻,最高支持原生1280*720的25fps,擁有電影感鏡頭移動,被稱爲是AI視頻界Ideogram。目前AI視頻時長最高6秒,未來或支持10秒,整個視頻效果不亞於Sora、Runway等。
鈦媒體AGI做了相關測試。比如下面這段視頻,體現的是一座山上的一塊石頭破碎,從裡面蹦出一個“馬斯克”。
再比如下面生成對比Sora演示場景,一位時尚女性走在東京的街道上,街道上到處都是溫暖的霓虹燈和動畫城市標識。她穿着黑色皮夾克、紅色長裙和黑色靴子,手拿黑色手提包。她戴着太陽鏡,塗着紅色口紅。她自信而隨意地走着。街道潮溼而反光,五顏六色的燈光營造出鏡面效果。許多行人走來走去。
雖然背景和顏色有所區別,但相比Sora,MiniMax AI 視頻生成的效果也非常真實和生動。
閆俊傑在演講中透露,截至目前,MiniMax每天可以給全球用戶提供超30億次交互,每天處理超3萬億Token(行業內最高)——等價於一天看完7000本書、或2000萬張圖片、或7萬小時的語音。同時,當前MiniMax單日總交互時長與ChatGPT的百分比爲53%,差距在不斷減小。
會後,針對與大廠之間的競爭,閆俊傑對鈦媒體App等表示,這本質上是一件好事,比如電動車、手機、移動互聯網都經過了長期激烈的競爭,最終使得中國產品需求特別強,它既可以產生很大的社會價值,而且確實應該有很多競爭,這是一個客觀規律。MiniMax需要做好亮點,第一點的話技術如何提升,第二是如何跟用戶做更好的共創。
“我們作爲一家小的創業公司來說,其實就是說如果比如說我們在競爭中打不贏,我們就應該被淘汰,其實我們也沒有其他的選擇。”閆俊傑表示,現在公司規模還很小,還需要足夠長的時間發展,希望外界能夠給予更多耐心。
閆俊傑強調,技術研發其實是一件很“奢侈”的事情,這件事甚至只有創業的時候纔會理解。因爲技術可能會失敗,技術具有不可預測性,而且技術研發投入很大。然而,AGI本身很難走“捷徑”,而且一旦技術被突破之後,就能非常顯著感受到用戶、客戶對你的認可。因此,企業的正向發展依然需要持續技術投入和進步。
實際上,在閆俊傑看來,算法一樣的情況下,擁有更多的數據訓練就意味着更好的模型效果。因此,在兩個性能類似的模型中,更快的模型一定是更容易受益到數據的增長,從而能夠有一個更好的模型能力。這就是在同樣的能力範圍下,“快就是好”。
閆俊傑在與鈦媒體App等對話中進一步解釋稱,不管是做MoE還是其他有價值的技術探索,本質上,公司技術研發還是希望讓同樣的效果模型變得更快。快就是好,意味着同樣的算力可以變得更好,這個是其做底層研發的思路。
未來,如何讓企業持續發展是公司的重要核心之一。閆俊傑指出,行業需要持續解決AI模型三個挑戰:錯誤率持續降低、無限長輸和輸出、多模態。
閆俊傑認爲,MiniMax產品並非僅技術新品,它的底層設計也不是陪伴用戶聊天。實際上,MiniMax希望構建的是一個“內容社區”,裡面可以補充一些角色。
“包括現在我們提供了更多樣的工具中可以在裡面創建故事、創作世界觀,來進行互動,它其實類似於小說、賬戶體驗,它的核心其實是一個內容社區,而不是說它的核心是說每個人來聊天,這是不一樣的。”閆俊傑對鈦媒體App表示。
談及最新視頻生成的技術優勢和落地,閆俊傑坦言,相比可靈,MiniMax視頻技術推出的確實要晚一、兩個月,核心在於團隊在解決“如何能夠原生算法訓練成本比較高的東西“這個技術問題,因爲視頻Token越長,複雜度越高,而MiniMax希望通過研發新的算法把複雜度降低,壓縮率變高,將最終算法效果提升數倍。
“今天只是我們第一個版本,我們應該還會更新,策略是可能會先在每一兩週出現新的東西、更加滿意狀態後,再考慮一些商業化,包括開放平臺、廣告變現等方式。但目前這個階段,最重要的可能還不是產業化,而是真正實現對技術能夠達到廣泛可用的程度。”閆俊傑表示,後續會在數據、算法本身進行更新迭代,比如現在只提供了文生視頻,未來或將提供圖生視頻、文+圖生成視頻、可編輯、可控性增強等。
關於To B領域,閆俊傑在演講中透露,截至目前,MiniMax開放平臺已經擁有超過3萬名開發者,且仍在持續、快速增⻓。
談及大模型“價格”競爭,閆俊傑指出,當國內大模型“價格戰”發生後,大部分公司本認爲大模型很貴,之後很多人認爲大模型很便宜,可以放心地使用。最終非常驚人地發現,有許多傳統企業非常願意使用大模型,他們覺得反正成本低,出錯了之後也不要緊,多調用一次就好了。客觀地來說,這極大提高了模型調用量,從而推動模型做的更好,至少目前在非英語語種上,國內大模型水平已與GPT不相上下。因此,樂觀角度看,國內大模型的使用量確實在顯著地增長,並且中國 AI 大模型在海外確實越來越具有競爭力。
“競爭不可避免,既然不能避免,就要努力做到最好。”閆俊傑稱。“在同等計算GPU條件下,儘可能訓練更多的輪次、更大數據,做一些科研上的比較有挑戰的事,做別人沒有做過的事情。經過幾次科研的突破,其實能以比較有限的資源,做出一個在國際上第一梯隊多模態的表現,這個我們目前還是比較驕傲的。”
閆俊傑強調,“(行業)真正需要的是,一家至少像我們這樣的創業公司,真正應該花錢做的研發,是那種能夠帶來幾倍變化的技術。這種東西很多時候如果我們自己不做,外面也沒有,用戶需求多、技術還非常重要,我認爲這纔是比較核心的。不管是現在,還是再往後看,我們在什麼樣的技術方向上最願意花錢,核心的判斷是,我們認爲這個方向做出來能不能帶來幾倍的變化,如果能的話,不管多難都要做出來。如果不滿足這個標準,不管多簡單我們都不應該做。”
關於國內外 AI 商業化的異同話題,MiniMax國際業務總經理盛靜遠對鈦媒體App表示,不同行業有其底層規律,To B行業需要有規模的商業化。在國內,To B 業務多成項目制,大模型純技術輸出定製的商業模式難以持續實現ROI,因此需要思考把偏工具類AI產品形成有用戶粘性並且增強技術能力與產品特色。海外市場則有所不同,MiniMax產品能力處於國際第一梯隊,所以只需將其產品不斷打磨,通過API、訂閱等模式在海外用戶付費習慣好的情況下進行推廣,海外市場打法相對直接,變現也更快。而MiniMax現在技術已處於領先,更多是公司經歷、資源和變現問題。
“ROI是會有轉起來的一天,但不是今天的商業形態。”盛靜遠稱,MiniMax還是希望在有限的資源內,做到核心技術不斷突破,從而讓產品最終實現商業化,來反哺後續技術投入——這纔是公司發展成功、實現正向循環的標誌。
談及與大公司(投資方)在市場競爭中的關係,閆俊傑指出,投資者是一個組織,一個組織意味着大部分時候沒有一個統一的觀點。目前,MiniMax還是一家很小規模的公司,相比大互聯網公司非常成熟的業務來說,佔比都是非常小的,甚至可以說不值一提。
閆俊傑強調,對於MiniMax來說,核心還是把自身技術能力做到更好。
“MiniMax作爲一家有理想主義且腳踏實地的公司,今天的核心產品和技術進展還是遠遠不夠的,我們仍然在努⼒前⾏。但我們很幸運的是,有在座的合作伙伴以及全球各地⽇益增⻓的⽤戶們的支持,未來和MiniMax⼀起攜⼿努⼒,把⼈類的智能邊界再向外推動⼀點,真正實現 Intelligence with Everyone(與每個人共創智能)。”閆俊傑在演講結尾表示。
(本文首發於鈦媒體App,作者|林志佳,編輯|胡潤峰)