從短視頻到AIGC,快手字節重開一局

作者 |辰紋

來源 |洞見新研社

從短視頻到剪輯工具,從電商到外賣,再到如今的AIGC大模型,快手和字節的競爭從來就沒有停止過。

通用大模型方面,快手有快意,字節有豆包;AI圖片創作快手有可圖,字節有星繪;視頻生成大模型,快手有可靈,字節用即夢相對,此外在AI音樂、剪輯工具、社交產品、特效製作等多個領域,快手和字節都有相應的AIGC產品形成競對。

製表:洞見新研社

短視頻的主航道上,快手和字節打了個半斤八兩,如今轉向到AIGC的未來之爭,兩方的一舉一動同樣頗具關注。

01 針鋒對麥芒

公開資料顯示,爲了跟上席捲全球的大模型行業潮流,字節跳動去年抽調了內部的高層管理和業務骨幹組建了新的AI部門Flow。

前TikTok產品技術負責人朱文佳任Flow的業務負責人、字節跳動產品和戰略副總裁朱駿任產品負責人,字節跳動技術副總裁洪定坤擔任技術負責人,三方協同合作推進AI進程。

基礎大模型方面,字節跳動去年8月上線了首個大語言模型“豆包”及多模態大模型BuboGPT。此外,字節跳動基礎模型在語言和圖像兩種模態上均進行了佈局,兩個團隊均向TikTok技術負責人朱文佳彙報。

AI應用層方面,Flow目前已推出三款AI產品,豆包、釦子和Cici。

其中,豆包爲一款類GPT應用,可以完成問答、文本生成、語言翻譯等多種任務,還可以根據用戶需求和上下文進行自適應問答,提供個性化服務。

釦子是一站式AI Bot開發平臺,無論用戶是否有編程基礎,都可以在釦子平臺上快速搭建基於AI模型的各類問答Bot,可完成解決簡單的問答,並處理複雜邏輯的對話。

爲了加強AI戰略,字節的其他部門也沒閒着,包括剪映、巨量引擎、抖音主端、抖音電商、飛書等部門,都在加碼各自的AI業務,成果陸續落地。

快手同樣是在去年年初啓動了新AI戰略。

2023年Q3財報會議上,快手CEO程一笑介紹,快手的語言大模型-快意130億和660億大模型已達到行業內同等規模領先水平,同時也已經開始超千億規模語言大模型以及多模態大模型的研發。

有媒體報道稱,快手AI主要由快手AI技術團隊(此前的快手Y-tech部門)負責。

具體的業務佈局則是建立了以快意大模型爲基礎的AI服務平臺,面向市場提供AI技術服務,產品服務涵蓋計算機視覺、計算機圖形學、自然語言處理、音頻技術、視頻技術、知識圖譜、機器學習、AR/VR/MR、多模態等核心技術領域。

今年2月,繼ChatGPT之後,OpenAI公佈的Sora AI視頻生成模型再度引爆全網。

然而從5月份開始,國內達到類Sora級別的AI視頻模型技術陸續公佈,快手也在6月6日推出AI視頻生成模型可靈,並進行邀測,由於可靈的生成效果直逼Sora,引發行業關注。

獵豹移動董事長傅盛在體驗過快手可靈後給與了高度評價,“甚至我覺得也吊打了Sora,我認爲這個產品今天,在我能使用的範疇內就是全世界第一的”。

02 心智爭奪戰

無論在AIGC中的投入有多少,產品的宣傳有多炫目,其最終的目的還是要讓這項產品用起來,特別要讓普通人用起來,因而從這一視角來看,大模型競爭的本質,是終端心智的爭奪。

在這方面,字節的豆包顯示出非常強的競爭力。

根據QuestMobile的統計數據,截至今年3月,豆包月活用戶已達到2328.2萬,排在豆包身後的文心一言、天工、訊飛星火、Kimi智能助手的月活用戶數分別爲1466.1萬、966.1萬、620.4萬、589.7萬。

而豆包官方數據顯示,其移動和桌面雙端月活躍用戶已經超過 2600 萬。同時,這些用戶還共同創造了800多萬個智能體。

基於豆包大模型,字節跳動還打造了AI應用開發平臺“釦子”,互動娛樂應用“貓箱”,AI分身創作應用“星繪”等一系列產品。

在字節跳動內部,抖音、番茄小說、飛書、巨量引擎等50多個業務接入到豆包大模型,用來提升效率和優化產品體驗。

由內及外,OPPO小布助手、榮耀MagicBook的YOYO助理、華碩筆記本電腦豆叮AI助手、極氪汽車的座艙大模型等均已接入字節的大模型服務。

可以注意到,從C端的APP用戶,到B端的千行百業,豆包不僅使用量大,應用場景也非常豐富。據悉,目前豆包日均處理文本1200億Tokens,生成 3000 萬張圖片。

不難看出,字節憑藉着原本業務的用戶基礎,採用了打造平臺型產品,圍繞平臺型產品建立其他關聯產品生態的策略,這一幕與字節早期“APP工廠“時代極爲相似。

快手的快意大模型具備與豆包相似的能力,只是快意目前更多應用在快手內部,主要爲短視頻、直播、廣告、電商等業務服務。

快手官方公佈的數據稱,半年來,有近2萬商家在快手平臺藉助大模型能力實現智能化經營,獲得不菲回報。相比今年1月,今年6月的AIGC月活躍客戶數增長了8倍,月GMV規模提升了64倍,平臺AIGC廣告收入規模提升了12倍。

快意之外,可靈是快手的另外一個心智爭奪殺手鐗。

其實不光是傅盛,很多科技博主、AI創作者們對可靈的表現也是大爲讚賞。

AI創作者娜娜在體驗過可靈後認爲,人物一致性是可靈的一大亮點,並且可靈更加擅長真實畫風,表現比較好的是美女、動物、吃東西等畫面的生成。

與另外兩個國外視頻生成軟件Runway和Luma進行對比,可靈在文生視頻之外,比Runway多了一個圖生視頻的功能,比Luma的生成結果更加穩定。

也正是因爲表現出色,引來了衆多用戶參與到可靈內測的申請之中,根據快手官方公佈的數據顯示,早在7月份時就已經有超過50萬的用戶申請可靈的內測資格,視頻生成數量達700萬。

不難看出,可靈的產品在技術上有突破,快手在視頻生成賽道的佈局也是極具策略的,用獵豹傅盛的話來說,“可靈的成功,更加證明了,Sora並不是一項技術性突破,而是產品型圖片”。

03 決勝點在商業化

大模型的業務佈局,快手和字節各有側重,然而大模型的競爭最終的落腳點還是在商業化上,不光要用戶愛用,還要用戶願意花錢來用。

在這方面,快手和字節也呈現出不同的思考方向。

我們先來看字節對豆包的定位,從產品形態來看,豆包是一個綜合性的AI智能體平臺,這也就意味着字節對豆包有着更大的野心,即不光光是爲原有業務賦能,更希望豆包能夠成爲一個新的營收增長點。

因而在應用設計上,字節着重解決了豆包的“擬人化”“離用戶更近”和“個性化”的問題,爲了讓更多的人體驗到豆包,除了基礎的免費服務之外,字節還着手大幅降低豆包的收費標準。

根據字節官方公佈的數據,豆包主力模型 Pro-32k 版本模型推理輸入價格爲0.0008元/千Tokens,0.8釐就能處理 1500 多個漢字,比行業同等模型便宜99.3%;128k型號價格爲0.005元/千Tokens,比行業價格低95.8%。

豆包的價格之所以定的這麼低,字節認爲有兩點,一是需要做到這麼低,另一個是自己能夠做到這麼低。

前者很好理解,只有足夠低的價格,纔會降低企業用戶的試錯成本,增強企業用戶的信心,嘗試大模型。

後者則是出於對行業趨勢和自身能力的一種判斷。

零一萬物CEO李開復曾表示,大模型推理成本每年降低十倍,這在過去兩年已經發生,優化得好更是可以降低二三十倍。

字節則通過模型結構優化、分佈式推理、混合調度等舉措,極大壓低了大模型的推理成本,模型的調用量越大,成本的優化空間也就越大。

價格是豆包的留給行業最醒目的標籤,更重要的是,通過一系列操作,字節打了一個樣,爲行業創作了一個大模型商業運營的範式。

相比之下,快手AIGC業務的商業化進程就要慢一些,如上文所述,快意更多爲快手的自身業務賦能,可靈的想象空間雖大,但快手目前對可靈無明確的商業計劃,也不對外提供API。

快手視覺生成與互動中心負責人萬鵬飛在一次演講中,談到可靈的未來時曾提到,“視頻創作的門檻和效果的ROI大幅度提升,視頻創作者和消費者界限逐漸模糊。越來越多消費者變成創作者,對於視頻創作生態的繁榮是非常有價值的。”

由此可見,不斷強化自己的短視頻生態,將長板持續做長也未嘗不是一個較好的商業化路徑,通過內部驗證之後的技術產品輸出,其能量往往更大。

04 結語

創新工場聯合創始人汪華曾做過一個統計,雖然最近大家看到很多產品在大量推廣,用戶量也在迅速增長,但是把所有應用加在一起,日活也不過就是1000萬,中國有12億網民;而美國3億人口就有大幾千萬的日活,相比之下還有很大的差距。

李彥宏也呼籲行業不要卷模型,要去卷應用,沒有應用,光有一個基礎模型,不管是開源還是閉源都一文不值。

這也是說,雖然AI未來已來,但是大模型的產品化還遠遠沒有到來,用AI賺錢的時代纔剛剛開始。

投身於時代潮流之中,快手有機會,字節有機會,你和我也有機會。