追趕Sora難在算力 或再現“百模大戰”
2024開年,OpenAI就給了科技圈一個驚喜——文生視頻大模型Sora於2月16日“橫空出世”,它能直接以文生圖,並將圖片轉爲生動逼真的動態視頻。作爲科技圈“大佬”,360集團創始人周鴻禕多次針對該大模型發表看法。
日前,在接受南都記者採訪時,周鴻禕表示,Sora最令人震撼的是製作出了逼真的、符合人們認知常識的內容,這意味着它能深入學習和了解這個世界很多元素之間的互動關係。他推測,此後國內也會有多家企業推出類似文生視頻工具,很可能再次出現“百模大戰”的情形。
發展垂直化企業化大模型能更好滿足企業需求
南都:今年兩會,你帶來了一份關於深化人工智能多場景應用,支持大模型向垂直化、產業化方向發展的提案。2024年被認爲是大模型應用場景元年,我國大模型發展之路該走向何方?
周鴻禕:現在企業對AI普遍都很嚮往,但是不知道從何切入,尤其非IT企業對AI還是比較陌生。中國在通用大模型核心技術上趕超美國還需要時間,但在大模型應用方面,中國完全可以走出一條具有中國特色的大模型發展之路。
我在今年的提案中提到,通用大模型在企業級場景中無法直接應用,發展垂直化和企業化的大模型可以更好地滿足企業的個性化需求,提高生產效率和服務質量,促進產業升級。
南都:具體應該怎麼做?
周鴻禕:我認爲應該分三步走。一是場景。大模型在垂直領域大有可爲,建議政府、央國企率先提供更多應用場景,聚焦“小切口,大縱深”,推動大模型垂直化、產業化落地。企業用大模型不能冒進,而是要用AI逐步改造業務,循序漸進,積小勝爲大勝。在實踐中要拆分場景具體分析,在業務流程上找準切入點,選擇與大模型成熟能力匹配的業務環節切入。切入點雖小,但縱深推進,對業務影響很大,改造收效更大。
二是知識。企業在做AI之前,要先解決好基礎設施問題,其中最重要的就是在定製AI前,做好知識管理,將企業大數據平臺升級爲企業知識平臺。大模型的數據、知識只是人類知識的冰山一角,企業還有大量的“暗知識”,如戰略規劃、產品設計圖等企業具有的獨特知識,只存在於特定企業中,在互聯網上難以找到。建議鼓勵企業構建知識平臺,將“暗知識”彙總起來,打造企業專屬知識庫,做好管理。在此基礎上,通過垂直訓練,深入企業級場景,滿足企業需求。
三是業務融合。建議鼓勵和引導企業將大模型與數字化業務系統深度結合,同業務流程相結合,充分發揮大模型價值。大模型像發動機,不是用來秀的,而是要與業務相結合,特別是傳統制造業,大模型是推動數轉智改的利器。
人不會被AI淘汰,但可能被用AI的人淘汰
南都:Sora對行業的影響會有多大?是否還會出現類似於之前“百模大戰”的競爭格局?
周鴻禕:Sora的技術原理現在國外討論的也非常多,最近stable diffusion發佈了一個類似架構開源的東西。我經常講,人家一開源,我們的科技就進步。國內AI可能在原始創新、從“0”到“1”這方面表現得弱一點,不過一旦OpenAI宣佈了這個技術方向,宣佈了相關產品,國內的學習就會很快跟上。所以,肯定會有很多家推出類似的文生視頻工具,我認爲會出現“百模大戰”這種情況。
南都:Sora的出現進一步引發了人們對AI“取代論”的擔憂,你怎麼看?
周鴻禕:對這個問題,我有兩個觀點想要分享。一是AI科普目前在中國變得非常關鍵,發現大家談論AI同時也有恐懼,比如擔憂AI會導致大規模失業、帶來行業崩潰等。
在我看來,AI是有史以來發明的人類最好的朋友,也是最好的工具,它可以幫助人們“解鎖”畫畫、拍視頻等更多技能。特別是對年輕人而言,這項技術能讓他們從一個資淺的人,很快和有經驗的人站在同一個起跑線上。
進一步來講,我一直認爲AI並不會導致某些行業的顛覆或崩潰,反而會給短視頻行業、影視工業、廣告業等帶來正向的推動,只有那些不用AI的人才會被用AI的人淘汰。AI科普能幫助大家知道怎麼去更好地擁抱AI,進而避免AI恐懼論或者AI萬能論,這兩者都是偏頗的。
南都:國內大模型企業如何才能追趕Sora?有哪些難點?
周鴻禕:在追趕Sora方面,算力可能會是一個難點。網上有人指出Sora的參數規模不大,約爲30億,這是錯誤的理解。事實上,視頻參數和文本參數是不能簡單做對比的,比如文本有10萬字,視頻只有640×480,但二者所佔存儲量完全不在一個數量級,Sora參數規模很可能超過30億。退一步講,就算Sora參數規模是30億,其對算力的消耗應該也遠遠超過一個千億模型。
Sora爲什麼只能做一分鐘的視頻?我猜測,因爲它與四秒、六秒時長的視頻存在本質差別。四秒、六秒時長的視頻可以全部通過像素生成,無需掌握更多知識。而Sora能生成時長一分鐘的視頻,就意味着它還能做時長十分鐘甚至六十分鐘的視頻,而現在不做的原因是算力和成本的限制。
對於國內而言,同樣的困擾也在發生。如何才能將算力集中起來值得重視,這也是我反覆強調AI科普重要性的原因。Sora不僅僅是一款文生視頻工具,Sora實際上預示着AGI的一個關鍵節點,所以我覺得這件事對國家而言很重要。
大模型紅利期尚未到,至少持續十年以上
南都:2024年,中國在AI發展領域有哪些獨特優勢值得拓展?你如何看待今年AI的發展方向和前景?
周鴻禕:我認爲中國的AI發展是有優勢的,儘管原創技術方面,面對美國我們處於落後狀態,但這種落後不像光刻機和芯片的差距那麼大。一旦方向確定了,以國內公司的學習和模仿能力,很快就能追趕上去。目前的差距大概用一到兩年時間是可以解決的。
2024年,中國在AI領域的發展主線可能有兩條,一是做Sora和GPT4這類超級通用大模型,另一條是推進大模型的應用落地。目前來看,大家對GPT用途的感受主要是寫詩、解奧數題、聊天等,離運用在工作學習中還太遠。
此外,2024年大模型在企業方面的垂直領域也是大有可爲的。大模型會真正產生一場工業革命,它一定要進入到百行千業,與很多企業的業務流程或產品功能相結合。我很贊同不需要做千億、萬億的垂直模型,只要做百億的模型就足夠的觀點,這樣很多企業也能負擔相應的成本。
南都:大模型的紅利期到來了嗎?能持續多久?
周鴻禕:我認爲大模型的紅利期還沒開始。現在唯一能賺到錢的就是英偉達,國外最掙錢的也是英偉達,此外微軟、OpenAI都沒掙到錢,所以還沒有進入紅利期。我預計亞馬遜能掙錢,雲廠商和硬件廠商今後也能率先掙錢。這是一場工業革命級別的革命,大模型的紅利期至少有十年以上。
採寫/攝影:南都記者 樊文揚 王子黎 楊博雯