2024 AI 應用海外“淘金”,GMI Cloud King:AI Infra穩定性挑戰巨大

北京時間12月21日凌晨2點半,OpenAI 12天12場直播正式結束,從工具發佈到產品升級再到新一代推理模型o3的推出。其間,谷歌發佈Gemini 2.0,並推出多個AI Agent成果。雙方產品各項性能大幅提升,逐漸打破AI發展陷入瓶頸的質疑。

反觀國內,過去一年快速“卷”起來的百模大戰讓“降價潮”隨之而來,今年9月OpenAI的o1模型發佈後,技術平權的信號讓不少創業者,從拼技術向卷應用無縫銜接。

做一款面向全球的產品,幾乎成爲AI創業者共同的夢想。今年下半年開始,投資人也開始密集出手AI應用,“真實情況可能比表面看上去激烈。”AI投資人Jack表示他已知的至少還有5家未對外披露。

“儘快、儘早出海”這是和多名AI應用者談到商業化策略時,繞不開的話題。

出海正在成爲必選項

曾經基本每個月都有的AI、大模型融資消息,到今年近半年似乎成了“稀罕”事。

紅杉資本在《AI in 2025:Buiding Blocks Firmly in Place》一文中提到,2025年AI生態系統將發生重大轉變,從2023、2024的狂熱開始進入更有結構的格局,更強調提供實際價值和合理的投資回報。

目前,業內普遍認爲高額融資不會再頻繁出現、“燒錢”的基礎大模型加大新投入的可能性變小、商業化進程加速、AI應用百花齊放的趨勢有了前兆。據媒體報道,高瓴資本、經緯創投、百度風投、英諾等知名投資機構在下半年紛紛加大投資力度,瞄準AI應用領域的早期項目。

但有意思的是,這些AI應用幾乎都有一個共性——所屬企業對出海有非常具體的規劃,甚至部分應用在海外市場已經驗證了其商業化能力。比如今年年中零一萬物CEO李開復曾透露,零一萬物海外生產力應用營收預期超1億元,另有消息稱在海外推出的AI社交產品Talkie是MiniMax的主要收入來源。

據非凡產研統計,在全球約1500家活躍AI企業中,中國出海企業已達103家,絕大多數AI產品創業公司集中在應用層,佔比高達76%。

這一現象在GMI Cloud 亞太區總裁 King Cui的眼裡是大勢所趨,並認爲出海是一個必選項。“一些傳統互聯網廣告平臺的公告收入開始進入負增長,流量逐步縮減,不做global定位的話,很難獲得高增長。”King覺得AI時代出海是一個確定性趨勢,但是出海過程中要找準自己定位,做好PMF(Product Market Fit,即產品和市場達到最佳的契合點)。

近期,GMI CLoud宣佈完成了8200萬美元(約6億元人民幣)的A輪融資,其主要爲AI應用出海企業提供GPU資源的AI Native Cloud服務商。據悉,GMI CLoud擁有遍佈全球的數據中心網絡,可以爲全球新創公司、研究機構和大型企業提供穩定安全、高效經濟的AI雲服務解決方案。

而在剛剛經歷了融資過程的King看來,“融資難易在不同週期的整個估值體系和融資環境不一樣,沒有辦法把當前的融資困難程度和前些年相比。”

他回顧四年前加入某大廠時資本環境還是比較寬鬆的,整個二級市場的流動性也非常好,甚至有頭部互聯網公司希望拿一些資金把市場上的創業公司都投一遍,無差別全覆蓋,所以整個一級市場的投融資比較積極,被投企業的估值也會相對更高。

“但是這兩年多重因素的影響,市場流動性沒那麼寬鬆、投資估值也相對謹慎一些,無論機構還是投資人,對商業模式和經濟前景要求變得更高一些,所以出現了所謂的融資越來越難的情況。”當下,他認爲創業公司要能幫助企業和社會創造價值,並能把商業模式想得比較清楚,讓未來投資回報率更明顯,依然可以拿到更多一些融資。

AI企業出海後依舊面臨算力挑戰

ChatGPT之後,行業內反覆提到的一個問題是:下一個“殺手級”應用何時出現?縱觀整個行業,從AI驅動的助手到特定行業的專業工具,都在被探索,出海的AI應用同樣是五花八門,目前主要受歡迎的則集中在圖片、視頻生成和編輯,情感陪伴,效率工具等。

但是,根據非凡產研發布的2024年11月出海AI WEB月活榜及月活增速榜顯示,出海AI WEB流量榜top 100中,超50款產品11月訪問量環比下降。顯然,要在海外站穩腳跟,並非易事。

AI 應用出海,除了適應本土化產品需求,技術本身至關重要,King表示AI應用出海繞不開AI三駕馬車——數據、算法、算力。在數據層面,要解決好數據傳輸合規性問題;在算法層面則需要一些比較優秀的人才;在算力層面需要比較穩定安全高效的GPU集羣。

就比如,科技巨頭Meta前段時間發佈的一個報告顯示,Meta用了超過16000張的H100 GPU,訓練Llama3 405B大模型,耗時54天出現了466次中斷故障。其中有419次是計劃外的,而跟GPU相關得高達58.7%,超200次,CPU相關故障則只有2次。

“可見GPU集羣穩定性的挑戰是CPU的兩個數量級,然而一般AI出海的企業不太具備大規模GPU集羣運維的能力。”據King透露,目前GMI Cloud的研發人員中70%是產品和研發相關,核心研發骨幹由兩個背景構成,一是在智算領域有Infra背景,二是在谷歌等企業有深度學習背景的,前者致力於解決GPU集羣在Infra層面的穩定性和突發問題,後者滿足客戶算法調優的需求。

“目前我們可以實現K8s的99%的SLA,給AI出海企業提供一個非常穩定、高效的GPU集羣,減少企業在這方面的投入,他們可以更加聚焦在整個業務的發展。”

那如何去實現較高SLA的可能性?King介紹道,Cluster Engine是GMI自主研發的平臺,整合了對GPU 芯片、 GPU集羣節點、存儲以及高效網絡的控制。“通過這個平臺把GPU集羣管理起來後,會以虛擬機或K8s容器的方式進行交付,再把每一張卡的運行狀態監控起來,一旦發現某一張卡異常之後,會第一時間把任務重新調度到另外一個容器裡,或者另外一張卡去運行。”

在存儲方面,King表示GMI Cloud會根據客戶的不同數據應用場景提供合適的存儲解決方案。網絡層面則提供高速的IB網絡,另外IB本身也做了一些虛擬化的技術,一方面增加IB網絡負載,另一方面通過虛擬化的技術,屏蔽不同的訓練任務對於整個網絡通路的佔用,從而確保資源的隔離。“在計算、存儲、網絡三個層面通過軟件技術保障高SLA。”

另外在2024年9月12日OpenAI宣佈推理模型o1正式發佈後,業內基本形成推理需求即將爆發的共識。據King透露從10月他們就着手研發一款名爲Inference Engine的產品,一款針對推理場景的雲平臺服務,預計1.0版在2個月內上線。

創企與“大廠”呈補位關係

很顯然,目前AI應用企業大規模走向海外,數據、算力等挑戰依然存在。作爲支撐大模型運行以及生成式AI應用開發的關鍵,AI Infra的價值潛力被進一步釋放。

中金公司指出,目前AI Infra產業處於高速增長的發展早期,未來3-5年內各細分賽道有望保持超過30%的高速增長。另據紅杉資本、貝恩等機構統計,預計到2027年,全球AI市場規模將飆升至近1萬億美元,AI硬件和服務市場年增長率達40%-55%。

值得注意的是,AI Infra不僅包括硬件、軟件和網絡等基礎架構,還涵蓋了數據管理、模型訓練、推理服務等多個層面。在創業公司裡,有的專注做數據標註、數據質量或模型架構,有的則做GPU的“貿易商”。根據King的觀察,目前具備AI Native Cloud,同時擁有硬件供應鏈優勢和軟件平臺雙重能力的新創公司還不多。

而AWS、GCP、Azure這些雲計算巨頭廠商,無疑是有這些能力的。因此關於初創AI Infra會不會和雲廠商產生正面衝突,是一直被圈內人好奇的關注點之一。King認爲時代不斷在發展,進而有新的需求產生,另外也有可能當下的需求在大廠那得不到了很好地滿足,所以纔有了創業公司的機會。

“我認爲是一種補位的關係,共同去解決社會和客戶的需求。”相較於大廠和其他創企,King總結了三點GMI Cloud的差異化優勢:一是安全的供應鏈、二是高性價比、三是產品能力,“這三個能力離不開GMI CLoud的融資能力、GPU ODM廠商直供的穩定供應鏈以及GMI Cloud頂尖研發團隊的技術能力。”

早期談啓動AI創業時,有一種說法是要走出大廠的“射程”,現在談創業公司結局,有一種說法則是最好的是被大廠併購。

對於被收購這件事,King認爲是一部分創業公司最終的歸宿,他個人覺得,“挺好的,一方面對於初創公司的投資人,有了退出的機制,對於創業公司來講,它有了更多的資源,可以把整個集團公司的成本和方案把握得更好。”

另一方面對於大廠來講,“原本在這個領域裡面可能自身有一定的短板,通過投資併購的一些創業公司,補齊了自身在這個領域的短板,或者說和原本主營業務有了更好的協同。對於社會和客戶來講,也可以減少一些更多的資源的浪費。”

但是他也說道,是不是最好的結果要按不同的個體、不同的場景來判斷。“可能對一些公司來講,它被大廠收購就是一個最好的結果,但對於有些公司來講,其實自己能夠做大就是好的結果。”

“AI一天,人間一年”坊間常以此來形容發展速度之快,從而市場需求也在隨之變化。但正如百度創始人李彥宏所說,大公司反應都是很慢的,而創業公司所具有的創新優勢正好和大廠相輔相成,共同推動行業進步。

過去一年多,AI Infra已成熱門賽道,國內外大廠都在發力AI Infra技術產品,如阿里雲的磐久Al Infra 2.0服務器、百度智能雲的百舸AI異構計算平臺,與此同時,專注於解決某一垂直問題的AI Infra初創公司也擁有了比較廣闊的市場,譬如GMI Cloud爲AI出海企業提供高穩定的GPU雲解決方案。

萬億市場中,創業公司和大廠都在以探索之勢尋找適合自己的發展路徑,以期在這場技術革命中佔據一席之地。伴隨着技術的不斷成熟和市場的加速擴展,AI Infra的重要性也不言而喻。