解析商湯2024中期財報:被忽略的端側AI 2B商業化,已服務多家知名手機和汽車品牌

本文來源:時代週報 作者:雨辰

近日,商湯(0020.HK)披露了2024年上半年業績。報告期內,商湯實現營收17.4億元人民幣,同比增長21%,較去年同期,虧損減少21%。從三大業務來看,2024年上半年,商湯生成式AI業務實現收入近11億元,同比增長256%,佔集團總收入的60%,成爲商湯的主導性業務。“絕影”智能汽車業務收入爲人民幣1.7億元,同比增長100%;傳統AI業務再次主動收縮壓縮至集團整體收入佔比至10%。

“三大業務的變化體現了我們發展策略的調整。”商湯集團董事長兼CEO徐立表示,生成式AI迎來黃金髮展時期,商湯全面向生成式AI轉型升級的戰略目標已階段性達成。

2023年被譽爲“大模型元年”,而隨着2024年的到來,大模型如何“落地”已成爲推動整個產業鏈轉型的關鍵。當下,各行各業均在加速探索如何利用大模型賦能自身產業發展。而面對這一趨勢,作爲全球領先的人工智能軟件企業,商湯科技早年間佈局現階段開始收穫商業化果實,保持了以互聯網企業客戶的領先優勢,並站穩了機器人、新電動汽車、醫療、金融等新興行業。

財報背後,我們發現商湯在端側的成績,斐然。

大模型廠商搶奪 “端側”藍海,商湯守擂優勢凸顯

作爲搶佔未來流量入口的關鍵,端側AI儼然成爲各大廠商爭奪焦點。而端側設備,以智能手機和智能汽車爲代表,已經成爲AI技術的重要應用陣地。

《2024年中國端側大模型行業研究》報告指出,生成式AI市場的蓬勃興起,正驅使大模型廠商積極探索端側應用的新藍海,以此作爲增長的新引擎。端側大模型通過在設備本地運行,有效降低了數據傳輸延遲,增強了隱私保護,拓寬了AI應用場景的廣度與深度。

“與此同時,下游市場需求的強勁增長,特別是手機與自動駕駛行業的蓬勃發展,正強力拉動端側大模型市場的擴張,2023年中國端側大模型市場規模達 8億元,預計2024年中國端側大模型市場將達到21億元。 ”上述報告表示。

近年來手機廠商們紛紛推出主打AI功能的手機,旨在通過AI拍照、智能交互、個性化推薦等功能提升用戶體驗。而汽車廠商則更加關注自動駕駛技術的實現,以及如何通過AI技術提升駕駛安全性、舒適性和智能化水平。通過商湯今年來財報發現,商湯分別在手機、汽車兩項核心端側領域,已形成穩固壁壘,處於守擂成功有利位置。

商湯在端側AI積累了大量商業市場經驗,並具備紮實的AI 2B能力。回溯發展歷史我們發現,商湯一直在端側“自卷”。早在2015年起商湯已和幾乎所有全球主流安卓手機廠商,車企和APP廠商合作,是中國最早佈局端側的AI企業之一。商湯針對不同端側設備的特點,持續進行端側模型系列擴充,如7B、1.8B,並追求終端小模型性能與大模型媲美,推動邊端運行——這是目前行業中鮮少完成在端側商業落地應用完整佈局的AI企業。

爲何如此下重投入在端側?“大模型的主要應用場景將集中在端側”,這是商湯早於2023年的回答。2024上半年財報數據顯示,報告期內,商湯“日日新”整體調用量實現了400%的增長,客戶數和客戶平均調用規模均大幅增長。

在汽車端,智慧汽車業務“絕影”依然保持穩健快速增長速度。2024年上半年財報顯示,該業務實現了1.68億元的收入,同比增長100%,累 計 交 付 車 輛 數 達 到 260 萬 輛、覆 蓋 104 個 車 型。上 半 年 新 增 定 點 車 型 15 個,新 增 定 點 車 輛 數 約 600 萬 輛,其 中 包 括 福 士 華 根、凌 志 等 海 外 品 牌 的 定 點。此 外,絕 影 還 參 與 到 多 家 中 國 車 企 的 出 海 項 目 中,絕 影 的 全 球 影 響 力 日 益 凸 顯。整體汽車端側覆蓋量依舊處於高速增長態勢。

在前不久召開的WAIC 2024商湯人工智能論壇上,商湯“絕影”宣佈在行業率先實現原生多模態大模型的車端部署,並現場演示了搭載在200 TOPS+平臺上的8B模型(即80億參數)車端部署方案。這一成果展示了商湯在多模態感知和交互能力上的強大實力,也爲智能汽車的發展提供了新的可能性。相較於傳統的雲上部署方案,商湯“絕影”的車載端側8B多模態模型在延遲和推理速度上均表現出色,能夠滿足智能汽車對於實時性和準確性的高要求。

在手機端,商湯的端側小模型已經服務了小米、榮耀等主流安卓手機廠商客戶。其推出的端側小模型“日日新5.5lite”在推理速度和模型性能方面保持領先,其推理速度可達到每秒100字,延遲降至僅幾十毫秒。與此同時,通過端雲協同的推理架構,推理成本得以顯著降低。據瞭解,接入商湯“日日新•商量”端側大模型後,單臺設備的成本可降至9.9元/年。

徐立指出,藉助端雲協同的新推理架構,成本降低也有助於大模型覆蓋到更多IoT設備,不僅是高端手機,還可以應用於中端、低端手機,電視、音箱等設備,實現智能交互功能。

端側兩大技術根基——多模態能力、推理能力

值得注意的是,在AI的競技場上,商湯科技之所以能在生成式人工智能的初期爆發階段佔據領先地位,這與其在端側——“多模態能力”和“推理能力”的技術優勢密不可分。

與文字輸入相比,語音和視頻等多模態輸入方式提供了一種更爲自然的交互體驗。2024年7月,商湯推出了“日日新”大模型的5.5版本。相較於5.0版本,其綜合能力提升了大約30%,並且在多模態能力方面得到了全面增強,可對標GPT-4o的實時交互體驗,成爲中國第一個多模態的實時交互大模型。

在過去,衆多模型在處理不同模態信息時,通常會先將語音等輸入轉換爲文字,然後將文字與圖像結合起來進行分析。輸出反饋的過程也是先生成文字,再根據這些文字生成語音輸出,這一過程中伴隨着大量信息的丟失和較高的延遲。

相比之下,多模態大模型能夠高效且深入地融合語音、文字、圖像、手勢、視頻等多種模態信息,從而提供更爲豐富和自然的人機交互體驗。與此同時,相較於以往的方案,多模態融合技術的難度也實現了幾何級數的增長。

今年4月,商湯科技在上海發佈行業領先的“雲、端、邊”全棧大模型產品矩陣,並與小米、閱文、華爲等多位生態夥伴共同探討和交流大模型在辦公、金融、出行等不同領域的應用及前景,加速生成式AI向產業落地的全面躍遷。在兩個月後的WAIC 2024期間,商湯科技再次發佈國內首個所見即所得模型“日日新5o”,交互體驗對標GPT-4o,可實現實時的流式多模態交互。

在歷次的發佈會上,商湯科技一直強調其對端側推理效率提升的重視。也正是得益於中國市場上對大型模型和智能計算服務的強勁需求,以及“日日新SenseNova”大型模型能力的增強和推理成本的迅速降低,商湯的生成式人工智能業務在2024年上半年實現了顯著的增長。

在應用層面,商湯“日日新”端側模型已深入各個行業,與超過150+客戶啓動商業對接,覆蓋智能手機、平板電腦、VR一體機、車載電腦、智能檯燈等諸多IoT設備部署應用。報告期內,已有3000多家行業頭部企業使用商湯的大模型及智算服務。

隨着端側大模型技術的不斷進步,未來中國端側大模型行業的競爭格局將展現出技術深度整合與創新驅動的新趨勢。在生成式人工智能的關鍵發展時期,商湯科技憑藉其在端側大模型領域的深厚底蘊和創新能力,未來有望進一步增強其企業價值,成爲人工智能領域的領頭羊。