AI端側的芯片革命
2025年,中國開了一個好年。
文化市場,哪吒2爆火,票房已經突破了百億,闖入全球電影TOP榜,向世界展示了中國市場“恐怖的”消費能力。AI市場,DeepSeek的橫空出世,更低的算力達到Chat GPT的效果,直接刷屏全球熱搜榜。
如果說Chat GPT的出現,讓生成式AI走向了雲,那麼DeepSeek則是讓生成式AI走向了端。
端側AI芯片的“黃金拐點”
科技行業一直在探索AI硬件產品。
從今年“消費電子屆春晚”CES上來看非常明確。今年CES上的各大公司推出的產品都與AI強相關,無論是通用的PC,還是手機終端,再到機器人、眼鏡、耳機、手錶等等,幾乎每種產品只要存在人機交互的硬件終端,都有廠商嘗試將其與AI大模型結合。
但這些探索似乎都不太成功。大模型推出了成百上千種,硬件產品更是成千上萬種,但效果不甚了了。究其原因,還是本地SoC提供的算力和大模型需要的算力無法匹配。
ChatGPT時代,大模型的蒸餾是很大的問題。如果採用雲端調用算力完成AI推理,就存在三個問題:第一,成本。雲端的任何操作都是有成本的,可能不多,幾分人民幣,但總之是要花錢的。
有手機廠商透露,調用一次雲端大模型的平均成本在1.2分到1.5分人民幣,假設每個品牌都有上億的用戶量,每人每天調用10次,這其中的算力成本非常驚人。但是如果按次數或月租向用戶進行收費,在功能同質化的情況下,用戶的使用意願也會很難保證。
第二,速度。既然是雲端完成,那麼必然需要進行網絡傳輸,這就導致AI在終端的響應速度慢。如果是自動駕駛中的汽車,對於當前環境需要在10毫秒內決策,靠着雲端未免過於危險。在自動駕駛、工業質檢等場景,端側推理延遲能夠降至毫秒級,較雲端方案提升5倍。
第三,隱私。這是最重要的部分,涉及到醫療和金融等內容,對於用戶來說,端側模型纔是最優解。
所有人內心都有一個答案:端側AI纔是AI硬件落地的關鍵。
小尺寸模型落地端側已經開始了。
自華爲宣佈“小藝智能體”接入DeepSeek-R1算起,在一週多的時間裡,包括星紀魅族、榮耀、OPPO、努比亞、vivo在內的6家手機廠商宣佈接入DeepSeek。
需要解釋的是,滿血版DeepSeek-R1模型參數達到671B,僅模型文件就需要404GB存儲空間,任何一種移動設備都無法滿足這樣的硬件配置需要。但DeepSeek蒸餾版本(1.5B、7B)適合手機等端側使用。
爲了讓這些小尺寸模型在端側流暢運行並充分發揮其智能優勢,就需要性能強勁的端側 AI 芯片來提供算力支持。
市場對於能適配小尺寸模型運行的端側 AI 芯片需求開始水漲船高。
賽道主力玩家
端側的應用市場非常大,前文我們提到,只要存在人機交互的硬件終端,都有廠商嘗試將其與AI大模型結合。我們可以在這裡具體看一下:
AI PC領域,2027年AI PC在中國PC市場佔比能夠達到85%;AI手機領域,2026年,AI 手機的出貨量預計將突破4.7億部,滲透率增至38%;在AI可穿戴設備領域,市場規模預計將從2024年的419億美元增長至2028年的1207億美元,CAGR達到30.3%。
2023年中國端側AI市場規模爲1,939億元,從2018至2023年,其年均複合增長率爲116.3%。
DeepSeek首先帶動是AI端側的SoC芯片需求。
SOC芯片是各類型硬件設備的主控單元,承載着運算控制等核心功能,是硬件的“大腦”。隨着AI在邊緣側的應用越來越廣泛,SOC將更加變成集成人工智能和邊緣計算能力的系統級芯片,成爲AI SOC,算力達到幾十甚至數百TOPS。
在這次端側AI熱潮中,瑞芯微頻頻漲停。
目前,瑞芯微能夠提供從 0.2TOPs 到 6TOPs 的不同算力水平的 AIoT 芯片,其中 RK3588、RK3576 帶有 6TOPs NPU 處理單元,能夠支持端側主流的 0.5B~3B 參數級別的模型部署。可通過大語言模型實現翻譯、總結、問答等功能,並可實現多模態搜索、識別,有效解決不同 AIoT 場景的痛點,提升產品使用體驗。
其中,公司SOC芯片拳頭產品RK3588M是國內少數能媲美國外一線產品的智能座艙SoC芯片。
據瑞芯微透露,該產品性能優異,一芯帶多屏、端側AI等能力突出,已落地應用於衆多頭部車廠,量產車型10餘款,超20款定點車型項目在同步開發中。此外,新產品RK3576M也正在進行客戶導入。
這還僅是瑞芯微端側AI產品應用的一個方面。
事實上,當前已有多個領域的客戶基於瑞芯微主控芯片研發在端側支持AI大模型的新硬件,例如教育平板、AI玩具、桌面機器人、算力終端、會議主機等產品。
全志科技也是一家備受關注的SoC企業。去年公司全年實現屬於上市公司股東的淨利潤爲1.53億元–1.9億元,同比增長566.29%~727.42%。業績暴增的原因,則是以掃地機器人、智能投影等業務線爲代表的產品出貨量顯著提升,致使營業收入同比增長約35%。
在記者問詢全志科技產品是否能適配DeepSeek,是否針對DeepSeek進行佈局時,全志科技表示:“公司產品可以爲端側多種形態的智能終端產品提供算力支持。”
樂鑫科技SoC長期應用於泛IoT領域。從應用端看,樂鑫科技在智能家居、智能照明和消費電子等核心應用市場合計達到了30%以上的增長。
樂鑫科技ESP32-S3 和 ESP32-P4 產品線都有添加邊緣 AI 的功能,主要體現爲設備端語音喚醒與控制,以及圖像處理的功能。這兩個系列的芯片在硬件設計上增加了 AI 加速指令;而在軟件層面,也提供圖像識別和語音喚醒、控制等方案。
樂鑫科技副總經理王珏表示:“公司帶端側AI功能的AIoT芯片ESP32-S3目前增長非常迅速,也是當前主推的旗艦產品。”字節跳動的AI玩具“顯眼包”中用的也是樂鑫的芯片 ESP32。
晶晨股份已有超15款商用芯片搭載其自研的端側AI算力單元,2024年攜帶自研端側AI算力單元的芯片出貨量超過800萬顆。
2024年年度實現營業收入59.21億元左右;歸母淨利潤約8.2億元左右,同比增長64.65%左右。該公司表示,其6nm芯片S905X5系列可利用端側AI能力,實現本地同聲翻譯、同聲字幕等功能,商用半年以來取得多個國際Top級運營商的訂單,預計6nm芯片有望在2025年達成千萬顆以上的銷量。
端側的AI音頻處理器應用場景多是在智能物聯網領域。比如,在智能音響中,端側 AI 音頻處理器能夠支持語音喚醒、語音識別、語音合成等功能,實現用戶與音箱的自然語言交互。在智能家居系統中,它可用於聲音控制家電設備,如通過語音指令調節燈光、空調、電視等。
恆玄科技的端側SoC已經成功搭載在多家主流品牌產品裡,包括百度、字節跳動、谷歌、哈曼、安克創新、漫步者、韶音等。今年,字節跳動推出的首款搭載豆包大模型的智能耳機Ola Friend,搭載的就是恆玄科技2700芯片。恆玄科技的最新芯片BES2800還被應用於三星2024年最新發布的Galaxy Buds3 Pro耳機中。多款耳機的應用,能夠看出恆玄科技在智能終端SoC芯片領域處於領先地位。
對於端側 AI對於芯片要求的變化,恆玄科技認爲:“雲端大模型的興起除了對 AI 手機、PC 帶動外,可穿戴也是會受益於端側 AI 的發展,它對芯片會提出新的需求,比如可穿戴的環境感知能力要變得更強,所以主控芯片的算力需要相應提升,同時可穿戴產品長續航是剛需,所以芯片在算力提升的基礎上還要保持較低的功耗水平。”
值得一提的還有AI眼鏡芯片。行業普遍認爲眼鏡是目前最火的AI、大模型的落地載體,今年行業將會完成0到1的突破。
之前在2017年,Meta就開始自研AI眼鏡,最開始是和三星合作,但是三年都沒出什麼結果,然後告吹了。之後Meta放棄了自研芯片,Ray-Ban眼鏡使用了高通的AR1 Gen 1芯片。
可以說,在ARVR芯片這個領域,高通還是處於絕對的控制地位。在市面上,AI眼鏡能用上的芯片,除了高通芯片,那就是紫光展銳的TW517。
紫光展銳TW517採用12nm工藝,GPU 型號爲 IMG8300,運行頻率 800MHz。主要客戶是閃極 AI 拍拍鏡、影目科技。
同時,恆玄科技此前透露,該公司芯片已在魅族等智能眼鏡產品中應用發佈,同時有一些客戶項目正在導入階段。
結語
哪吒2突破百億票房,向世界展示了中國市場“恐怖的”消費能力。這意味着:單憑中國市場的規模和消費能力就抵得上全球其他發達國家的總和。
這背後傳遞的信號非常積極。
如果只看電影市場,可能還不太理解。但如果放到科技和製造業中來看就會明白其中的巨大價值。
接下來不管歐美再怎麼對我們進行貿易和科技壁壘,都不可能阻止我們產業升級。對於科技和製造的最大障礙,並不是“卡脖子”,而是前期沒有足夠大的消費市場買單,就無法形成相關產業鏈的建立。
舉個例子,某企業研發一款芯片,從設計到量產累計成本要2個億,如果只賣出十萬片那每個芯片的成本等於是2000塊,這個價格太高了,企業肯定無法盈利。只能陷入長期虧損,最終倒閉出局。但是如果能夠賣出1億片,那每片成本只需要2塊錢。這個成本的大幅度攤薄就會讓企業有利潤繼續投入研發。
因爲市場體量足夠大,有足夠多的買家幫助消化成本,公司就能賺錢、行業就能發展,這就是中國市場的魔力。
國信證券研報觀點稱,2024年電子行情由“週期復甦”向“成長創新”切換,2025年行業有望邁入估值擴張大年。應用端AI革新人機交互,以語音交互爲核心的AI端側應用正處在大規模商業化的臨界點,創新催化頻繁。
相比AI雲側,國內半導體企業將在AI端側創新中實現更高的市場參與度,同時國產半導體自給率仍偏低,兩者共振奠定了行業成長的確定性和空間。