驍龍8至尊版混合架構、成本揭秘:更貴是不可避免的!

快科技10月25日消息,近日,高通發佈了新一代旗艦移動平臺驍龍8至尊版,首次採用專爲智能手機設計的第二代自研Oryon CPU架構,同時在GPU、NPU、影像、連接等各方面都實現了飛躍,各家手機廠商的終端產品也即將紛紛登場。

發佈會後,快科技採訪了高通的多位技術高管,對於驍龍8至尊版的架構設計、技術特性有了更深入的瞭解。

CPU架構方面,驍龍8至尊版配備了兩個4.32GHz的超級內核、六個3.53GHz的性能內核,各自搭配12MB二級緩存。

高通表示,驍龍8至尊版在微架構上實現了全方位的升級,主要有以下三點:

第一,每個CPU叢集都配備了迄今最大的緩存;第二,引入了全新的數據時序預取器(data-cache pre-fetcher);第三,引入了全新的性能內核設計。

說到性能內核、超級內核之間的區別,它們在微架構層面上確實有很多差異,尤其是性能內核爲了降低功耗,做了大量的微架構調整。

兩類核心是不同的異構計算核心,但在SoC和總線架構中是緊密相連的,以確保高速的核間通信,同時二級緩存的大小加倍,以確保緊密同步。

同時,爲了能讓超級內核、性能內核既保證能效,又不妥協性能,高通在設計之初就充分考慮到了芯片的各種物理限制,包括芯片架構、手機主板架構等。

不過,高通沒有也不會公佈驍龍8至尊版的晶體管數量,未來產品也不考慮,這和蘋果、聯發科的做法不同——A18系列今年沒有公佈大概率是因爲"開倒車"而不好意思。

高通強調,晶體管的數量不能直接代表性能表現,並不是晶體管越多,芯片的性能就越好,我們要看的是如何實現最佳的性能和能效。

需要強調的是,二級緩存對能效的表現至關重要,所以驍龍8至尊版爲每一個CPU叢集都配備了前所未有的12MB二級緩存,總計達24MB,這種緊密耦合的專用緩存也是移動領域迄今最大的。

總體上,高通做了巨大的投入,有效降低了驍龍8至尊版的時延,從第三代驍龍8的12ns大幅降低至5ns,這會顯著提升高性能遊戲、網頁瀏覽等各種使用體驗。

正是得益於高通在這些領域的深厚經驗,配合出色的軟件架構,才做出了這款性能和能效兼得的CPU。

說到網頁瀏覽性能,可以通過Speedometer測試最直觀地反映出來,實測驍龍8至尊版的成績爲26.0,酷睿Ultra 200V系列則只有17.0。

同時,驍龍8至尊版對比前代驍龍8 Gen3更是提升了多達62%,高通也有信心超越任何安卓平臺競品。

要知道,諸如微信、滴滴、美團等很多主流應用的底層功能,其實都是基於Web應用的,因此,提升網頁瀏覽性能,對於增強整體用戶體驗至關重要,驍龍8至尊版將讓用戶感受到前所未有的流暢使用體驗。

高通強調,之所以能在Speedometer上取得如此顯著的速度提升,關鍵在於驍龍8至尊版採用了定製架構的CPU(Oryon CPU高達192KB的一級緩存就非常有幫助),這是公版架構無法相媲美的,而縱觀全球,目前僅有兩家公司擁有定製CPU。

同時,驍龍8至尊版基於用戶真實需求和用例爲基礎,進行了專門的網頁瀏覽性能優化。

除了CPU部分的超大緩存,GPU部分也設置了12MB的專用緩存,它可以存儲部分畫面幀,以此降低帶寬佔用,從而提高能效。

值得一提的是,驍龍8至尊版首次在移動端運行了虛幻引擎5的Nanite解決方案,可以實現虛擬紋理繪製(virtual texturing)、陰影貼圖(shadow maps)等功能。

在一些大型世界遊戲中,通過陰影貼圖功能,可以實現高達16K甚至更高分辨率的畫面,並且畫面是分區渲染的,單次只渲染所在場景中的部分畫面,以實現更精美的、更高分辨率的畫面質感。

內存方面,驍龍8至尊版也支持到了行業最高的LPDDR5X 5.3GHz (等效於10.7GHz),與聯發科天璣9400相同。

高通解釋說,QRD(高通參考設計)在內存方面其實有兩個版本,一個是4.8GHz(等效於9.6GHz),另一個是5.3GHz(等效於10.7GHz),基準測試在兩個版本上運行的差異並不是很明顯。

目前來看,高通預計5.3GHz內存在短期內的採用率會相對低,因爲它相對更新,成本也更高,到了明年可能會有所不同。

AI方面,驍龍8至尊版大幅提升了NPU的性能和AI的運用,比如NPU可以在後臺靈活調度大語言模型的推理。

這正是Hexagon NPU架構設計的初衷,其不僅性能卓越,而且能效顯著提升,對比上代每瓦性能提升了多達45%。

同時,新的架構可以針對廣泛的應用場景,提供相應的能效優化,當然包括後臺待命,通過輕觸屏幕或語音喚醒,迅速調用強大的AI功能。

針對AI大模型的快速進化,高通也有充分的考慮,尤其是內存佔用方面。

比如Llama和百川的70億參數大模型版,即使壓縮到16位整數精度進行處理,也會佔用13GB左右的內存,而通過高通的軟件和相應的解決方案,將內存需求大幅降至約3.5GB。

高通預計,未來對更有效壓縮技術的需求會日益增長,同時會出現越來越多的介於10億至40億參數之間的達模型。

五次,高通會從硬件和AI軟件棧兩個方面持續投入,一方面提升壓縮模型的性能表現,實現更小的內存佔用,另一方面進一步降低模型精度,應對內存資源爭搶,並降低成本。

最後說一下成本問題,行業傳聞驍龍8至尊版的價格又要貴很多,給終端廠商帶來了不小的壓力。

對此問題,高通解釋說,任何半導體行業從業者都清楚的是,這個行業的經濟模式已經出現了根本性的變化。

大約十年前,同樣的設計和晶體管規模過渡到新一代製程工藝後,會變得更加便宜,因此通過製程迭代工藝,能夠顯著節省成本,繼而用來開發新的技術特性和創新。

但是現在,晶體管和晶圓代工廠的經濟模式出現了轉變之後,同樣的設計升級到下一代工藝製程,成本會大幅增加,這爲半導體行業的各個領域都帶來了根本性的變化。

高通表示,關於成本問題,一直在與客戶保持着緊密的溝通,尤其是中國客戶。

爲此,高通開展了很多工作,其中一點是通過打造豐富的產品層級和產品組合,滿足不同的市場需求。

比如面向有着最頂級旗艦定位和性能需求的產品層級,高通提供最高端的解決方案、最卓越的體驗。

面向其他價格段市場和沒有那麼高預算的消費者,高通會跨越產品層級,將旗艦體驗下放,爲更多消費者提供集成衆多旗艦平臺核心技術、同時價格更經濟實惠的解決方案。