☰

驍龍8至尊版混合架構、成本揭秘：更貴是不可避免的！

快科技10月25日消息，近日，高通發佈了新一代旗艦移動平臺驍龍8至尊版，首次採用專爲智能手機設計的第二代自研Oryon CPU架構，同時在GPU、NPU、影像、連接等各方面都實現了飛躍，各家手機廠商的終端產品也即將紛紛登場。

發佈會後，快科技採訪了高通的多位技術高管，對於驍龍8至尊版的架構設計、技術特性有了更深入的瞭解。

CPU架構方面，驍龍8至尊版配備了兩個4.32GHz的超級內核、六個3.53GHz的性能內核，各自搭配12MB二級緩存。

高通表示，驍龍8至尊版在微架構上實現了全方位的升級，主要有以下三點：

第一，每個CPU叢集都配備了迄今最大的緩存；第二，引入了全新的數據時序預取器(data-cache pre-fetcher)；第三，引入了全新的性能內核設計。

說到性能內核、超級內核之間的區別，它們在微架構層面上確實有很多差異，尤其是性能內核爲了降低功耗，做了大量的微架構調整。

兩類核心是不同的異構計算核心，但在SoC和總線架構中是緊密相連的，以確保高速的核間通信，同時二級緩存的大小加倍，以確保緊密同步。

同時，爲了能讓超級內核、性能內核既保證能效，又不妥協性能，高通在設計之初就充分考慮到了芯片的各種物理限制，包括芯片架構、手機主板架構等。

不過，高通沒有也不會公佈驍龍8至尊版的晶體管數量，未來產品也不考慮，這和蘋果、聯發科的做法不同——A18系列今年沒有公佈大概率是因爲"開倒車"而不好意思。

高通強調，晶體管的數量不能直接代表性能表現，並不是晶體管越多，芯片的性能就越好，我們要看的是如何實現最佳的性能和能效。

需要強調的是，二級緩存對能效的表現至關重要，所以驍龍8至尊版爲每一個CPU叢集都配備了前所未有的12MB二級緩存，總計達24MB，這種緊密耦合的專用緩存也是移動領域迄今最大的。

總體上，高通做了巨大的投入，有效降低了驍龍8至尊版的時延，從第三代驍龍8的12ns大幅降低至5ns，這會顯著提升高性能遊戲、網頁瀏覽等各種使用體驗。

正是得益於高通在這些領域的深厚經驗，配合出色的軟件架構，才做出了這款性能和能效兼得的CPU。

說到網頁瀏覽性能，可以通過Speedometer測試最直觀地反映出來，實測驍龍8至尊版的成績爲26.0，酷睿Ultra 200V系列則只有17.0。

同時，驍龍8至尊版對比前代驍龍8 Gen3更是提升了多達62％，高通也有信心超越任何安卓平臺競品。

要知道，諸如微信、滴滴、美團等很多主流應用的底層功能，其實都是基於Web應用的，因此，提升網頁瀏覽性能，對於增強整體用戶體驗至關重要，驍龍8至尊版將讓用戶感受到前所未有的流暢使用體驗。

高通強調，之所以能在Speedometer上取得如此顯著的速度提升，關鍵在於驍龍8至尊版採用了定製架構的CPU(Oryon CPU高達192KB的一級緩存就非常有幫助)，這是公版架構無法相媲美的，而縱觀全球，目前僅有兩家公司擁有定製CPU。

同時，驍龍8至尊版基於用戶真實需求和用例爲基礎，進行了專門的網頁瀏覽性能優化。

除了CPU部分的超大緩存，GPU部分也設置了12MB的專用緩存，它可以存儲部分畫面幀，以此降低帶寬佔用，從而提高能效。

值得一提的是，驍龍8至尊版首次在移動端運行了虛幻引擎5的Nanite解決方案，可以實現虛擬紋理繪製（virtual texturing）、陰影貼圖（shadow maps）等功能。

在一些大型世界遊戲中，通過陰影貼圖功能，可以實現高達16K甚至更高分辨率的畫面，並且畫面是分區渲染的，單次只渲染所在場景中的部分畫面，以實現更精美的、更高分辨率的畫面質感。

內存方面，驍龍8至尊版也支持到了行業最高的LPDDR5X 5.3GHz (等效於10.7GHz)，與聯發科天璣9400相同。

高通解釋說，QRD（高通參考設計）在內存方面其實有兩個版本，一個是4.8GHz(等效於9.6GHz)，另一個是5.3GHz（等效於10.7GHz），基準測試在兩個版本上運行的差異並不是很明顯。

目前來看，高通預計5.3GHz內存在短期內的採用率會相對低，因爲它相對更新，成本也更高，到了明年可能會有所不同。

AI方面，驍龍8至尊版大幅提升了NPU的性能和AI的運用，比如NPU可以在後臺靈活調度大語言模型的推理。

這正是Hexagon NPU架構設計的初衷，其不僅性能卓越，而且能效顯著提升，對比上代每瓦性能提升了多達45％。

同時，新的架構可以針對廣泛的應用場景，提供相應的能效優化，當然包括後臺待命，通過輕觸屏幕或語音喚醒，迅速調用強大的AI功能。

針對AI大模型的快速進化，高通也有充分的考慮，尤其是內存佔用方面。

比如Llama和百川的70億參數大模型版，即使壓縮到16位整數精度進行處理，也會佔用13GB左右的內存，而通過高通的軟件和相應的解決方案，將內存需求大幅降至約3.5GB。

高通預計，未來對更有效壓縮技術的需求會日益增長，同時會出現越來越多的介於10億至40億參數之間的達模型。

五次，高通會從硬件和AI軟件棧兩個方面持續投入，一方面提升壓縮模型的性能表現，實現更小的內存佔用，另一方面進一步降低模型精度，應對內存資源爭搶，並降低成本。

最後說一下成本問題，行業傳聞驍龍8至尊版的價格又要貴很多，給終端廠商帶來了不小的壓力。

對此問題，高通解釋說，任何半導體行業從業者都清楚的是，這個行業的經濟模式已經出現了根本性的變化。

大約十年前，同樣的設計和晶體管規模過渡到新一代製程工藝後，會變得更加便宜，因此通過製程迭代工藝，能夠顯著節省成本，繼而用來開發新的技術特性和創新。

但是現在，晶體管和晶圓代工廠的經濟模式出現了轉變之後，同樣的設計升級到下一代工藝製程，成本會大幅增加，這爲半導體行業的各個領域都帶來了根本性的變化。

高通表示，關於成本問題，一直在與客戶保持着緊密的溝通，尤其是中國客戶。

爲此，高通開展了很多工作，其中一點是通過打造豐富的產品層級和產品組合，滿足不同的市場需求。

比如面向有着最頂級旗艦定位和性能需求的產品層級，高通提供最高端的解決方案、最卓越的體驗。

面向其他價格段市場和沒有那麼高預算的消費者，高通會跨越產品層級，將旗艦體驗下放，爲更多消費者提供集成衆多旗艦平臺核心技術、同時價格更經濟實惠的解決方案。

相關資訊