文章標籤：

機情觀察室：華為麒麟960性能全面解析

2021-02-24

文章推薦指數： 80 %

投票人數：10人

【IT168 評測】隨著智慧型手機所承載的功能越來越多的時候，處理器顯得愈發重要。

10月17日，華為在上海召開發布會，正式發布最新一代SoC：麒麟960。

作為目前國產移動端處理器中唯一可以商用的SoC，每一代麒麟晶片的發展都備受關注。

而在發布會後，我們也對麒麟960的最新特性進行了簡述，此次麒麟960主要在性能、拍照、安全、連接性等各方面均有所提升。

我們今天的機情觀察室，就這款在網上號稱比肩驍龍820的國產處理器進行解讀，看看麒麟960究竟是一款怎樣的產品。

對於一款智慧型手機的SoC，已經不僅僅局限於CPU這一單元，而是包括Modem、ISP、GPU、內存等各部分組件的綜合體。

而在這一代麒麟960上，通過架構圖（下圖）可以看到，麒麟960在CPU架構、GPU型號、Modem、ISP、內存規格等各方面均有所提升（黃色部分）。

相比之前，麒麟960逐漸補齊了之前為人詬病的短板，在幾個關鍵組件上都達到目前業界大規模商用處理器的旗艦級標準，並且在ISP、安全晶片方面有著自主研發成果的優勢。

另外大家可能也注意到，麒麟960採用A73架構，而當業界頂級處理器都已採用自研微架構的時候，華為麒麟仍然堅持遵循ARM公版架構的升級。

而最新的A73架構實力究竟如何?我們繼續往下看。

全新的A73架構

▲麒麟960架構圖

在移動SoC領域，目前諸如驍龍820、蘋果A10 Fusion這樣的旗艦晶片都已經採用自研微架構，而麒麟則一直沿用ARM公版架構。

此次麒麟960選用ARM最新推出的A73架構，16nm FinFEF+工藝。

我們都知道，更先進的架構與更先進的工藝能夠將處理器性能提升的同時兼顧功耗的控制。

在去年的麒麟950上，華為大膽選擇16nm FinFEF+工藝，成為首款採用16nm製程的商用SoC。

而在今年的選擇中，華為並沒有冒進的選擇10nm，而是仍然延續了16nm工藝。

對此，華為表示在目前可商用量產的範圍內，16nm仍然能保證A73架構的功耗，並且橫向來看，此次對於工藝和架構相比，架構的提升更為重要，而且在目前的節點10nm工藝量產尚不成熟，因此麒麟最終選擇16nm。

架構方面，麒麟960遵循ARM公版架構升級的方案，選擇A73架構。

對此，華為表示術業有專攻，自研架構對於麒麟目前並非是最好的結果，更何況決定CPU的指令集與架構都是ARM發明的，因此如果沒有大幅度的提升，自研與採用公版架構並沒有太大區別。

相比於競品，麒麟更追求在綜合性能的提升。

在官方介紹中，Cortex-A73仍然採用全尺寸ARMv8-A架構，最高可以達到2.8GHz主頻，可以使用10nm、14/16nm工藝，而根據ARM官方介紹，當A73使用10nm工藝時，對比上代16nm工藝的A72，性能有30%的提升，並且對AR/VR都有更好的優化。

A73是採用ARMv8-A架構中核心最小的處理器，每核心面積在0.65mm，並且繼續支持big.LITTLE架構。

另外，A73與A72在架構上也有很大的區別，A73採用雙發射L/S單元，在發射寬度上小於A72的三發射，但由於A73整個處理器的11級核心流水線深度比A72的15級核心流水線深度更精簡，因此發射寬度並沒有決定性的影響到A73的性能。

但由於A73的一級緩存由48kB提升至64kB，二級緩存由A72的最大2MB提升至8MB，並且為一級緩存和二級緩存都配備了獨立的預讀器，使得A73可以獲得接近理論的最大帶寬值。

得益於各種優化，使得A73在極限性能上相比較A72有所提高，並且支持UF 2.1的內存規格，這也使得麒麟960在數據的讀寫上相比之前有不小的提升。

在麒麟960的快閃記憶體讀寫測試中，連續讀寫與隨機讀寫的性能比採用A72的麒麟950要高出數倍之多。

目前智慧型手機的高度集成化，內部空間幾乎是寸土寸金，尤其是對於主板部分，極其複雜的電氣結構使得對手機處理器的選擇心有餘而力不足。

A73號稱目前處理器中面積最小的高端核心，每顆核心的面積在0.65mm之下，相比於A72上1.15mm2的面積整整小了43%，而根據ARM的數據：A73在採用10nm FinFET工藝，配備2.8GHz四核心的情況下，核心面積只有5mm2。

一般來說，手機處理器的製造成本與面積大小成正比，面積越大成本越高，而更小的處理器面積帶來更小的成本。

另外，從架構圖上，我們可以看到，在DIC Interrupt Control區域中終於用上了在A72時就已經發布的CCI 500。

而在此前麒麟950的介紹中我們對此也已經有所介紹，實際上CoreLink CCI-500最大的變化就是增加了一個「探聽過濾器」(Snoop Filter)，從而使探聽控制不再局限於單個簇內部的CPU之間，允許CPU所有核心可以同時調度，這樣處理器的在執行緩存查詢的工作量隨之降低，效率更高，相信大家都聽過所謂的「一核有難，其它圍觀」，就是因為之前處理器中簇與簇之間協同效率低下。

而相比之前麒麟950中的CCi 400則對內存互聯性則支持不夠，並且帶寬總線也有所限制（CCi 400最高值支持12.8G/s，CCi 500理論可達25.6G/s）。

因此在內存貸款得分上，麒麟960相比950以及其它競品有著將近1倍的提升。

當G71遇上Vulkan

此次麒麟960採用ARM旗下最新一代GPU：Mali G71，採用Bifrost架構。

與之前midgrad架構相比，Bifrost最大的創新在於使用指令組著色器（ClausedShader）。

官方宣稱：G71重新設計了執行單元，將指令集分組到預先設置好的程序塊，使指令組可以自動執行且不會中斷。

可以確保所有外部依賴在子執行前便已就緒，臨時計算的結果無需訪問寄存器組，減小對寄存器文件的壓力，顯著降低功耗；通過簡化執行單元的控制邏輯，GPU的面積也得以縮小。

另外Bifrost架構還採用Quad based vectorization技術，相比於之前SIMD矢量化技術一次只能執行單一線程，Quad矢量化技術最高支持四線程執行，共享控制邏輯，使用率接近100％。

其它方面，Mali G71主頻為850MHz，在官方給出的成績中，基於16nm工藝下，Mali G71擁有27.2Gpix/s像素填充率以及850Mtri/s三角形填充率（基於32核心），相比T880在像素填充率增加一倍，但三角形生成率則只有之前的1/2。

出於對功耗及晶片面積大小的控制，此次麒麟960採用Mali G71 MP8（當然不可能用32核）。

並且向我們展示麒麟960的跑分測試性能。

在曼哈頓1080P離屏測試中，麒麟960成績甚至提升2倍之多。

另外，此次Mali G71在支持OpenGL等API的同時還支持Vulkan接口標準。

一直以來，大部分3D遊戲都通過OpenGL標準交互，但由於其出生於90年代，如今的OpenGL已經顯得廉頗老矣，對於目前市面上多核處理器的利用效率較低，在圖形處理的效率上比較低，無法完全釋放GPU的實力，有種大馬拉小車的感覺。

因此在麒麟960上，率先完整支持新一代圖形API規範：Vulkan。

相比OpenGL，Vulkan改善多線程性能，渲染性能更快，擺脫OpenGL依賴CPU運算的方式，使GPU與CPU之間無需事先拷貝數據，在同樣的內存下同時進行讀寫，充分發揮多核處理器的並行計算能力。

第三代雙攝ISP：

隨著人們對手機拍照的要求越來越高，對於圖形數據的後期計算的地位甚至幾乎與鏡頭本身的素質相提並論。

因為對於如今的智慧型手機，攝像頭鏡頭模組與機身厚度的矛盾使得註定在畫質上無法與單反相比，更多的是從算法上來彌補硬體先天的差距，華為能做的就是自主研發ISP。

因此麒麟960採用華為自主研發的PrimISP 2.0，並且內置於SoC中。

內置高清HD硬體深度圖形處理器、超解析度技術、支持4K硬體視頻防抖。

尤其在雙攝方面升級至第三代雙攝技術，模擬人眼深度感知3D對焦，支持黑白雙攝實時融合處理，能夠捕捉更多的細節，在暗光情況下能夠降低噪點。

相比於上代PrimISP，2.0中增加了對圖像的深度計算、超級解析度、視頻防抖的支持。

在華為一直堅持的雙攝方面，麒麟960模擬人眼的生物特性，帶來第三代雙攝技術。

在人的眼球中，主要由杆狀細胞與錐形細胞兩種細胞構成，錐形細胞分辨物體色彩，杆狀細胞帶來物體細節。

在單眼中約有1.2億個杆狀細胞，600-700萬個錐形細胞。

因此在人們平時觀感過程中，對於物體細節的提高比色彩的提高更加敏感。

因此華為在雙攝技術中始終堅持走「黑白+彩色」的路線，這也與高通所謂的「Clear Sight」有著殊途同歸的方向。

但不同在於Clear Sight是基於雙ISP（黑白+彩色）圖像融合，在這方面麒麟與高通還有些差距。

達到業界領先的Modem

通訊一直都是華為最值得驕傲的競爭力，但在麒麟950上卻出人意料的最高只支持到CAT6規格，而今年年初的競品也早實現了CAT12規格，並且CDMA外掛基帶也一直被人所詬病。

因此在麒麟960上集成了全新自研全模Modem，在CDMA專利方面終於有所突破，麒麟960全面支持GSM/UMTS/CDMA/TD-SCDMA/TD-LTE/FDD-LTE目前最常使用的六模330MHz-3.8GHz全頻段，麒麟960也成為麒麟系列中首款支持全網通的晶片。

在雙卡雙待方面，麒麟960支持4G+2G、4G+3G、4G+CDMA等各種不同網絡制式下的雙卡組合，對於目前一些國家已經取消2G網絡的情況也可以支持。

在網絡連接性上，麒麟960支持4CA或2CA+4*4 MIMO，峰值下載速度達600Mbps，將通信規格升級到Cat12/Cat13，帶來全新的VoLTE語音技術升級為悅音2.0，包括：HD Voice、VoWifi(微信語音通話)，頻譜範圍擴展100%，採樣率提升100%。

麒麟960的智能語音增強技術SPLC，能夠對用戶語音進行動態智能補償，去除50%的雜音和語音斷續，減少卡頓感，提升語音通話體驗。

在理論性能上追平至業界頂級水平。

更加智能的協處理器：

從整個設計思路上可以看出，麒麟960整體在性能與功耗上著重下功夫，而對於當前智慧型手機，在電池技術一直沒有突破的情況下對使用協處理器的辦法，利用更少的電量做更多的事情，對CPU的功耗問題是個曲線救國的策略。

麒麟在之前經歷了i3、i5的應用。

在麒麟960上，對i6也進行了進一步優化，賦予i6協處理器更多的任務。

進一步降低CPU的負擔。

在麒麟960上，i6與A73、A53協同共享資源，在手機休眠時獨立接管輕量級任務，但只消耗1%的功耗。

與i5相比，在典型PDR業務下，功耗下降75%，計步器業務，功耗下降40%。

並且i6的融合運算包括高精度圍欄、情景感知、低功耗GPS定位、低功耗多基站定位、低功耗導航、AOD(螢幕常亮)功能。

這樣的變化也使得在未來運行一些基於LBS的AR類應用(Pokeman Go)降低70%功耗。

強大的安全性：

隨著智慧型手機承載的功能越來越多，無論是信息安全還是金融安全都已經變得越來越重要，因此央行以及銀聯對移動終端金融的安全解決方案也提出了監管的要求：千元級的支付需要單因子驗證（靜態密碼或生物識別）、萬元級需要雙因子（靜態密碼及指紋識別）、5萬-百萬級的支付需要三因子以上（數字證書或電子簽名、靜態密碼、生物識別），因此目前一些主流的手機支付都有一定的額度限制。

麒麟提出的inSE方案則率先獲得銀行、銀聯雙重晶片安全認證，是全球首款達到金融及安全的晶片。

得益於華為在通信方面多年的深耕，麒麟960從晶片底層主動防禦偽基站，在2G/3G網絡環境下，手機進入基站範圍時對基站機型認證，拒絕與偽基站發生通信，從根本上解決了偽基站的風險，保護用戶的連接安全。

並且麒麟960將安全晶片與SoC集成在一起，相比較於其它安全解決方案，inSE安全方案使得處理器、安全晶片、內存都融合在一起，使得安全晶片無法被替換，從根本上保證了手機的安全，並且麒麟960支持CRT-RSA、RSA、DES/3DES、AES加解密算法，有著很高的安全程度。

總結：此次溝通會上，華為為麒麟960定下的主題為「創新拒絕迷途」，其實創新這個詞從15年開始就被反覆提及，在手機已經嚴重同質化的今天更加難得。

關於麒麟960的產品，相信通過前面的分析也已經有了一個大概的印象：儘管在一些發散型功能上麒麟與成熟的高通還有些差距，但在一些關鍵組件的性能指標已經迎頭趕上，整個麒麟960沒有哪部分成為明顯的短板為人詬病，並且在均衡的基礎上，能夠發揮自己與終端緊密結合的優勢，針對用戶實際的需求進一步改進。

創新並非可以一蹴而就，需要動心忍性，麒麟960已經證明了自己能夠站到第一梯隊的高度，我們也期待華為麒麟在之後還能帶來更令我們驚喜的產品。