“天下大勢,分久必合,合久必分”,M1并不是蘋果第一次改換處理器,早在2005年,Mac系列就從摩托羅拉、IBM的Power系列處理器更換到英特爾酷睿處理器。
在當年的WWDC上,喬布斯談到了對Power處理器的失望:性能不足、開發路線模糊且功耗巨大,而這正是改換門庭的契機。
而當我們把時間線撥到15年后的今天,你會發現歷史總是驚人的相似,眼下的英特爾也正經歷著性能、制程研發和功耗的瓶頸煎熬,所以,蘋果推出應用于Mac系統的自研處理器其實一點兒也不讓人意外。
雖然我們在電腦端習慣于說處理器,但注意,M1是蘋果第一款專為Mac設計的SoC芯片,關鍵詞:SoC。這正是M1最大的技術基礎,接下來我們將會以此為起點并結合新款Mac mini的實際測試,來為大家揭開M1的真實用戶體驗是否如坊間傳聞那般“拳打i9,腳踢PC”吧。
單核性能極強,非專業用戶日常使用OK
正如前面所說,M1推出的契機在于X86架構處理器在肉眼可見的未來,并不具備蘋果想要的進步幅度,也與蘋果期望的發展方向相左,作為手握手機平板端最強SoC的蘋果早已打造了屬于自己的閉源生態圈,所以在Mac上完全可以移植這套“熟悉的配方”,掌握最高級別的供應鏈話語權。
但實現這一目標必須有一個大前提,那就是性能要足夠強,至少要在用戶端實現無感遷移,那M1是怎樣做的呢?
首先是CPU單核性能的極致優化,一直以來蘋果的SoC都是走相對低頻+少核心數量+超寬架構IPC方案,M1也不過是4大核設計,但在采用臺積電5nm制程下足足塞入了160億個晶體管,4個大核可以分配到非常充裕的晶體管資源,先天就相對X86競爭對手有著明顯的單核性能優勢。
在Geekbench 5測試中,單核可以跑出驚人的1732分,作為對比,單核睿頻最高可達5.1GHz的英特爾Core i7 10875H只能跑1100分出頭,即便是放眼桌面端最強的Core i9 10900K也最多只能逼近1500分,與M1仍存在較大的差距。
從程序優化的角度來說,調用的核心越少,工作效率就越高,所以單核性能基本決定了綜合體驗的下限,M1在這方面可以說留足了性能空間,并且在跑Geekbench 5 CPU測試時,CPU占用率在45~65%之間,平臺峰值功耗也不過28W,整機運行非常安靜,機身外殼也基本沒有發熱。
換言之,即便是單純比通用計算性能,M1也并不會比X86同功耗水準的型號差,甚至在對比英特爾11代低電壓型號時能占得先機,但相較AMD 4000U系列還是有一定的差距。
除此之外大家最關心的可能還是軟件兼容性的問題,畢竟ARM和X86存在架構區別,“我買M1芯片的Mac會不會用不了已經習慣了的macOS APP呢?”
M1的特殊之處在于需要應用開發商針對Universal進行升級后才能以ARM原生方式運行APP,但好消息是我們日常使用的大多APP,比如QQ、愛奇藝、WPS、剪映等國產APP都基本在第一時間推出了Universal版,可以很方便地在APP Store進行下載安裝,因此,日常工作娛樂M1芯片Mac都能很好地實現兼容,可放心選擇。
但對于相對專業的應用來說,現階段來看兼容性問題確實是存在的,因為目前Mac用戶仍習慣于通過瀏覽器下載而不是通過APP Store,所以很容易下載到無法支持的版本(當然,很多第三方大型專業軟件本來就無法通過APP Store)。
因此,M1芯片的Mac系統還是更適合原本就一直使用蘋果系第一方APP的用戶:Final Cut Pro就第一時間進行了原生適配,但比如像Adobe旗下的熱門軟件就沒有那么快了,最快的Lightroom CC也要12月,Photoshop則要到2021年,Premiere、After Efftct、Illustrator等暫時沒有公布時間線。
雖然macOS Big Sur包含了Rosetta 2編譯器,運行可受支持的X86 Mac APP時會提示下載安裝,但它的限制也很明顯:使用AVX/AVX2/AVX512指令集的軟件無法編譯,但這恰恰是生產力軟件的必備。
除此之外,虛擬化X86的軟件和涉及到內核模塊也無法翻譯,限制比較明顯。而且WWDC 2020現場演示的PD虛擬化Debian 10并不是大家以為的X86版本,而是樹莓派的Lunux版……
綜上所述,短時間內對于需要在虛擬機環境下開發、使用第三方大型設計軟件的用戶來說,M1芯片機型入手還需謹慎。
大量專用芯片保證了高性能及低功耗
回到硬件功能上,作為以SoC形態出現的電腦處理器,M1相對傳統X86 CPU的優點在哪呢?先來看傳統CPU是怎樣處理數據的吧,現代CPU支持數百條指令,但僅僅只處理一個寄存器的數據也需要完整地跑一遍流水線,但即便是流水線較短的ARM架構也在10級以上,X86則需要經歷20級左右,能效比很低。雖然現代CPU大多可以將常見的指令集合,一次下達1條指令就能實現多個指令的并行,一條指令也可以同時處理多組數據以實現單指令多數據流,但即便是AVX512的帶寬依然相對太窄,再加上長流水線的影響,所以為了提高性能就只能提高頻率,這也就增加了功耗,這就是為什么低電壓x86 CPU很難成為生產力工具的原因。
既然CPU的通用計算能力如此有限,M1的方案方向就很明確了,那就用上專用計算方案吧。于是在M1的官方結構圖上,我們可以看到非常多的專用芯片:圖像處理、視頻編解碼、音頻處理、加密解密、神經網絡……
所以,這其實與手機/平板芯片是同一個路數,通過不走CPU流水線的專用芯片將能耗比最大化,進而實現高效與低功耗的兼備。
那么,專用芯片的性能到底有沒有說的這么厲害呢?
如果你經常使用Premiere或After Effect等視頻剪輯/特效軟件,一定會對高分辨率素材回放所造成的卡頓印象深刻,哪怕你電腦配置價格過萬也無法避免,所以有時候為了提高工作效率,不得不依靠調低預覽分辨率甚至使用代理來解決這個問題。
但這又意味著無法直觀檢視色彩、細節、動態范圍等關鍵數據,如果再遇上H.265編碼甚至HDR內容,說它是視頻工作者的夢魘也不為過。
而結合專用芯片的M1表現如何呢?
我們在Final Cut Pro 10.5中調用了數段8K分辨率素材建立視頻項目,并以“較好質量”進行實時回放,無論怎樣拖動時間線,預覽畫面與時間線指針都能即時響應,并且在調整顏色、飽和度、曝光數據并小幅度裁切后也同樣可以零卡頓預覽,不需要單獨渲染,這在傳統X86處理器機型上是很難實現的。
除此之外,在編輯iPhone 12 Pro Max拍攝的4K分辨率60幀Rec 2020色域H.265編碼HDR視頻時,M1芯片加持的Mac mini也能做到完全流暢的回放和剪輯,并且平臺功耗可以控制在15W以內,CPU/GPU占用率也很低。
我們把這一段視頻放到采用Core i7 10875H處理器、32GB內存、RTX 2070獨顯的Windows 10筆記本上使用Premiere Pro 2020進行編輯,在開啟硬件加速的情況下也同樣會出現卡頓。而且平臺功耗輕松超過80W,內存更是幾乎吃滿,由此可見,在受支持的APP下,專用芯片的功能十分明顯。
同樣的結論也適用于包括機器學習、數據加密、音頻編碼等其他專用芯片加速的項目,比如在djay Pro AI音頻剪輯軟件中,M1就能準確識別樂曲中的節拍、鼓點和人聲并支持各自分離重新混音,相對Windows平臺的音頻后期軟件來說準確率要高很多,并且通過滑條的方式進行控制也很直觀。
當然,有受支持的APP就有不受支持APP,如果是通過Rosetta 2編譯后運行的第三方X86設計軟件,因為沒有專用芯片來進行硬件優化,所以工作效率跌幅明顯。
以Blender為例,使用最新的穩定版2.90.1進行云霧效果渲染,因為CUDA、OpenCL、OptiX等硬件加速都無法開啟,因此即便平臺功耗跑到了30W左右、CPU占用率100%、GPU超60%這種接近滿載的情況下,渲染效率依然很低。
在我們的Windows 10對比平臺上,相同設置的渲染效率明顯要高出很多,這就是此前提到的問題所在:當面對沒有專用芯片優化、且并未通過Universal實現原生的第三方高負載APP時,M1的表現會很受限。
打破性能桎梏的片上封裝內存設計
內存性能可以簡單分為帶寬和延遲兩個維度,如果馬力全開,一個3GHz的4核CPU在執行兩個256bit單指令多數據流FMA指令時,數據帶寬的需求是約為2304GB/s,即便是雙通道DDR4-3200內存的帶寬也只有51.2GB/s。
當然,實際應用中除了特殊的測試程序之外,不可能出現全速吞吐FMA指令集的情況,但這個差距依然是十分懸殊,仍有填補的必要。
所以,現代CPU一般會在內核放入大容量緩存來解決這個問題,三級緩存的帶寬是內存的7~8倍,延遲則只有1/5,效率顯然更高。但緩存占據了大量的內核晶體管資源,不可能無節制地增大。
而M1給出的解決方案則退了一步,通過SoC的形式將2顆LPDD44X DRAM直接封裝到M1的基板上,這樣一來,至少相對傳統的插槽或主板焊接而言走線距離短了非常多,進而降低了延遲并降低功耗。
根據已有的資料來看,相對板載方案,傳輸功耗的下降幅度可以達到20倍之多,未來如果能結合HBM2內存顆粒,雙通道的情況下就能實現512GB/s的帶寬,足足是DDR4-3200的10倍。
不過,封裝內存也就意味著完全舍棄了擴展性且容量上限也明顯更低,這就會形成天生的用戶群上限。3款采用M1芯片的Mac產品最大內存容量也不過16GB,macOS可不能像iOS這樣通過殺進程的方式來緩解內存壓力,并行是電腦操作的自然屬性,所以這就注定了至少在M1這個階段,它依然只能在主流定位的產品上找存在感。
但從商業角度來說這個切入點反倒很適用,因為主流即代表高出貨量,這是生態形成和用戶習慣培養的根本,M1必須能打下這個基本盤,ARM在Mac端才能走得更遠。
為什么我們選擇測試Mac mini?
M1芯片的3款機型中,大家可能更關注新款的MacBook Air和MacBook Pro,不過我們知道CPU的性能往往與散熱正相關,相對于以輕薄為主要設計方向的筆記本而言,Mac mini雖然定位迷你,機身只比機頂盒大不了多少,但“瘦死的駱駝比馬大”,厚度依然足足有36mm,是MacBook Pro的兩倍有余,這就為它的散熱設計保留了足夠的余量。
事實上從我們的測試來看,即便是運行需要編譯器編譯的X86高負載應用也沒有出現明顯的噪音,機身發熱也幾乎可以忽略,所以Mac mini是3款M1芯片機型中性能釋放最穩定的一款。
而且作為不需要負擔屏幕、鍵鼠成本的迷你臺式機,Mac mini也將用戶預算壓力控制在了最低水準,可以充分利用已有的或自己更喜歡的周邊硬件來展開工作,視頻輸出可以通過HDMI2.0和1個帶寬達到40Gbps的雷靂/USB4來實現雙顯示器。
除此之外還有1個雷靂/USB4接口,并預留了2個USB-A、千兆有線、3.5mm音頻輸出并支持WiFi6無線協議,對于大多數想要嘗鮮更換Mac平臺的用戶來說,也是目前最實用的方案。
當然,如果是重度外設用戶,接口數量還是相對緊張的。
采用基于ARM架構的電腦處理器方案,也意味著完全打通了iOS和iPadOS生態,畢竟這兩者在各自領域都基本上穩坐頭把交椅。
M1的出現開啟了蘋果電腦、手機、平板生態大一統的開端,未來的走勢就是APP端有著廣泛的三者兼用基礎,上層再發展出各自特化的APP來作為延展區分,這就是蘋果力推M1的市場目的,也是為啥總有人說M1就是強化版A14Z的原因,其實這種說法在我看來確實是有理由的。
將手機、平板、電腦的處理器統一的另一大優勢,就是可充分利用規模效應來降低成本,即便是作為第一代產品的M1也已借由iPhone和iPad龐大的體量收獲了低成本效益。
與采用Core i5處理器的版本相比,同為8GB內存、512GB SSD的配置下M1版Mac mini足足便宜1500元,但基本的日常使用來看幾乎沒有差別,還能依靠專用芯片來給蘋果系APP加上強力Buff,可以說是優點很明顯的產品。香!
責任編輯:tzh
-
處理器
+關注
關注
68文章
19404瀏覽量
230880 -
cpu
+關注
關注
68文章
10901瀏覽量
212738 -
蘋果
+關注
關注
61文章
24465瀏覽量
199631 -
Mac
+關注
關注
0文章
1109瀏覽量
51622
發布評論請先 登錄
相關推薦
評論