關(guān)鍵詞: 平頭哥 , A12X , 仿生芯片
來源:arstechnica.com
5 天前 上傳
報道:文強、三石
【新智元導(dǎo)讀】馬云為何成立“平頭哥半導(dǎo)體”?蘋果2018 iPad Pro便是自研芯片好處的最佳例證。實測之下,A12X仿生芯片各項性能爆表,蘋果芯片團隊更是豪言“在給定的外形尺寸和封裝設(shè)計下,沒人能比我們做得更好”。A12X架構(gòu)究竟如何,為什么蘋果會這么做,又是如何做到的呢?
還記得名震一時的“平頭哥”嗎?
沒錯,說的就是馬云在此前賜名成立的阿里半導(dǎo)體公司。
許是名字的殺傷力太大,反而沖淡了公眾對自研芯片配合自家應(yīng)用強大優(yōu)勢的認知。不過,蘋果最新發(fā)布的2018 iPad Pro及其搭載的A12X仿生芯片,無論是CPU、GPU,還是機器學(xué)習(xí)和神經(jīng)引擎,各項爆表的性能指標,以及只有在A12X 仿生芯片支撐下才得以實現(xiàn)的眾多高端AI應(yīng)用,不難讓人看到了加上了“平頭哥”的阿里動物軍團升級打怪的未來。
平頭哥(蜜獾)號稱“世界上最無所畏懼的動物”
平頭哥半導(dǎo)體技術(shù)負責(zé)人驕旸在接受新智元采訪時曾表示,只有自己內(nèi)部的人才真正懂得內(nèi)部業(yè)務(wù)的需求,從而設(shè)計并提供針對每項不同業(yè)務(wù)都能達到性能功耗比最優(yōu)的硬件。
蘋果的芯片團隊還不止如此,一切的規(guī)劃都從芯片開始,他們會不斷地追問其他團隊:你們到底想要什么,要實現(xiàn)什么功能,瓶頸在哪里,我們?nèi)绾沃圃炫c你們系統(tǒng)完美契合的芯片?
多年來,蘋果對其從底層硬件到頂層應(yīng)用都采取“in-house”的做法諱莫如深。這一次,蘋果硬件技術(shù)部門的 Anand Shimpi 和市場營銷高級副總裁 Phil Schiller 坐下來,與 ArsTechnica 的記者分享了蘋果A12X仿生芯片的細節(jié),以及蘋果內(nèi)部芯片團隊的運作機制。
“芯片團隊是其他團隊的偵探。”Anand Shimpi說。
規(guī)劃從芯片開始,“在給定的外形尺寸、封裝設(shè)計下,沒有人能做出更好、更高性能的芯片。”
A12X仿生芯片全面拆解,爆表式性能碾壓
在介紹蘋果芯片團隊之前,還是讓我們首先來看看他們的最新成果。
全新發(fā)布的 2018 iPad Pro 有許多亮點,但最亮眼的莫過于A12X仿生芯片。蘋果在產(chǎn)品發(fā)布會上展示了A12X芯片的強大:圖像處理性能是A10X的兩倍,速度比8年前發(fā)布的iPad快1000倍,甚至用筆記本電腦這種便攜式PC相比,92%的市售產(chǎn)品都會敗下陣來。
蘋果最新一代的iOS設(shè)備并非完美,但哪怕是最刁鉆的“果黑”,也不得不承認這家公司在移動CPU和GPU方面的領(lǐng)先優(yōu)勢——不是一點點,而是甩開一條街。
所有這些,都歸功于蘋果內(nèi)部自研的定制芯片。實際上,包括FaceID、AR應(yīng)用在內(nèi)的各種2018 iPad Pro高端 AI應(yīng)用,離開了A12X芯片完全沒有實現(xiàn)可能。
但并不是每個人,甚至是iPad Pro針對的“專業(yè)”消費者,都意識到了這個差距。A12X仿生芯片的架構(gòu)究竟是怎樣的?為什么蘋果會這樣做,而它又是如何做到的呢?
5 天前 上傳
下載附件 (1.93 MB)A12X與最貴系列蘋果手機所搭載的A12芯片是密切相關(guān)的。后者采用的是第一款可在消費類設(shè)備中使用的7nm工藝制造芯片,而A12X是首次應(yīng)用于平板電腦。
雖然蘋果公司肯定不會透漏有關(guān)A12X非常細節(jié)的信息,但是根據(jù)Anandtech最近對A12的分析,我們也能知道A12X的大致“輪廓”:
CPU:中央處理器;
GPU:用于處理圖形,從主屏幕的顯示到3D游戲中的效果,再到增強現(xiàn)實應(yīng)用程序的資源;
神經(jīng)引擎:處理神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)相關(guān)的任務(wù);
IMC(集成內(nèi)存控制器):有效地管理進出內(nèi)存的數(shù)據(jù);
ISP(圖像信號處理器):分析拍攝照片時所創(chuàng)建的圖像,并對其進行處理和改進等;
Secure Enclave處理器:處理敏感數(shù)據(jù)(如生物識別標識符),使陌生人無法訪問。
當(dāng)然還有諸如顯示引擎、存儲控制器、HEVC解碼器和編碼器等其它組件。
眾所周知,上述列表中最為核心的組件就是神經(jīng)引擎、CPU和GPU。接下來,我們就對這三個組件進行詳細解讀。
神經(jīng)引擎和機器學(xué)習(xí)
神經(jīng)引擎的設(shè)計目的是加快與機器學(xué)習(xí)相關(guān)的任務(wù)能夠在本地設(shè)備上執(zhí)行,這種方式比在CPU或GPU上執(zhí)行效率更高、性能更高。
事實上,新款iPad Pro的神經(jīng)引擎與前一款完全不同,因為前一款根本沒有芯片。再來看一看蘋果手機,2017年的A11可以每秒處理6000億次操作;2018年的A12 iPhone手機能夠達到5萬億次。
那么問題來了,蘋果為什么如此注重神經(jīng)引擎的構(gòu)建呢?
首先,你需要了解神經(jīng)引擎所應(yīng)用的場景和功能。這些場景和功能包括但不限于:通過iPad Pro中的人臉I(yè)D和TrueDepth傳感器陣列來識別你的面部、掃描圖像并在照片應(yīng)用程序中提供搜索功能、處理語音,以及大量與增強現(xiàn)實相關(guān)的任務(wù)。
A12X的神經(jīng)引擎有8個核心,但蘋果對其架構(gòu)的細節(jié)守口如瓶。根據(jù)Shimpi和Schiller的描述,它不是從蘋果GPU中改編而來的。這種芯片為iPad Pro內(nèi)置的許多功能提供了動力,但第三方應(yīng)用程序開發(fā)人員也可以通過一種名為CoreML的軟件開發(fā)API以各種方式利用它。
5 天前 上傳
下載附件 (19.93 KB)在10月30日發(fā)布新款iPad Pro時,蘋果在臺上討論了A12X和神經(jīng)引擎
值得注意的是,這里的重點是在本地設(shè)備上執(zhí)行機器學(xué)習(xí)任務(wù)。有一種觀點認為,如果某些機器學(xué)習(xí)模型能夠從數(shù)百萬臺正在使用的設(shè)備中提取用戶數(shù)據(jù),并在龐大的云計算網(wǎng)絡(luò)上運行,那么它們將是最強大的。
但蘋果不是這樣做的。它的機器學(xué)習(xí)API允許開發(fā)者在用戶許可的情況下在云中使用機器學(xué)習(xí)模型,但這種云基礎(chǔ)設(shè)施并不是蘋果直接提供的。另一種方法是,蘋果向應(yīng)用程序開發(fā)人員提供Create ML這種工具,可以讓他們在自己的開發(fā)機器上運行模型。
蘋果表示,它并不專注于將用戶數(shù)據(jù)放到云中并在云中運行模型,其原因有二:首先,與競爭對手相比,蘋果把自己打造成一個重視隱私的公司;其次,在本地設(shè)備上運行時,許多其他用例的效率會更高。
正如Shimpi所說:“低延遲非常重要,隱私也非常重要!”
CPU
iPad Pro的CPU有8個核,其中4個核關(guān)注性能,4個核關(guān)注效率。與早期的一些蘋果芯片不同的是,所有的核可以同時激活。
對此,蘋果對外是這么聲稱的:“當(dāng)你運行高線程工作負載時,A12X比A10性能會改進90%;對于單核性能,A12X比A10快35%。”
Ars便對iPad Pro進行了測評,驗證上述“聲稱”是否準確的時刻到了!
首先,我們亮相一下測評中各個設(shè)備情況,如下圖所示:
5 天前 上傳
下載附件 (22.25 KB)測評所涉及的平板及規(guī)格
5 天前 上傳
下載附件 (18.39 KB)測評所涉及的手機及規(guī)格
5 天前 上傳
下載附件 (59.17 KB)測評所涉及的臺式機和筆記本及它們的規(guī)格
接下里便是測評結(jié)果!
5 天前 上傳
下載附件 (38.71 KB)單核/多核,2018iPad Pro與以往iPad及三星Tab S4比較
5 天前 上傳
下載附件 (41.1 KB)單核/多核,2018iPad Pro與MacBook Pro及三星Dell XPS比較
5 天前 上傳
下載附件 (39.34 KB)單核/多核,2018iPad Pro與iPhone及谷歌Pixel比較
從測評結(jié)果來看,單核性能方面并沒有達到35%的提高(但比較接近)。多核的性能也得到了驗證。
iPad Pro的性能超過了我們測試的所有MacBook Pro,除了最近才推出的15英寸MacBook Pro和第8代英特爾酷睿i9處理器。一般來說,這些筆記本電腦的價格是iPad Pro的三倍。
iPad Pro的性能應(yīng)當(dāng)說是“前所未有”的。除了能夠同時使用所有內(nèi)核之外,我們有理由相信A12中的緩存大小(因此很可能是A12X)是驅(qū)動這種性能的一個重要因素。
也可以說,A12X的性能總體上之所以如此強大,部分原因是蘋果的架構(gòu)是優(yōu)化異構(gòu)計算中的一個主控類,即巧妙地使用架構(gòu)良好的專用處理器類型來匹配專用任務(wù)。
雖然A12X與ARM的big.LITTLE架構(gòu)脫不了關(guān)系,但蘋果在此做了大量工作,獲得了其他人無法達到的結(jié)果。
GPU
A12X中的GPU有7個核心,比A10X多了一個核心,可能是由于采用了7nm工藝。但一如既往,核的數(shù)量并不代表一切。
蘋果在GPU方面是這么聲稱的:“這是我們自己定制設(shè)計的GPU的第一個7核實現(xiàn)。每一個核都比我們在A10X中的速度更快,效率更高。你可以獲得2倍的圖形性能提升。這種形式是前所未聞的,堪比Xbox One S的GPU!再強調(diào)一次,它的設(shè)計完全沒有風(fēng)扇!”
話不多說,上結(jié)果!
5 天前 上傳
下載附件 (25.33 KB)Offscreen和Compute方面,iPad Pro與以往版本性能對比
5 天前 上傳
下載附件 (26.53 KB)Offscreen和Compute方面,iPad Pro與MacBook Pro性能對比
5 天前 上傳
下載附件 (24.4 KB)Offscreen和Compute方面,iPad Pro與iPhone性能對比
一般來說,這種GPU在移動領(lǐng)域有巨大的領(lǐng)先優(yōu)勢。
它并沒有不像CPU那樣對筆記本也造成一定影響。不過,它相對于其他移動設(shè)備的優(yōu)勢是顯著的,在以往的iPad Pro和iPhone性能對比中,堪稱無人能及。對此,Shimpi說,“內(nèi)存帶寬是其中的一部分”。
Shimpi指出:“這不僅會影響游戲中的3D圖形,還會影響iOS本身的許多UI效果。不僅僅是關(guān)于峰值內(nèi)存帶寬,而是有效地提供比特。 擁有這個動態(tài)范圍非常重要,因為有時為了提高效率和電池壽命,你需要在性能較低的情況下工作。”
蘋果多次將新款iPad Pro的GPU性能描述得為與Xbox One S相當(dāng)。
圖形性能方面,手機和平板電腦通常不會接近游戲機或游戲PC的性能。 A12X和Xbox One S至少有一個共同之處,那就是它們不適用于游戲PC,但這并不意味著它們在架構(gòu)上與其他方式相似。
A12X在GPU和CPU之間共享內(nèi)存,非常類似于筆記本電腦中的Xbox One或Intel集成的GPU,但與游戲PC中的獨立內(nèi)存不同。
蘋果芯片團隊:在給定的外形尺寸、封裝設(shè)計下,沒人能做出更好的芯片
看到這里,A12X芯片的強大已無需贅言。我們更為關(guān)心的,還是這款強大芯片背后的團隊。
蘋果硬件技術(shù)部門的Anand Shimpi 在接受 ArsTechnica 采訪時表示,“從根本上說,我們制造芯片的原因,是服務(wù)于產(chǎn)品的無限可能(vision and its ambition)。無論設(shè)定的目標是什么,但凡需要定制芯片,我們就一定會把這樣一款芯片做出來。”
“在給定的外形尺寸、封裝設(shè)計下,沒有人能做出更好、更高性能的芯片。”
說實話,用于iPhone的蘋果A11仿生芯片和用于平板的A10X芯片已經(jīng)夠好了,為什么還要提高性能呢?對此,Shimpi 給出了一段激情澎湃的回答:
人們常說,你看看這家公司或那家公司。但我們不;我們真正關(guān)注的只有自己。對手想做什么就讓他們做去,我們只是盡全力做出我們自己所知道的最好的東西。這樣,我們在做的時候,就不用擔(dān)心跟對手相比做得怎么樣。比對手做得好還不夠,我們要不斷超越自己。
我們能做什么?我們還能做什么?當(dāng)你知道你能做出神經(jīng)引擎時,你就會想要做出更好的神經(jīng)引擎!這只會加速,不斷加快組織內(nèi)部的速度。
你的團隊做出了一款超棒的蘋果自己設(shè)計的A系列芯片,好,明年你就想要一款更好的,對吧?那就是我們的激情所在。整個蘋果公司都一樣,不斷超越自己,不用去管別人。
我們不關(guān)心別人在做什么,那些事情我們也不關(guān)心。我們也不在乎比別人落后。落后就落后,落后10倍也無所謂。因為我們的芯片是服務(wù)用戶的,不是用來競爭的。
當(dāng)然,蘋果提升芯片性能的原因肯定不止如此,很明顯,最新版iOS側(cè)重增強現(xiàn)實(AR)功能。如果蘋果能在確保其他方面不落后的前提下,最先建立起世界上最強大的消費者AR平臺,那么未來它的強勢地位就多了一重保障。
至于Mac,為了將蘋果在機器學(xué)習(xí)和人工智能方面的技術(shù)用于Mac,也離不開定制芯片。看英特爾和AMD的芯片路線圖,似乎與蘋果的長期目標有一些明顯不同。部分原因可能是,蘋果的最終目標是為 Mac Platform 制作定制的筆記本或臺式機,以此對抗英特爾的最強芯片。
但蘋果是如何做到這一點的呢?
就像你想的那樣,開發(fā)芯片的過程在發(fā)布產(chǎn)品前很多年就開始了,首先是團隊會議,并討論如何解決特定設(shè)備上的特定用戶問題。雖然沒有提供很多深入的技術(shù)細節(jié),但 Schiller 將其定制芯片的成功歸功于團隊在蘋果內(nèi)部的合作。
芯片團隊是其他團隊的偵探,他們會說,“好,我們來規(guī)劃吧,我們需要更多信息。你們究竟想要什么,想要如何實現(xiàn)這個功能?瓶頸在哪里,我們從哪里開始創(chuàng)建最終與你們系統(tǒng)完美契合的芯片?”
這樣的會議一周會開好幾次,也不是什么年度大型會議,就是確保進度一致。芯片團隊和其他團隊真的每周都聚在一起,討論的問題也越來越多。要討論的東西是沒有止盡的。
多年來,蘋果公司對其如何以及為何能做到這一切的回應(yīng)都歸結(jié)為同樣的觀點。當(dāng)你在公司內(nèi)部做所有事情,從頭到尾整合所有的東西,無論是技術(shù)還是組織,這樣做必然有其優(yōu)勢。
這也可以用來解釋谷歌自研TPU,以及阿里成立平頭哥半導(dǎo)體。
蘋果的CPU在移動方面處于行業(yè)領(lǐng)先地位,但并不完美。蘋果專注于性能,但安卓系統(tǒng)基本上是由高通壟斷。但高通的優(yōu)勢在于連接性(高通的調(diào)制解調(diào)器行業(yè)領(lǐng)先,但CPU不是)。
有趣的是,蘋果一直避諱不談的,是Mac的麥克風(fēng)仍然使用英特爾的芯片。這或許也是阿里投資寒武紀、深鑒和耐能的原因。
雞蛋還是不能放在一個籃子里。
參考鏈接:
https://arstechnica.com/gadgets/2018/11/apple-walks-ars-through-the-ipad-pros-a12x-system-on-a-chip/
評論
查看更多