隨著技術的發展,人工智能(AI)逐步深入到我們的生活,徹底改變我們的世界。智能手機圈已經掀起了人工智能處理器的浪潮,可以說是智能手機新一輪的重大革新。
今年九月份的2017德國柏林國際消費類電子產品展覽會上,麒麟970引爆了全球的注意力,其創新的HiAI移動計算架構和領先的AI運算能力讓未來手機有了更大的想象空間。
最近幾年麒麟芯片表現強勁, 從2004年至今,看看華為,看看海思是怎樣從零開始創造出麒麟系列芯片,成為傳奇地在壟斷的行業殺出自己的一片天空的。
麒麟芯片發展史
我們在價值平衡上,即使做成功了,(芯片)暫時沒有用,也還是要繼續做下去。一旦公司出現戰略性的漏洞,我們不是幾百億美金的損失,而是幾千億美金的損失。我們公司積累了這么多的財富,這些財富可能就是因為那一個點,讓別人卡住,最后死掉。……這是公司的戰略旗幟,不能動掉的。
——任正非
2004年,***高瞻遠矚,大手一揮,華為要做自己的手機芯片。于是創立于華為集成電路設計中心改制成為海思半導體有限公司。 如今華為和榮耀所獲得的成功,有海思一半的功勞。
2009年,K3v1發布,這是海思成立以來,發布的第一款智能手機芯片。由于第一款產品還有一些不成熟,注重品質的華為最終沒有讓這款芯片走向市場。但是這款芯片無疑在關鍵的節點邁出了歷史性的一步,要知道2009年iphone才出到3gs,智能手機市場方興未艾。
2012年,華為發布了K3v2芯片。這款芯片采用了1.5GHz主頻四核Cortex-A9架構,集成GC4000的GPU,并且使用了40nm的工藝制程制造。這款芯片用在了華為P6和Mate 1上,這是海思芯片第一次商用,也是第一次將自研芯片用在自家手機上。
當時的P6可以說是相當驚艷了,極輕薄的機身,極低的重量,極高的性價比造就了當年的神機。
時間到了2014年初,經過多年的技術沉淀以及兩年的商業磨礪,海思芯片迎來了爆發的兩年。
那時,麒麟910發布。海思也終于確定了麒麟+數字的命名規則。
麒麟910采用了1.6GHz主頻四核Cortex-A9架構和Mali-450MP4 的GPU,使用了28nm HPM制程,首次集成自研的Balong710基帶,首次集成了華晶Altek的ISP。
麒麟910不僅放在了P6的升級版P6s中,還陸續成為華為Mate 2、惠普Slate 7 VoiceTab Ultra等設備上,成為他們強勁的心臟!
同年,麒麟910的升級版910T發布。搭載著這款升級心臟的華為P7一舉斬獲700萬銷量。
依舊是2014年,隨著榮耀6的發布,我們看到了一個全新的麒麟系列芯片——麒麟920。這是全球首款LTE CAT.6的芯片,性能極其出眾。
麒麟920采用4×A15 1.7GHz+4×A7 1.3GHz和Mali-T628MP4 GPU,以及使用28nm HPM工藝制造,集成了音頻芯片、視頻芯片、ISP,集成自研全球第一款LTE Cat.6的Balong720基帶。這時候人們才驚嘆,原來不可能的事,終于被華為做成了。
同年9月,920的升級款,麒麟925發布。集成了被命名為“i3”協處理器的麒麟925,在華為Mate 7和榮耀6 Plus身上大放異彩,并幫助華為Mate 7在國產3000價位上高端旗艦的歷史,全球銷量超750萬。
2014年的最后一個季度,不僅有高端市場的麒麟928,還有面向中端市場的麒麟620。這充分說明了海思的綜合實力已經達到了一個極高的水準,不僅能飚性能,還能做出功耗更加平衡的中端芯片。
值得一提的是,麒麟620不僅是海思旗下首款64位芯片,更集成了集成自研Balong基帶、音視頻解碼等組件。正是這些優秀的特質,讓搭載了麒麟620的榮耀4X成為了整個華為系(華為+榮耀)第一款銷量破千萬的神機。隨后,同樣搭載這款芯片的榮耀4C和華為P8青春版銷量也先后突破千萬大關。
時間悄悄來到2015年,麒麟先后發布了930/935/950,散熱、能耗比和時間差,是這一年海思的關鍵詞。930/935時代,憑著極其精準的選擇,海思避開了發熱/不成熟的A57構架,選擇了高能耗比的A53構架,獲得了無數消費者的贊譽。
950時代,海思又毫不猶豫地作為第一個吃螃蟹的人,采用了A72構架和Mail-T880芯片。當然,收獲的是性能飆升,和業界的一片贊譽。
2016-2017年上半年,是華為和榮耀進入王朝盛世的兩年,麒麟955助力華為P9成為華為旗下第一款銷量突破千萬的旗艦手機;麒麟650作為一款中端芯片,是海思第一款集成了CDMA全球通基帶的SoC芯片;麒麟960不僅解決了CDMA基帶問題,還極大地提升了GPU性能,成就了榮耀V9的“性能怪獸”之名。
一路走來,海思一步一個腳印,踏踏實實從無到有,在這個原本空白的領域創造了屬于中國人的一片天空。
2017年9月,麒麟970閃耀登場, 劃開人工智能大幕的手機芯片。
麒麟970
1、全球第一枚集成NPU神經網絡單元的移動芯片
麒麟970是華為首款人工智能移動計算平臺,并且是全球首個集成獨立AI人工智能專用NPU神經網絡處理單元的移動芯片,所采用的是創新的HiAI移動計算架構。
所謂的HiAI移動計算架構,主要有四部分組成,CPU、GPU、ISP/DSP和NPU。作為全球第一枚集成專用NPU的移動芯片, NPU神經網絡單元在HiAI架構下AI性能密度大幅由于CPU和GPU,能夠用更少的能耗更快的完成更多任務,大幅提升芯片的運算效率。
更具體來說,在16位浮點數(即FP16)時,麒麟970內置的NPU運算能力達到1.92 TFLOPs,在AI人工智能深度學習下,所有硬件能夠協調芯片內部的各個組件及手機硬件,如ISP、DSP,保持處理某些特定任務時,提升速度并低功耗運作。例如有了NPU的加成,在圖像識別任務上,對比Cortex-A73 CPU 性能提升25倍,能效提升50倍之多,拍攝1000張照片僅僅消耗4000mAh電池手機0.19%的電量,圖像識別速度可達到約2000張/分鐘。
相比之下,三星S8使用CPU處理每分鐘僅95張,蘋果iPhone 7 Plus同時使用CPU和GPU,每分鐘也僅能識別487張,華為完勝。
麒麟970有了NPU單元之后,至少在拍照和圖像處理上,比之前單純依賴CPU和GPU要快得多。而對于競爭對手,麒麟970最直接的就是保持高效率,并且更加的省電。未來AI獨立單元內置于芯片一定是趨勢,蘋果也在做,只是華為搶先開了個頭,據說拿到了中科院寒武紀授權的AI指令才加速了研發。當然了,所謂的AI加持提升多少運算處理效率,目前并沒有統一標準進行衡量,只能聽華為官方的舉例來解釋。
無論如何,在AI人工智能芯片領域,FP16和FP8已經變得越來越重要,因為神經網絡使用十進制數作為計算矩陣的一部分,然而這些浮點數不需要那么精確,這意味著FP16和FP8比一個完整的32位或64位浮點數更重要。
按照華為的說法,AI芯片能夠以人類的思考方式來理解人類訴求,具備高處理速度,高密度和高能效比,而麒麟970只是個開始,并超越競爭對手。余承東表示,麒麟970更快,更強,更聰明,更出色帶來了人工智能時代下的嶄新體驗,展望智能手機的未來,我們正處于一個激動人心的新時代開端,“移動AI=設備AI+云AI”,未來智能終端將能夠看懂、聽懂,更了解你,能夠思考更懂你,能夠對話以更好的服務你。
2、CPU無提升令人失望,GPU難得首發了Mali-G72
麒麟970采用的是臺積電的10納米工藝制程打造,在約100平方毫米的狹小體積內集成了55億個晶管體。相比之下,競爭對手高通當下最強旗艦芯片驍龍835集成的晶體管數量是31億,而蘋果A10則是33億。
CPU部分,麒麟970與上一代麒麟960一樣為八核心設計,由4個主頻為2.4GHz的Cortex-A73大內核與4個主頻1.8GHz的Cortex-A53內核組成,性能上無變化,畢竟同樣架構頻率,傳聞所說的2.8GHz主頻吊打驍龍835并沒能實現,但跑分上追平驍龍835應該沒問題,并且得益于10納米工藝的進步能效提升20%。
GPU圖形處理器單元部分,華為麒麟970全球首發了ARM的Mali-G72 MP12,12個核心,這是華為首次上兩位數核心的GPU了,圖形處理性能相比960強很多,性能提升幅度達到20%,同時能效還降低了50%。
整體看完CPU和GPU,其實麒麟970在功耗方面進步不大,麒麟960高功耗的問題沒有通過10納米得到徹底解決。因為按照正常芯片的更新換代,必定有性能提升功耗下降的進步,而麒麟970的CPU性能未能得到提升的情況下,也僅降低了20%功耗。如此來看,加入NPU單元的確是華為本次升級工作的重點了,而不是搶先冒險用上ARM今年早些時候發布的A75和A55架構。
3、全球領先的4.5G網絡基帶,還支持UFS 2.1
華為還全球首發了“4.5G,Pre 5G”調制解調器,支持LET Cat 18通信規格,下行峰值速度最高可以達到1.2Gbps,其他參數還包括有4X4 MIMO、5CC CA和256QAM,支持雙卡雙VoLTE。這一調制解調器能夠在全球范圍內實現各運營商的高速率組合,華為經過了40萬公里的高鐵測試,因此在高鐵上也能保持穩定的下載速率,再也不用擔心坐高鐵掉網“***”。
麒麟970提供雙ISP圖像處理單元和Image DSP信號處理單元,得益于更加強大的算法優化和AI神經網絡輔助下,吞吐量增加25%,支持AI場景識別、人臉追焦、智能運動場景檢測,同時夜拍效果提升。所以,發布會上余承東展示了搭載麒麟970芯片的設備,在拍照上日常吊打三星的Galaxy S8。
另外,麒麟970集成有最新的i7協處理器,視頻解碼支持4K HDR10格式,內建TEE和inSE安全引擎,擁有更高的安全性集成HiF級硬盤芯片,支持音頻流高達384KHz/32bit母帶級別音質。需要注意的是,華為官方參數標明,麒麟970不僅最高支持LPDDR4X內存,而且還支持UFS 2.1閃存儲存,未來推出的麒麟970設備時候是否還混用eMMC閃存就不清楚了,畢竟上一代麒麟960也支持UFS 2.1。
華為麒麟970與蘋果A11處理器的終極PK
華為和蘋果在智能手機AI芯片領域上已經先行了一步。華為的麒麟970處理器擁有一個專門的神經處理單元(NPU)。蘋果將自己最新的處理器命名為A11Bionic,主要就是因為內置了人工智能“神經引擎”。這兩家公司走在了智能手機AI芯片的應用前列。究竟智能手機AI芯片“雙龍”的策略和布局又是如何的呢?
華為麒麟970處理器先于蘋果A11 Bionic發布,成為世界首款帶有獨立NPU專用硬件處理單元的手機芯片, 那么這兩款先后誕生的AI手機芯片有何異同?首先,從AI模塊的部分來看,華為和蘋果都選擇了ASIC方式來實現。為了應對不同AI應用場景下的需求,目前AI芯片領域分為幾個流派:并行計算能力和功耗一樣高的GPU、可重新定義內部電路連接的FPGA、深度定制的ASIC。這幾種技術流派各有優勢之處。
相比之下,雖然設計的時間比較長,但ASIC加速器的速度會比用同樣工藝FPGA加速器速度快5~10倍,在功耗上也遠遠優于GPU,而且一旦量產后,ASIC的成本會遠遠低于FPGA方案。華為和蘋果在這一點上不謀而合,均選擇了ASIC方式,可見雙方規劃、眼光均一致,也都早于同行發力AI。
第二,在性能方面,麒麟970的HiAI架構首次集成了NPU專用硬件處理單元,帶來領先的AI運算能力,讓智能手機真正進入AI時代。蘋果同樣采用了專用的神經網絡引擎(Neural Engine),但并非專用NPU。
對比來看,華為第一次在移動設備層面把神經網絡模型的硬件計算加速能力融入芯片中。這也是業內第一次在手機芯片中出現了專門用于人工智能計算的處理單元。HiAI架構通過更高效靈活的異構計算來最大化發揮CPU/GPU/ISP/DSP/NPU的性能,其加速性能和能效比大幅優于CPU和GPU。例如,作為專門為深度學習定制的模塊,麒麟970每分鐘可以識別2005張圖片,而如果用CPU每分鐘只有95張,前者比后者多了20倍。
第三,從芯片集成度來看,麒麟970采用了最新的TSMC 10nm工藝,集成了55億個晶體管。蘋果A11 Bionic同樣采用TSMC 10nm FinFET工藝,集成了43億個晶體管。但其只是AP,如果加上基帶的約10億個晶體管(以規格領先的高通基帶X16為例),則是53億個晶體管。
從晶體管數量來看,兩者相差不大,但是麒麟970實現了更多的功能。例如在通信方面,這可謂是華為的看家本領,麒麟970實現了全球最先進的規格Cat18/Cat13,使用4*4MIMO、5CC CA以及256QAM等多種先進技術,將碎片化的頻譜聚合成為最大帶寬,聚合峰值能力最高可達到1.2Gbps的下載速率,再次刷新了移動互聯網聯接的最快速度;而iPhone8 和iPhone X的通信規格卻無從知曉,有人說是Cat9, 峰值下載速率是450Mbps。即使是高通當前商用的最先進的基帶X16,也只是Cat16,峰值下載速率是1.0Gbps。同時,麒麟970率先商用雙卡雙4G雙VoLTE,成功實現了一部手機上兩張SIM卡均支持4G VoLTE通話,提供主副卡一致的高清語音、視頻通話體驗。這方面麒麟970也要優于蘋果A11。
因此相較而言,兩者面積相當,晶體管數量相當,麒麟970性能更優、體驗更佳。
第四,在應用和生態方面,分屬安卓陣營和iOS陣營的麒麟970和蘋果A11 Bionic也各有特色。應用方面,蘋果的AI技術更偏向酷炫,主要用于Face ID,拍照時的場景識別,以及Animoji等應用,應用面較窄,而且應用開發環境也相對封閉。華為則更注重務實,應用場景也相對更豐富。加入HiAI移動計算構架之后,使傳統攝影進入智能攝影階段,越用越聰明。在語音方面,利用人工智能的硬件與軟件相結合,通實現實時文字交互翻譯和識圖翻譯,也可方便地進行面對面的語音翻譯,并且通過AI芯片加速具有學習能力,會越用越聰明。
雖說華為麒麟970和蘋果A11 Bionic為AI芯片應用的落地奏響了號角,但是這一領域的創新涉及到人工智能算法、編程語言、計算機體系結構、集成電路、半導體工藝等多方面,絕不是一蹴而就的事情。
伴隨著AI芯片市場多樣化發展的,還要各種亟待解決的瓶頸。目前技術方面的挑戰在于算力提升、算法優化、功耗降低以及更好地集成等方面,未來還將會遇到安全問題。衡量AI芯片計算性能的一個重要指標稱為算力。通常而言,將每秒所執行的浮點運算次數(亦稱每秒峰值速度)作為指標來衡量算力,簡稱為FLOPS。在本已寸土寸金的手機SoC中,再加入NPU或者其他AI模塊,這對芯片架構設計復雜性、成本、系統集成帶來的軟件架構等方面都提出了更大的挑戰。
-
智能手機
+關注
關注
66文章
18543瀏覽量
180806 -
華為
+關注
關注
216文章
34530瀏覽量
252618 -
蘋果
+關注
關注
61文章
24465瀏覽量
199586 -
手機芯片
+關注
關注
9文章
370瀏覽量
49061
原文標題:麒麟970到底有多牛?
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論