色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度解析Neoverse V1對Arm的重要意義

電子設計 ? 來源:ednchina ? 作者:邵樂峰 ? 2021-05-19 17:49 ? 次閱讀

2018年10月,Arm首次宣布推出面向云到邊緣基礎設施產品Neoverse及其初步路線圖,并承諾平臺效能30%的年增長率指標將持續到2022年及以后。

根據Neoverse平臺PPA設計原則,N系列強調性能、功率、面積得到同等考量,擅長可擴展;E系列主要關注效率,對于網絡流量和數據應用程序非常有效,在功耗和面積的縮減上進行優化;V系列旨在提供最佳性能,需要添加更大的緩存、窗口和隊列,相對來說會消耗更多面積和功耗。如果客戶更看重線程需求,N系列就比較合適,假若客戶需要高性能計算工作負載,V系列就能提供更大的價值,這完全取決于客戶在功耗、性能、面積上的需求與配置。

o4YBAGCk3ZOAPvG9AASLiRlLuME833.png

圖1:Neoverse平臺PPA設計原則

最早的“Cosmos”平臺基于16nm工藝,采用A72、A75核心,在當時公布的路線圖中,Arm就提出了每年每代產品30%的性能提升目標。2019年初,N1和E1平臺公布,相比“Cosmos”,N1單線程性能提升了60%,超出預期一倍,云端負載性能提升2.5倍;E1吞吐量性能提升超過2.7倍,吞吐效率提升超2.4倍,計算性能提升超2倍。

o4YBAGCk3a2AO4UsAALzs5EgJTc364.png

圖2:2019年推出的N1平臺相比“Cosmos”單線程性能提升了60%

圖3和圖4分別展示了N1的公開測試數據,以及基于傳統架構的機架與基于ArmNeoverse機架的數據對比。可以看出,無論是在存儲、移動還是計算數據領域,N1都表現出了優良的性能。而且在同為標準42U機架和12.5KW功率條件下,ArmNeoverse平臺提供了更高的整數吞吐量和單線程性能,使得云服務商得以在單個機架上托管更多客戶,從而帶來更高收入和更多計算周期。

o4YBAGCk3b2AeAUwAAWGrtsfwPU699.png

圖3:N1性能測試數據

o4YBAGCk3cuAWrf8AAT-9ItB8Dw789.png

圖4:基于傳統架構的機架與基于ArmNeoverse的機架對比

開啟終極性能之路

兩年后,也就是2020年9月,Neoverse家族宣布再度進階,新增兩個全新的平臺—NeoverseV1平臺以及第二代N系列平臺NeoverseN2。日前,Arm基礎設施事業部高級副總裁兼總經理ChrisBergey則公開了V1和N2平臺的更多產品細節。

o4YBAGCk3dyATnOGAAcFEVg-Hug372.png

圖5:ArmNeoverse平臺路線圖

NeoverseV1作為V系列的第一個平臺,主要面向7nm和5nm工藝而設計,是Arm強調性能優先的新型計算系列的第一個平臺。與N1相比,V1支持256位寬度的向量,帶來了50%的性能提升、1.8倍的矢量工作負載優化、以及4倍的機器學習工作負載優化,適用于高性能計算、高性能云和機器學習處理等對CPU性能與帶寬有更高要求的應用。

pIYBAGCk3fmAFQqUAAgGbV9ZFwo494.png

圖6:NeoverseV1性能詳述

值得一提的是,V1是Arm第一個支持可伸縮矢量擴展(ScalableVectorExtensions,SVE)的處理器平臺。SVE可基于未知寬度向量單元的軟件編程模型執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令,從而確保軟件編碼的可移植性與使用壽命,并兼顧高效的執行。

pIYBAGCk3gmAAFn-AAQuFBvsTVQ012.png

圖7:V1是Arm第一個支持SVE的處理器平臺

開發者而言,SVE架構的好處在于能夠幫助他們在寄存器寬度之間無縫轉換,也就是說,開發者們既可以合并新的寬向量SVE指令,也可以重新使用為較小的寄存器編寫的輔助函數。富士通A64FXCPU就是一個很好的例子,在執行SVE代碼時,他們可以完全控制SVE電壓和頻率轉換,確保其可以全天全頻率運行。

Chris說,Arm現有的SIMD指令集NEON難以對某些代碼進行矢量化處理,而SVE可以直接取用相同的代碼,并很好地對其進行自動矢量化,相比于NEON,可提升將近3.5倍的處理速度。由于SVE與矢量長度無關,因此相同的代碼可以不加修改地在V1上運行。另外,如果在V1上加倍SVE矢量的寬度,對應的處理速度也幾乎提速一倍。

當然,SVE也為HPC提供了一種新的高性能且對開發者友好的編程功能。

今年4月,印度電子信息技術部MeitY宣布其百萬兆級高性能計算CPU設計將采用NeoverseV1平臺,使之成為繼法國芯片初創企業SiPearl和韓國電子通信研究所ETRI之后,第三家公開支持通過NeoverseV1驅動百萬兆級高性能計算SoC的Arm合作伙伴。

除此之外,Chris還分享了其他合作伙伴在基礎設施市場的最新進展,包括:

. Marvell發布了基于NeoverseN2的OCTEON系列網絡解決方案,并預計于2021年底前試產。相較于前一代的OCTEON解決方案,其性能提升高達3倍。

. 甲骨文計劃在Oracle云基礎設施上采用AmpereAltraCPU,為各種工作負載提供最佳的性價比。

. 由Arm技術驅動的AWSGraviton2通過穩定的增長與區域擴展,正持續快速地擴張其EC2的覆蓋。

. 阿里云在即將上線的基于Arm架構ECS實例上完成了測試,結果顯示在SPECjbb的測試數據中獲得了驚艷的表現,且基于Arm架構運行的DragonWellJDK性能提高了50%。

阿里巴巴首席工程師周經森(KingsumChow)稱,公司現有的軟件里會有兩個考慮的點,一個是有些軟件是需要重新編譯的,另外一種不需要重新編譯,只需要把Javaapplications在JVM(JavaVirtualMachine)上跑好就可以了。過去一年里,雙方從JDK8到JDK11,通過OpenJDK,通過阿里巴巴Dragonwell(OpenJDK的一個發行版),就把現有一些Java應用的一些性能提高了50%。

. 騰訊在硬件測試和軟件支持方面持續投入,使其在云應用上能采用ArmNeoverse技術。

騰訊專項測試技術中心總監黃聞欣(VictorHuang)表示,去年,騰訊和Arm正式簽署了一份合作協議,希望通過合作加速ArmNeoverse技術的測評和適配。之后通過TencentBench測試框架發現,得益于更多可擴展的CPU核心數,Arm服務器比傳統的服務器性能表現更強勁。非常值得一提的是,其在AI推理和圖片處理領域優勢非常明顯。

“我們認為單核性能、功效以及對新SVE矢量擴展的支持是合作伙伴選擇V1的主要原因。與富士通的A64FX一樣,這些設計凸顯了高性能計算SoC的發展趨勢:即利用SVE、高帶寬DDR5和HBM內存以及其他專用處理能力的整合,打造出百萬兆級的CPU?!盋hris說。

N2被定位為可提供更高性能計算的解決方案,用來滿足橫向擴展的性能需求,其用例可橫跨云、智能網卡(SmartNIC)、企業網絡到功耗受限的邊緣設備。同時,N2也是第一個基于Armv9架構的平臺,在安全性、能耗以及性能方面都有全面的提升。N2面向5nm工藝而設計,支持PCIe5.0和DDR5,通過支持用于高帶寬存儲器的HBM3以及用于結構的CCIX2.0和CXL2.0來進一步擴展。此外,相比于N1,N2在保持相同水平的功率和面積效率之余,單線程性能提升了40%,在云端上提升1.3倍的NGINX,在5G和邊緣應用上提升1.2倍的DPDK數據包處理。

o4YBAGCk3heAelgIAAhV6hMQruM860.png

圖8:NeoverseN2性能詳述

5G無線接入網RAN是N2的一個典型應用。使用5G時,網絡資源會被池化為射頻單元RU、分布式單元DU和中央單元CU,對于每個單元而言,提供正確的計算以優化性能指標(例如在緊湊功率范圍內的帶寬和吞吐量)的能力至關重要。盡管網絡上層日趨云端化,但下層卻需要借助專用處理器和加速器來實現軟件和硬件的正確組合。所以除了數據中心,隨著網絡虛擬化和容器化程度不斷提高,加上安全性和存儲等功能也被卸載以換取性能和效率,智能網卡或DPU在網絡中正變得越來越重要。

NeoverseN2還是第一個具備SVE2功能的平臺,該功能可為云到邊緣的性能效率帶來巨大的提升。在諸如機器學習、數字信號處理、多媒體和5G等廣泛應用場景中,SVE2除了帶來大幅性能提升外,還帶來了SVE具備的編程簡易性及可移植性等優勢。

pIYBAGCk3iaADM1VAAaAHshDJjY372.png

圖9:SVE2指令集

SVE和SVE2都屬于與矢量長度無關的指令集,用戶只需編寫、編譯一次代碼,即可在各種多樣的硬件上運行,同時還能充分利用可用的矢量帶寬。但與SVE加速HPC相比,SVE2將應用場景擴展到ML、DSP、多媒體和5G等更廣闊的市場,它融合了NEON豐富的數據操作、邏輯和算術指令集,以及SVE自動矢量化和可擴展性等功能。

下圖中,X軸代表芯片級性能,Y軸代表每線程性能??梢钥闯?,在128核/128線程下,N1在芯片級吞吐量和單線程性能方面都達到領先,N2性能更強,代表著最高單芯片性能;V1在96核96線程下擁有最高單線程性能,意味著可以在核心數更少的情況下發揮更好的性能。

pIYBAGCk3jaAGo-lAAb5Lr2krvg817.png

圖10:NeoverseN1/N2/V1芯片級性能/單線程性能

除了處理器內核,Arm還為合作伙伴提供可擴展性的交換網,用以支持大量的處理器核。同時,針對加速器的緩存一致性互聯(CCIX)與開放互聯技術(CXL)的投資則可以確保其生態系統得以快速且高效地推出相關的技術。

基于CMN-600,ArmCMN-700Mesh互連技術在每個矢量上進一步提升了性能——從內核的數量和緩存的大小,到附加內存和IO設備的數量和類型。對于基于V1的HPC平臺而言,支持高帶寬DDR5和HBM內存系統至關重要,而CMN-700恰好可以實現這一點。

o4YBAGCk3kaAdhD-AAtBHcIJZXA724.png

圖11:ArmCMN-700Mesh互連技術

CMN-700的另一個關注重點是對多芯片功能的助益,以便為數據中心資源池化的增長提供更多的定制選項。CMN-700中還增加了CXL功能,可為內存擴展和智能一致性加速器,構建主機或端點設備。

多芯片功能的另一項重要升級是,針對傳統多插槽設計和新的芯片集或多芯片集成提高性能和優化功能,多芯片集成將為突破傳統的硅掩模版限制提供新的機遇,并為緊密耦合的異構計算提供更大的靈活性。

打造“裝機即用”的軟件生態

軟件生態方面,Arm通常將軟件分為兩種類型:一是云原生軟件,二是傳統企業級軟件。

ChrisBergey說云原生軟件是Arm一直以來相當重視的領域,擁有最大的持續集成/持續交付(CI/CD)平臺,并在大多數編程語言的生態環境中扮演著核心角色。以AWSGraviton2為例,當前用戶在Graviton2上部署的軟件將有更多選擇,云原生容器安全性、托管持續集成/持續交付、下一代防火墻也得到了持續更新,Graviton2也為Redis、Memcached、Elasticsearch等關鍵工作負載提供了性能優勢。

pIYBAGCk3laAfqOzAAcqtbur6iw838.png

圖12:AWSGraviton2性能優勢明顯

最近,Formula1就表示,相較于其他競品,C6g和C6gn實例讓他們的計算成本降低了40%。因此,Formula與Twitter、Snap、Lyft和Netflix等公司共同成為了Graviton2的用戶,他們都通過Graviton2的使用,取得巨大的價格和性價比優勢。

pIYBAGCk3m6ANronAAXuXOt9BIo829.png

圖13:構建軟件生態

在談到邊緣和物聯網基礎設施時,Chris認為“異構且多樣化”正成為該領域最為顯著的特征之一,但由于碎片化,它也可能在跨各種Arm平臺上實現云原生堆棧的無縫托管時造成阻礙。

為了應對這一挑戰,Arm在2019年推出了ProjectCassini項目,旨在確保在多樣化且安全的邊緣生態系統中提供云原生體驗,并聚焦三個方向進行開展:平臺標準和參考實施、邊緣安全性以及云原生堆棧。Arm希望能夠為軟件開發者提供流暢的體驗,通過標準、平臺安全性與參考實施,讓行業伙伴對在Arm平臺上部署“裝機即用”的軟件充滿信心。

o4YBAGCk3nuAWfvbAAa8WiQBhLA410.png

圖14:ArmProjectCassini項目

為了凸顯Cassini項目的成效,Arm以沃達豐的通用客戶端設備uCPE概念驗證作為示例:傳統的客戶端設備已部署為具有緊密耦合的專有硬件和軟件的固定功能網絡設備,而uCPE的設計用意,就是要通過將軟件與硬件解耦,并在開放式商用硬件上運行現代云原生軟件,以達到取而代之的目的。Arm與沃達豐及其他合作伙伴共同展示uCPE可以同時運行虛擬化和容器化的網絡功能,并且與傳統供應商相比可節省大量電力,這能讓運營商降低成本、提高能效,并加快用于軟件定義廣域網SDWAN、防火墻和其他連接服務的網絡設備性能。

而在傳統企業軟件領域,“軟件即服務”(SaaS)正成為顯著趨勢。由于在Arm架構之上能夠創造非常有利的軟件即服務產品,因此很多獨立軟件開發商(ISV)開始對Arm表現出濃厚的興趣,在中國市場尤其顯著。目前,包括Xen、KVM、Docker容器以及越來越多的Kubernetes在內的基礎軟件都已經陸續宣布支持Arm架構,許多初期由Arm推動的開源項目正在變得自主運轉。

編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9164

    瀏覽量

    368584
  • 物聯網
    +關注

    關注

    2912

    文章

    44912

    瀏覽量

    375872
  • 5G
    5G
    +關注

    關注

    1356

    文章

    48503

    瀏覽量

    565498
收藏 人收藏

    評論

    相關推薦

    Arm Neoverse如何加速實現AI數據中心

    在快速演進的云計算和人工智能 (AI) 時代,企業需要能助力其優化性能、降低成本并在市場競爭中保持領先的方法。Arm Neoverse 已成為眾多前沿企業的選擇,他們希望在推動創新的同時,能夠顯著
    的頭像 發表于 11-26 09:30 ?375次閱讀

    基于高通主板的ARM架構服務器

    參考架構,2020 年衍生出 E、N、V 系列,近期推出 Neoverse V2、V1、N2 平臺。V1 單線程性能提升超 50%且
    的頭像 發表于 09-11 10:53 ?582次閱讀

    ARM進軍汽車芯片市場,推出Neoverse設計

    近日,全球知名的移動芯片設計公司ARM宣布邁出重大步伐,正式推出專為汽車領域設計的芯片——Neoverse。這一創新不僅展示了ARM在芯片設計領域的領先地位,也為汽車行業帶來了前所未有的機遇。
    的頭像 發表于 05-20 10:46 ?740次閱讀

    SiPearl更新Rhea1處理器規格,聚焦HPC與AI推理應用

    據了解,Rhea1處理器將與英偉達GH200 Grace Hopper超級芯片共同為歐洲首臺E級超算JUPITER提供計算能力,原本計劃搭載72個Arm Neoverse V1 “Ze
    的頭像 發表于 05-15 11:41 ?414次閱讀

    SC171開發套件V1 技術資料

    SC171開發套件V1 技術資料 課程類別 鏈接 硬件平臺介紹及使用(SC171開發套件V1 ) https://bbs.elecfans.com/jishu_2421547_1_1.html 安卓
    發表于 05-09 17:58

    ArmArm Neoverse計算子系統(CSS):Arm Neoverse CSS V3和Arm Neoverse CSS N3

    Neoverse計算子系統(CSS)包括Arm Neoverse CSS V3和Arm Neovers
    的頭像 發表于 04-24 17:53 ?1156次閱讀
    <b class='flag-5'>Arm</b>新<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>計算子系統(CSS):<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3和<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺已成為云服務提供商優化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse
    的頭像 發表于 04-16 14:30 ?707次閱讀

    Arm Neoverse CSS V3 助力云計算實現 TCO 優化的機密計算

    的全場景基礎設施用例提供高性能和出色能效。針對需要更高性能的工作負載和用例,Arm 推出了 Neoverse V 系列。其中,Neoverse V
    發表于 03-26 16:37 ?398次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3 助力云計算實現 TCO 優化的機密計算

    Neoverse CSS V3助力云計算實現TCO優化的機密計算

    Arm Neoverse 旨在為從云到邊緣的全場景基礎設施用例提供高性能和出色能效。針對需要更高性能的工作負載和用例,Arm 推出了 Neoverse
    的頭像 發表于 03-14 12:13 ?566次閱讀
    <b class='flag-5'>Neoverse</b> CSS <b class='flag-5'>V</b>3助力云計算實現TCO優化的機密計算

    Arm Neoverse CSS N3助力快速實現出色能效

    從云到邊緣,Arm Neoverse 正憑借出色的性能、效率、設計靈活性和總體擁有成本 (TCO) 優勢,革新傳統基礎設施芯片領域。
    的頭像 發表于 02-29 13:36 ?469次閱讀
    <b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b> CSS N3助力快速實現出色能效

    Arm發布Neoverse V3和N3 CPU內核

    在計算市場持續迎來變革的背景下,Arm公司發布了其最新一代Neoverse CPU內核設計,分別為Neoverse V3(代號Poseidon)和N3(代號Hermes),兩款內核將為
    的頭像 發表于 02-27 09:27 ?1071次閱讀
    <b class='flag-5'>Arm</b>發布<b class='flag-5'>Neoverse</b> <b class='flag-5'>V</b>3和N3 CPU內核

    Arm發布新一代Neoverse數據中心計算平臺,AI負載性能顯著提升

    據公開信息顯示,Arm去年推出的Neoverse CSS運算子系統提供了包含處理器設計的預驗證平臺,加快了定制SoC上市進程,首發型號為Neoverse CSS N2。
    的頭像 發表于 02-22 14:48 ?748次閱讀

    FunASR語音大模型在Arm Neoverse平臺上的優化實踐流程

    Arm 架構在服務器領域發展勢頭前景看好。目前已有許多頭部云服務提供商和服務器制造商推出了基于 Arm Neoverse 平臺的服務器產品
    的頭像 發表于 02-22 13:41 ?2676次閱讀
    FunASR語音大模型在<b class='flag-5'>Arm</b> <b class='flag-5'>Neoverse</b>平臺上的優化實踐流程

    Arm 更新 Neoverse 產品路線圖,實現基于 Arm 平臺的人工智能基礎設施

    新聞重點: Arm 宣布推出兩款基于全新第三代 Neoverse IP 構建的新的 Arm Neoverse 計算子系統 Arm
    發表于 02-22 11:41 ?424次閱讀

    全志A527主板規格書-V1

    全志A527主板規格書-V1
    發表于 01-26 15:49 ?28次下載
    主站蜘蛛池模板: 最近中文字幕完整版高清 | 翁公吮她的花蒂和奶水 | 视频在线免费观看 | 亚洲精品福利一区二区在线观看 | 老板揉搓秘书丰满大乳 | 羽月希被黑人吃奶dasd585 | 美女脱衣服搞鸡 | 国产成人精品自线拍 | 亚洲影院在线播放 | 国产Av男人的天堂精品良久 | 欧美日韩久久久精品A片 | 亲胸摸下面激烈免费网站 | 第一次处破女18分钟免费 | 国产毛片AV久久久久精品 | 亚洲欧美人成视频在线 | 伊人久久大香线蕉综合网站 | 久啪久久全部视频在线 | 久久re这里精品23 | 国产精品久久人妻无码网站一区L | 国产精品成人无码久免费 | 欧美另类摘花hd | 农村脱精光一级 | 欧美熟妇VIVOE精品 | 久久热这里只有 精品 | 亚洲精品电影天堂网 | 国产精品久人妻精品 | 国产亚洲精品福利视频 | 欧美一区二区三区播放 | 99久免费精品视频在线观看2 | 国产精品一国产精品免费 | 动漫人物差差差30分钟免费看 | SM调教贱屁股眼哭叫求饶H | 男人和女人一起愁愁愁很痛 | 亚洲国产果果在线播放在线 | 好看AV中文字幕在线观看 | videosgrati欧美另类 | 免费毛片a在线观看67194 | 午夜在线观看免费观看 视频 | 日本午夜精品理论片A级APP发布 | 东北女人奶大毛多水多 | 日本无码毛片久久久九色综合 |