色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

HPC處理器的多核架構(gòu)挑戰(zhàn)

王燕 ? 來(lái)源:十個(gè)名字V ? 作者:十個(gè)名字V ? 2022-07-14 16:33 ? 次閱讀

隨著半導(dǎo)體設(shè)計(jì)團(tuán)隊(duì)競(jìng)相利用“超越摩爾”,新的架構(gòu)選擇和挑戰(zhàn)層出不窮。以超大規(guī)模硬件為例,其中一系列工作負(fù)載——數(shù)據(jù)庫(kù)分析、人工智能、微服務(wù)、視頻編碼和高復(fù)雜性計(jì)算算法——需要一系列處理器解決方案。性能、功耗和成本仍然至關(guān)重要,但現(xiàn)在架構(gòu)師自己交付。沒(méi)有一種“最好”的架構(gòu);處理器必須設(shè)計(jì)為最好地服務(wù)于特定類別的工作負(fù)載和價(jià)格/性能配置文件。

多核架構(gòu)挑戰(zhàn)

AWS Graviton2 有 64 個(gè) Arm Neoverse N1 內(nèi)核,它們平鋪在單個(gè)芯片上的連貫網(wǎng)狀網(wǎng)絡(luò)中。其他設(shè)計(jì)已經(jīng)擴(kuò)展到多芯片,芯片之間具有緩存一致的連接。多芯片實(shí)現(xiàn)為進(jìn)一步增長(zhǎng)和降低不太先進(jìn)工藝成本的潛力開(kāi)辟了空間。雖然這些新架構(gòu)選項(xiàng)擴(kuò)展了可能性,但它們也帶來(lái)了新的設(shè)計(jì)挑戰(zhàn)。在眾多選擇中,哪些架構(gòu)真正能夠以合適的價(jià)格為合適的工作負(fù)載提供更高的吞吐量?

這里的一個(gè)問(wèn)題是,應(yīng)如何針對(duì)目標(biāo)類應(yīng)用程序的物理內(nèi)存對(duì)相干網(wǎng)狀網(wǎng)絡(luò)中的分布式系統(tǒng)緩存進(jìn)行分區(qū)。優(yōu)化這些選擇,甚至優(yōu)化哪些 CPU 內(nèi)核最能滿足需求,都需要以周期級(jí)精度運(yùn)行實(shí)際工作負(fù)載。高級(jí)模型根本不足以達(dá)到此目的。

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

poYBAGLOsl2ALQFSAARV9EQJl4Q431.png

圖:多芯片實(shí)現(xiàn)中不同的 I/O 延遲。(來(lái)源:Cadence

連貫網(wǎng)格中的處理器陣列之間的通信延遲在單個(gè)裸片內(nèi)將相對(duì)一致,但在多裸片實(shí)現(xiàn)中裸片之間的延遲可能會(huì)有很大差異(見(jiàn)圖)。因此,設(shè)計(jì)發(fā)展出多種架構(gòu),可在未來(lái)使用——全連接網(wǎng)格、集線器和輻條內(nèi)存系統(tǒng)或其他 2D 和 3D 結(jié)構(gòu),其中一個(gè)小芯片提供大系統(tǒng)緩存和主內(nèi)存訪問(wèn)。此外,堆棧中的其他小芯片相互通信,并通過(guò)集線器與主存儲(chǔ)器通信。

有效探索所有這些選項(xiàng)在很大程度上取決于針對(duì)實(shí)際工作負(fù)載準(zhǔn)確建模性能。建模和分析只能在 RTL 域中使用仿真和原型進(jìn)行探索。

SystemReady 合規(guī)性

服務(wù)器架構(gòu)師面臨的另一種問(wèn)題是操作系統(tǒng)兼容性。您可以直接在大多數(shù)筆記本電腦上啟動(dòng)任何 Linux 發(fā)行版、虛擬機(jī)管理程序或 Windows。要在基于 Arm 的服務(wù)器上啟動(dòng),此責(zé)任由服務(wù)器制造商和 Arm 分擔(dān)。

Arm 開(kāi)發(fā)了一個(gè)名為 SystemReady 的合規(guī)套件,以標(biāo)準(zhǔn)化一組最低要求,以解決這個(gè)問(wèn)題和其他合規(guī)問(wèn)題。PCIe 合規(guī)性是一個(gè)特別重要的組件,因?yàn)樗苯訛樵S多服務(wù)器接口協(xié)議提供或作為主要 I/O 的基礎(chǔ),以實(shí)現(xiàn)快速存儲(chǔ)、快速網(wǎng)絡(luò)和芯片外連貫接口。這里特別重要的是通過(guò) PCIe 進(jìn)行遠(yuǎn)程服務(wù)器引導(dǎo)。Arm 將此合規(guī)套件作為在 UEFI (BIOS) 層上運(yùn)行的軟件提供。Cadence 與 Arm 合作了幾年,旨在將測(cè)試縮減為具有 PCIe 流量生成庫(kù)的最小裸機(jī)測(cè)試套件,該庫(kù)的仿真速度比 UEFI 測(cè)試套件更快,可以快速調(diào)整硬件調(diào)試。

服務(wù)器開(kāi)發(fā)人員面臨的另一個(gè)挑戰(zhàn)是 PCIe 使用強(qiáng)排序的內(nèi)存模型。Arm 支持標(biāo)準(zhǔn)允許的松散排序的內(nèi)存模型。但只有強(qiáng)排序才能保證沒(méi)有死鎖。在松散訂購(gòu)下,硬件/固件開(kāi)發(fā)人員必須提供該保證。不幸的是,這無(wú)法通過(guò)合規(guī)性檢查。集成商必須再次在仿真器或原型系統(tǒng)上通過(guò)廣泛的用例測(cè)試證明設(shè)計(jì)是死鎖安全的。

使用 Cadence System 驗(yàn)證 IP 的方法使工程師能夠在半天內(nèi)啟動(dòng)并運(yùn)行系統(tǒng)級(jí)測(cè)試套件,該套件可以根據(jù) SystemReady 要求驗(yàn)證 PCIe 集成。此方法還可用于演示從連接到 PCIe 的閃存設(shè)備模型引導(dǎo) SUSE Linux 和 Windows,這引起了高級(jí)服務(wù)器社區(qū)的極大興趣。

不僅適用于服務(wù)器

Arm Neoverse 平臺(tái)不僅是為高端服務(wù)器設(shè)計(jì)的。該家族已經(jīng)開(kāi)始進(jìn)入其他云應(yīng)用程序和通信基礎(chǔ)設(shè)施,一直到邊緣。在其中一些應(yīng)用程序中,多核架構(gòu)已經(jīng)很重要。在大多數(shù)此類應(yīng)用程序(例如汽車)中,對(duì)一系列開(kāi)放和商業(yè)操作系統(tǒng)的開(kāi)箱即用支持是必不可少的。

我相信用于自動(dòng)生成系統(tǒng)級(jí)內(nèi)容和驗(yàn)證系統(tǒng)級(jí)目標(biāo)合規(guī)性的工具將在許多市場(chǎng)中具有廣泛的適用性。EDA 行業(yè)需要超越傳統(tǒng)的單接口單協(xié)議驗(yàn)證 IP (VIP) 范圍,走向多接口多協(xié)議系統(tǒng)級(jí) VIP 的新時(shí)代。

審核編輯:湯梓紅
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19349

    瀏覽量

    230325
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9111

    瀏覽量

    368072
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    9239

    瀏覽量

    85679
  • HPC
    HPC
    +關(guān)注

    關(guān)注

    0

    文章

    318

    瀏覽量

    23813
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    QorIQ?T1042多核處理器

    QorIQ?T1042多核處理器T1042 QorIQ高級(jí)多核處理器綜合了數(shù)據(jù)網(wǎng)絡(luò)、電信/數(shù)據(jù)通訊、無(wú)線網(wǎng)絡(luò)基礎(chǔ)設(shè)施和國(guó)防軍事/航天工程應(yīng)用所需要的性能卓越數(shù)據(jù)線路加速及網(wǎng)絡(luò)和外圍總線
    發(fā)表于 01-10 08:48

    云計(jì)算HPC軟件關(guān)鍵技術(shù)

    云計(jì)算HPC軟件關(guān)鍵技術(shù)涉及系統(tǒng)架構(gòu)處理器技術(shù)、操作系統(tǒng)、計(jì)算加速、網(wǎng)絡(luò)技術(shù)以及軟件優(yōu)化等多個(gè)方面。下面,AI部落小編帶您探討云計(jì)算HPC軟件的關(guān)鍵技術(shù)。
    的頭像 發(fā)表于 12-18 11:23 ?114次閱讀

    旋智多核處理器助力電機(jī)控制應(yīng)用

    電機(jī)控制應(yīng)用軟件通常需要實(shí)時(shí)處理,以確保精確控制和快速響應(yīng)。高性能、多核嵌入式處理器能夠?qū)崟r(shí)處理多項(xiàng)復(fù)雜計(jì)算,是保持電機(jī)控制系統(tǒng)穩(wěn)定性和準(zhǔn)確性的關(guān)鍵。
    的頭像 發(fā)表于 10-24 16:17 ?497次閱讀
    旋智<b class='flag-5'>多核</b>心<b class='flag-5'>處理器</b>助力電機(jī)控制應(yīng)用

    對(duì)稱多處理器和非對(duì)稱多處理器的區(qū)別

    隨著計(jì)算需求的日益增長(zhǎng),單處理器系統(tǒng)已經(jīng)無(wú)法滿足高性能計(jì)算的需求。多處理器系統(tǒng)應(yīng)運(yùn)而生,它們通過(guò)將多個(gè)處理器集成到一個(gè)系統(tǒng)中來(lái)提高計(jì)算能力。在多處理器系統(tǒng)中,有兩種主要的
    的頭像 發(fā)表于 10-10 15:58 ?1085次閱讀

    多核RISC-V處理器供應(yīng)商超睿科技全力支持RT-Thread Smart,共同賦能“大芯片”生態(tài)

    物聯(lián)網(wǎng)和嵌入式系統(tǒng)領(lǐng)域的快速發(fā)展,推動(dòng)了對(duì)高性能、低功耗處理器的需求。而在這個(gè)背景下,RISC-V架構(gòu)憑借其開(kāi)源、靈活、高效的優(yōu)勢(shì),正迅速成為推動(dòng)芯片產(chǎn)業(yè)升級(jí)的關(guān)鍵力量。超睿科技(上海)有限公司
    的頭像 發(fā)表于 10-10 08:08 ?439次閱讀
    <b class='flag-5'>多核</b>RISC-V<b class='flag-5'>處理器</b>供應(yīng)商超睿科技全力支持RT-Thread Smart,共同賦能“大芯片”生態(tài)

    簡(jiǎn)述微處理器的指令集架構(gòu)

    處理器的指令集架構(gòu)(Instruction Set Architecture,ISA)是計(jì)算機(jī)體系結(jié)構(gòu)中的核心組成部分,它定義了計(jì)算機(jī)能夠執(zhí)行的指令集合、數(shù)據(jù)類型、寄存、內(nèi)存訪問(wèn)方式等,是連接
    的頭像 發(fā)表于 10-05 14:59 ?509次閱讀

    ARM處理器和CISC處理器的區(qū)別

    ARM處理器和CISC(復(fù)雜指令集計(jì)算機(jī))處理器在多個(gè)方面存在顯著的區(qū)別。這些區(qū)別主要體現(xiàn)在架構(gòu)原理、性能與功耗、設(shè)計(jì)目標(biāo)、應(yīng)用領(lǐng)域以及市場(chǎng)生態(tài)等方面。
    的頭像 發(fā)表于 09-10 11:10 ?507次閱讀

    處理器的指令集架構(gòu)介紹

    處理器的指令集架構(gòu)(Instruction Set Architecture,ISA)是計(jì)算機(jī)體系結(jié)構(gòu)中至關(guān)重要的部分,它定義了微處理器能夠執(zhí)行的操作和指令的集合,以及這些指令如何被組織、存儲(chǔ)
    的頭像 發(fā)表于 08-22 10:53 ?1383次閱讀

    TMS320C6474多核數(shù)字信號(hào)處理器數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474多核數(shù)字信號(hào)處理器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 08-01 11:09 ?0次下載
    TMS320C6474<b class='flag-5'>多核</b>數(shù)字信號(hào)<b class='flag-5'>處理器</b>數(shù)據(jù)表

    嵌入式微處理器的分類 嵌入式微處理器的種類和型號(hào)

    的分類可以從多個(gè)角度進(jìn)行劃分,比如架構(gòu)、指令集、用途等。下面將從這些角度詳細(xì)介紹嵌入式微處理器的種類和型號(hào)。 一、架構(gòu)分類 嵌入式微處理器架構(gòu)
    的頭像 發(fā)表于 05-04 16:31 ?2307次閱讀

    嵌入式微處理器架構(gòu)可分為

    嵌入式微處理器架構(gòu)是指用于嵌入式系統(tǒng)的微處理器的設(shè)計(jì)和組織方式。嵌入式系統(tǒng)是指內(nèi)嵌在其他電子設(shè)備中的計(jì)算機(jī)系統(tǒng),它們通常用于實(shí)時(shí)控制、通信、處理數(shù)據(jù)等任務(wù)。嵌入式微
    的頭像 發(fā)表于 04-21 14:39 ?1199次閱讀

    嵌入式微處理器的基礎(chǔ)是什么

    要求的硬件和軟件技術(shù)。 在嵌入式微處理器的基礎(chǔ)上,我們可以考慮以下幾個(gè)方面進(jìn)行詳細(xì)討論: 處理器架構(gòu)和指令集:嵌入式微處理器通常在特定的指令集架構(gòu)
    的頭像 發(fā)表于 04-21 14:34 ?1116次閱讀

    多核架構(gòu)高性能電機(jī)控制芯片

    基于傳統(tǒng)單核架構(gòu)的電機(jī)控制芯片已無(wú)法應(yīng)對(duì)新出現(xiàn)的嚴(yán)峻挑戰(zhàn)多核架構(gòu)的控制芯片應(yīng)運(yùn)而生。雙核架構(gòu)芯片已在許多領(lǐng)域成功應(yīng)用,并顯示出其獨(dú)特的優(yōu)勢(shì)
    的頭像 發(fā)表于 04-19 14:46 ?8429次閱讀
    <b class='flag-5'>多核</b><b class='flag-5'>架構(gòu)</b>高性能電機(jī)控制芯片

    用于多核處理器的可配置多軌PMU TPS650860數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《用于多核處理器的可配置多軌PMU TPS650860數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 03-07 14:00 ?0次下載
    用于<b class='flag-5'>多核</b><b class='flag-5'>處理器</b>的可配置多軌PMU TPS650860數(shù)據(jù)表

    如何提高處理器的性能

    提高處理器主頻可以提高處理器的性能,但是到一定程度就不能再提高了,我們需要通過(guò)雙核,或者多核來(lái)提高處理器的性能。
    的頭像 發(fā)表于 01-24 09:59 ?2547次閱讀
    如何提高<b class='flag-5'>處理器</b>的性能
    主站蜘蛛池模板: 古风一女N男到处做高H| 亚洲色婷婷久久精品AV蜜桃久久| 亚洲国产精品久久又爽黄A片| 最新影音先锋av资源台| 国产精品九九久久精品视| 老师好爽你下面水好多视频| 少妇无码太爽了视频在线播放 | 无码人妻精品一区二区蜜桃色欲| 最新色导航| 国产在线观看码高清视频| 日本护士hd| 最新国自产拍 高清完整版| 岳的奶大又白又胖| 国产精品人妻系列21P| 秋霞网在线伦理影片| 真实处破女全过程完免费观看| 国产乱码免费卡1卡二卡3卡四卡| 啪啪后入内射日韩| 最近中文字幕2019免费版日本| 国产亚洲视频精彩在线播放| 乳液全集电影在线观看| 99久久久精品免费观看国产| 久久精品国产男包| 亚洲VA天堂VA欧美VA在线| 丰满的女朋友韩国版在线观看| 欧美大片xxxxbbbb| 中文字幕蜜臀AV熟女人妻| 黑人娇小BBW| 无限资源网免费看| 成人免费小视频| 欧美成人一区二免费视频| 中国女人逼| 精品亚洲永久免费精品| 亚洲成人免费| 国产精品悠悠久久人妻精品| 三级黄色在线| 草比比过程图| 欧式午夜理伦三级在线观看| 97影院午夜午夜伦不卡| 久久综合色悠悠| 伊人久在线观看视频|