色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

芯片性能小談—時(shí)間并行

冬至子 ? 來(lái)源:數(shù)字IC自修室 ? 作者:L.L. ? 2023-06-05 15:34 ? 次閱讀

1

性能的評(píng)估——帶寬、吞吐量、時(shí)延

在討論如何提高性能之前,得先看看如何評(píng)估性能。

從直觀上來(lái)說(shuō),性能好代表著快。那么如何評(píng)估”快”呢?首先芯片根據(jù)應(yīng)用場(chǎng)景分為很多不同的種類,通信類的5G藍(lán)牙,wifi;接口類的USB以太網(wǎng)HDMI;計(jì)算類的通用CPUGPUAI等。在不同的場(chǎng)景下其實(shí)都能通過(guò)一些統(tǒng)一的指標(biāo)來(lái)衡量:帶寬(bandwidth),吞吐量(throughput)和時(shí)延(latency)。我們所熟悉的CPU性能跑分,從微觀層面來(lái)說(shuō),實(shí)際上評(píng)估的無(wú)非也是同一段時(shí)間內(nèi)系統(tǒng)能正確處理多少段標(biāo)準(zhǔn)的代碼,蘊(yùn)藏有吞吐量的概念在里面。在計(jì)算機(jī)網(wǎng)絡(luò)中,這三者的大致概念如下:

● 帶寬: 信道上單位時(shí)間內(nèi)能傳輸?shù)淖畲髷?shù)據(jù)量。

****● 吞吐量: 某段時(shí)間里,信道上單位時(shí)間內(nèi)的有效傳輸?shù)臄?shù)據(jù)量。

****● 時(shí)延: 每一次有效傳輸所需要的時(shí)間。

這三個(gè)概念既可以作為宏觀的計(jì)算機(jī)網(wǎng)絡(luò)傳輸性能指標(biāo),從微觀上來(lái)說(shuō),也可以作為芯片內(nèi)部數(shù)據(jù)計(jì)算,傳輸?shù)男阅苤笜?biāo)。比如AXI總線的數(shù)據(jù)傳輸,比如內(nèi)存訪問(wèn)的數(shù)據(jù)傳輸,甚至是模塊與模塊間的數(shù)據(jù)傳輸。

以AXI總線為例,我們都知道這是一種高帶寬,高性能,低時(shí)延的總線,其與同為AMBA總線的AHB和APB的對(duì)比如下:

圖片

AXI的快,從帶寬,吞吐量以及時(shí)延的角度來(lái)說(shuō),主要得益于以下特性:

● 帶寬:

AXI支持更寬的總線寬度。更寬的總線寬度帶來(lái)的好處毋庸置疑,一個(gè)周期傳輸?shù)淖畲髷?shù)據(jù)量更大。形象點(diǎn)說(shuō)就是公路更寬了。

● 吞吐量:

  1. 讀寫通道獨(dú)立帶來(lái)的讀寫并行操作。讀寫通道獨(dú)立意味著讀操作和寫操作可以并行。并行的好處自然是同一段時(shí)間內(nèi)可以同時(shí)進(jìn)行的讀和寫更多,完成的也更多,從而增加了一段時(shí)間內(nèi)的有效數(shù)據(jù)傳輸量,也就是吞吐量。
  2. 流水/分裂傳輸。這里的流水/分裂傳輸用AXI文檔里的說(shuō)法叫outstanding。這是一種時(shí)間上的并行。在每筆讀/寫操作還未結(jié)束的時(shí)候就發(fā)送下一筆,這樣一來(lái)同樣一段時(shí)間內(nèi)并行的讀寫操作更多,傳輸數(shù)據(jù)更多,增加了吞吐量。
  3. 猝發(fā)傳輸。用于連續(xù)地址的讀寫訪問(wèn),一次地址發(fā)送在slave端可以同時(shí)訪問(wèn)多個(gè)連續(xù)地址,同一段時(shí)間內(nèi)能訪問(wèn)更多的地址,傳輸更多的數(shù)據(jù),增加了吞吐量。
  4. 亂序訪問(wèn)。相比于順序訪問(wèn),總線上自由度更大。順序是一種約束,放寬了約束自然可以更肆無(wú)忌憚的傳輸數(shù)據(jù)。假設(shè)一種場(chǎng)景,傳輸1訪問(wèn)地址空間A,三個(gè)周期讀回?cái)?shù)據(jù)。傳輸2訪問(wèn)地址空間B,一個(gè)周期讀回?cái)?shù)據(jù)。因?yàn)轫樞虻募s束,先得到數(shù)據(jù)的傳輸2無(wú)法返回?cái)?shù)據(jù),必須等到傳輸1完成,這樣效率就很低。有了亂序的支持,后發(fā)出的操作如果先完成,可以先返回?cái)?shù)據(jù),這樣一來(lái)吞吐量自然就更高。

● 時(shí)延:

  1. 地址數(shù)據(jù)通道獨(dú)立。在AHB協(xié)議中,因?yàn)榈刂窋?shù)據(jù)通道共用,一次寫操作需要經(jīng)歷發(fā)送地址->發(fā)送寫數(shù)據(jù)這樣的步驟。而在AXI中,寫數(shù)據(jù)和寫地址可以同時(shí)發(fā)送,減小了一次寫操作所需要的時(shí)延。
  2. 多主從設(shè)備/仲裁機(jī)制。與APB只有一個(gè)apb master從而導(dǎo)致需要2個(gè)cycle才能完成傳輸不同,AXI與AHB都是多主從設(shè)備,可以直接點(diǎn)對(duì)點(diǎn)完成傳輸,1個(gè)cycle就可以完成傳輸,減小了時(shí)延。雖然仲裁機(jī)制的引入一定程度上又增加了時(shí)延,但基于流水分裂傳輸,性能還是可以得到保證。

從上述AXI的特性以及其對(duì)性能帶來(lái)的增益我們可以明顯看到,性能的提升手段有很多,但這里面蘊(yùn)藏的主要思想是類似的:提速與并行。道理很簡(jiǎn)單,想要更快,那么在一段時(shí)間里就需要做更多的事。

2

性能的提升——提速與并行

提速指的是減小時(shí)延(latency),即減小每次有效輸出的時(shí)間。提速的方式可以來(lái)自于計(jì)算傳輸自身的算法優(yōu)化,硬件升級(jí)。比如我們?cè)谠O(shè)計(jì)的時(shí)候經(jīng)常會(huì)做的去除冗余邏輯,本來(lái)1拍能做的事沒(méi)必要2拍,這就是一種自身算法優(yōu)化。而更先進(jìn)的工藝,更小的門電路延遲,也可以減小硬件時(shí)延,算作是一種硬件升級(jí)。

提速也可以來(lái)自于并行。并行又分為空間并行和時(shí)間并行。其主要區(qū)別在于空間并行需要更多的物理資源,通過(guò)更多的資源同時(shí)運(yùn)作來(lái)實(shí)現(xiàn)并行。而時(shí)間并行則是充分調(diào)度有限的資源,使其在一段時(shí)間內(nèi)盡可能少的處于閑置等待狀態(tài)。

舉一個(gè)最簡(jiǎn)單的例子就是,你開(kāi)了一個(gè)工廠,原計(jì)劃在1個(gè)禮拜內(nèi)完成一個(gè)項(xiàng)目交付,老板突然把要求提高了,讓你三天完成,怎么辦呢?可以有以下幾種處理方式。

  1. 請(qǐng)更多的工人,同樣一堆活丟給更多的人去做,這就是空間并行。
  2. 減少工人偷懶或者無(wú)所事事的時(shí)間,充分利用閑暇時(shí)間用來(lái)干活,同一時(shí)刻讓更多的工人處于干活狀態(tài),這就是時(shí)間并行。
  3. 每個(gè)工人提升工作效率,做一項(xiàng)工作的時(shí)間縮短,這樣相同時(shí)間就可以做更多工作,這可以類比于硬件上的算法優(yōu)化和先進(jìn)工藝。

在AXI的例子中,更寬的總線寬度,讀寫通道獨(dú)立,地址數(shù)據(jù)獨(dú)立屬于空間并行,用更多的總線資源換來(lái)速度。流水/分割,猝發(fā),亂序都是屬于時(shí)間并行。而多主從的連接方式則幫助到了傳輸本身的提速。

3

時(shí)間并行——隱藏latency

這里主要討論一下時(shí)間并行。還是基于AXI,從流水/分裂傳輸開(kāi)始,也就是耳熟能詳?shù)腛utstanding。

Outstanding的英文含義是未完成的。在AXI協(xié)議中,Outstanding的意思是在一個(gè)讀寫操作還沒(méi)完成的時(shí)候就開(kāi)始另外一個(gè)。

如下圖所示,水平方向表示時(shí)間,如果沒(méi)有Outstanding,那么總線在同一時(shí)刻只會(huì)有一個(gè)傳輸正在執(zhí)行。兩個(gè)傳輸必須要串行完成。這樣完成兩個(gè)讀操作總共需要100ns。

圖片

但我們通過(guò)觀察可以發(fā)現(xiàn),一個(gè)完整的讀操作由Master和Slave共同完成。Master處理地址發(fā)出讀請(qǐng)求,Slave處理請(qǐng)求返回?cái)?shù)據(jù)。如果把Master和Slave看成兩個(gè)工人,工人M處理完讀請(qǐng)求操作之后,在等待工人S返回?cái)?shù)據(jù)的20ns里其實(shí)是啥事都不做的偷懶狀態(tài)。為了提高效率,讓工人M不偷懶,可以讓他處理完第一筆讀請(qǐng)求操作之后馬上開(kāi)始準(zhǔn)備發(fā)出第二個(gè)請(qǐng)求。如下圖所示:

圖片

在鞭策了M之后,他發(fā)出第一個(gè)讀請(qǐng)求之后,馬上馬不停蹄地開(kāi)始處理第二個(gè)讀請(qǐng)求。于此同時(shí),S并行地處理著之前的第一個(gè)讀請(qǐng)求。當(dāng)M完成了第二個(gè)讀請(qǐng)求發(fā)出時(shí),因?yàn)镾已經(jīng)完成了第一個(gè)讀請(qǐng)求的數(shù)據(jù)返回,M可以立馬交付出自己的第二個(gè)讀請(qǐng)求,開(kāi)始第3個(gè)讀請(qǐng)求的準(zhǔn)備。這樣一來(lái)完成兩次讀操作的總時(shí)間為80ns,相比第一種情況縮短了20ns。這20ns是S處理第一筆數(shù)據(jù)的時(shí)間,也就是latency,它被“隱藏”在M的第二次操作里。

上述的情況中,有一個(gè)前提條件是,S端返回讀數(shù)據(jù)的latency要小于M發(fā)出讀請(qǐng)求處理的latency。這樣才能保證M發(fā)出讀請(qǐng)求的時(shí)候S能馬上收走。因?yàn)樵贏XI中是握手傳輸,即需要M端valid與S端ready信號(hào)同時(shí)有效才能進(jìn)行傳輸。如果S某一次返回讀數(shù)據(jù)的latency大于M端,M在完成了一次讀請(qǐng)求之后需要等待S端的ready信號(hào),從而還是會(huì)有閑置狀態(tài),如下圖所示:

圖片

在上圖中,由于在第二次傳輸?shù)臅r(shí)候Master等待了10ns,三次讀操作總共用了140ns。

一個(gè)解決此問(wèn)題的辦法是改變M和S的交互方式。假想M發(fā)出請(qǐng)求之后,如果有個(gè)地方可以緩存這個(gè)請(qǐng)求,M就可以騰出手去做別的事了。這個(gè)緩存可以用BUF來(lái)做到。如果S特別慢,M發(fā)出好幾個(gè)請(qǐng)求S都來(lái)不及收,就緩存更多,并滿足先發(fā)的請(qǐng)求先被處理,則可以使用FIFO進(jìn)行銜接。如下圖所示:

圖片

在有了BUF緩存之后,M的第二次操作完成時(shí)可以直接進(jìn)行第三次操作,以此節(jié)省了10ns的等待時(shí)間,三次讀操作總共只需要130ns。在AXI里,如果有outstanding設(shè)置,M與S之間都會(huì)有buffer來(lái)進(jìn)行此類緩存,保證同時(shí)可以有多個(gè)數(shù)據(jù)傳輸并行。此時(shí)的slave ready信號(hào)其實(shí)是這些緩存FIFO的非滿信號(hào)。

從上面的例子中,我們看到了outstanding的魔力,成功地將latency隱藏起來(lái),從而提升了系統(tǒng)的性能。這里的性能提升點(diǎn)為吞吐量,因?yàn)閱挝粫r(shí)間的有效輸出數(shù)據(jù)增加了。并行之所以重要,是因?yàn)樵谶@些例子里的時(shí)延latency,即master發(fā)出讀請(qǐng)求和slave返回讀數(shù)據(jù)本身需要的時(shí)間,一般來(lái)說(shuō)是比較難降低的。Master發(fā)出讀請(qǐng)求前需要處理計(jì)算地址,以及slave返回?cái)?shù)據(jù)時(shí)可能有的Memory讀取時(shí)間,在設(shè)計(jì)沒(méi)太大毛病的基礎(chǔ)上,要縮短只能靠工藝的升級(jí),內(nèi)存結(jié)構(gòu)的改變。而要提高系統(tǒng)的吞吐量,只能想辦法將一部分latency隱藏起來(lái)。

4

時(shí)間并行的瓶頸

以上的一切看起來(lái)很好,但如果這樣的并行技術(shù)那么牛逼,照理說(shuō)我們可以使系統(tǒng)無(wú)限快才對(duì)。當(dāng)然這樣的技術(shù)還是有一定的局限性的。它使用的前提是Master端是效率的瓶頸。如果Slave端總是比Master端更慢,那么實(shí)際上系統(tǒng)的吞吐量并不能得到增加,看以下兩個(gè)例子:

圖片

圖片

從上面兩圖的對(duì)比我們可以看到,雖然Outstanding技術(shù)可以幫助Master以最快速度發(fā)出三個(gè)請(qǐng)求,但這三筆讀數(shù)據(jù)最后完成的時(shí)間和與不使用該技術(shù)是完全一樣的。這是因?yàn)樵诖死又蠸lave端的處理速度才是瓶頸所在。

那么如何解決這個(gè)問(wèn)題呢?其實(shí)這個(gè)問(wèn)題一直是計(jì)算機(jī)系統(tǒng)效率提升的頭號(hào)問(wèn)題,即著名的”Memory Wall”。可以將上圖中的Master看作是CPU計(jì)算單元,Slave看作是系統(tǒng)內(nèi)存DRAM Memory。因?yàn)樵L問(wèn)系統(tǒng)內(nèi)存的時(shí)間本身遠(yuǎn)遠(yuǎn)大于CPU計(jì)算單元本身處理,而 CPU在變得原來(lái)越快(多核處理器,superscalar等),DRAM的讀取速度相比之下比較難提高(雖然有DDR,HBM等技術(shù),但還是要寄希望于DRAM本身的提高),這個(gè)差距在越拉越大。

目前在計(jì)算機(jī)體系中使用的是緩存技術(shù),用高速的SRAM作為一個(gè)“假”的Memory來(lái)進(jìn)行訪問(wèn)。只在必要的時(shí)候訪問(wèn)DDR。對(duì)應(yīng)到上圖中實(shí)際上是縮短了藍(lán)色色塊Slave返回讀數(shù)據(jù)的時(shí)延latency。

5

完美的時(shí)間并行——Pipeline

從上面的Outstanding技術(shù)中,我們可以發(fā)現(xiàn),Master與Slave端自身的Latency對(duì)并行的效果會(huì)有很大影響。如果Slave端Latency較大,Outstanding無(wú)法很好起到提升吞吐量的效果,并且Master需要很多的BUF來(lái)儲(chǔ)存自己的數(shù)據(jù)。而如果Master的Latency較大,上述的Outstanding是否效率最高呢?

圖片

從上圖中我們可以看到,雖然Master端效率達(dá)到了最高,工人M一刻不停歇地處理數(shù)據(jù),但是Slave在接受處理完Master發(fā)出的第一個(gè)請(qǐng)求后,有10ns的空閑時(shí)間在等待M的第二個(gè)讀請(qǐng)求。因?yàn)镸aster是主動(dòng)方,Slave在收到Master的請(qǐng)求之前沒(méi)法做別的事,要避免Slave白等,只能將Master提速。如果Master的latency也是20ns,那么系統(tǒng)中將沒(méi)有任何等待,如下圖所示:

圖片

我們知道,如果你遲到了,讓一個(gè)人某一次等了一個(gè)小時(shí),可能他沒(méi)什么感覺(jué),也不會(huì)生氣。但如果每天都讓別人等1小時(shí),一個(gè)月是30小時(shí),相當(dāng)于這個(gè)人這個(gè)月花了一天的時(shí)間來(lái)等你,他還能沒(méi)感覺(jué)嗎?

對(duì)于系統(tǒng)來(lái)說(shuō)也是一樣的道理。某次傳輸存在等待問(wèn)題不大,但若每一次傳輸都存在等待,整個(gè)系統(tǒng)的效率將大大降低。因此最完美的并行是沒(méi)有等待的并行,也就是master發(fā)出請(qǐng)求的時(shí)候,slave剛剛處理完上一個(gè)請(qǐng)求,準(zhǔn)備開(kāi)始下一個(gè)。

以上的討論都基于兩個(gè)工作者,M和S。但就像大魚吃小魚一個(gè)道理一樣,你是一個(gè)人的Slave,也會(huì)是其他人的Master,生物鏈?zhǔn)且画h(huán)扣一環(huán)的。系統(tǒng)也一樣,有可能是層層往下傳遞的。上述的例子讀操作起始于M,經(jīng)過(guò)S,終止于M。如果加上AXI的網(wǎng)絡(luò)(實(shí)際情況也不會(huì)是直接bypass訪問(wèn)),Slave1在接收到讀請(qǐng)求之后,只是將其做了預(yù)處理,又繼續(xù)往下發(fā)放到Slave2, Slave3, 直到真正的Memory Slave,如下圖所示:

圖片

上圖是一種理想狀態(tài),每一對(duì)M與S都不存在等待問(wèn)題,這在現(xiàn)實(shí)中很難做到,因?yàn)椴煌墓δ軌K時(shí)延Latency很難做到一致。但還是先來(lái)看看這種理想狀態(tài)。

因?yàn)榧?jí)數(shù)增多了,總的效率提升更為顯著。并且隨著傳遞深度的提升,Latency的隱藏更為顯著。整段時(shí)間內(nèi)最多有4個(gè)任務(wù)在并行,并且這四個(gè)任務(wù)的Latency相等,有多達(dá)3段latency被完美隱藏!

這么完美的并行技術(shù),無(wú)法天然形成,但不利用豈不可惜!我想大家都已經(jīng)知道了,這就是經(jīng)典的Pipeline技術(shù)。我們會(huì)將一些時(shí)延較長(zhǎng)的電路手動(dòng)分割成幾個(gè)部分,每個(gè)部分之間有寄存器鏈接,這樣一來(lái)雖然每個(gè)部分的時(shí)延latency不同,都會(huì)在一個(gè)時(shí)鐘周期的時(shí)候同時(shí)更新:Master在時(shí)鐘上升沿傳遞數(shù)據(jù),Slave在時(shí)鐘上升沿完成上一數(shù)據(jù)處理。Pipeline技術(shù)大大提高了系統(tǒng)的吞吐量,深度越深,提升越顯著。

理論上來(lái)說(shuō),任何的電路都可以使用Pipeline技術(shù),但最經(jīng)典的應(yīng)用莫過(guò)于CPU流水線處理器。下圖是經(jīng)典的MIPS 5級(jí)Pipeline處理器流程:

圖片

指令的生命周期分別有5個(gè)階段: Fetch讀取指令,Decode指令解碼,Execute指令執(zhí)行,Memory內(nèi)存訪問(wèn),以及Write Back指令回寫寄存器。最后一步結(jié)束后一條指令即完成執(zhí)行。從上圖可以看出,在不考慮數(shù)據(jù)依賴關(guān)系的理想狀態(tài)下,有了Pipeline并行技術(shù)的加持,在從第5個(gè)周期開(kāi)始,每個(gè)周期都可以完成一條指令,大大提高了吞吐量!

6

小結(jié)

今天介紹的并行技術(shù)其實(shí)只是拋磚引玉,也只是設(shè)計(jì)中并行思想的冰山一角。這種思想可以是outstanding,可以是pipeline,其實(shí)還可以是很多很多其他的技術(shù)細(xì)節(jié)。希望大家能應(yīng)用到平時(shí)的設(shè)計(jì)中,多想想那些地方是存在等待的,那些地方就是效率提升點(diǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • HDMI
    +關(guān)注

    關(guān)注

    32

    文章

    1734

    瀏覽量

    152255
  • 以太網(wǎng)
    +關(guān)注

    關(guān)注

    40

    文章

    5460

    瀏覽量

    172437
  • 門電路
    +關(guān)注

    關(guān)注

    7

    文章

    199

    瀏覽量

    40227
  • AXI總線
    +關(guān)注

    關(guān)注

    0

    文章

    66

    瀏覽量

    14298
  • FIFO存儲(chǔ)
    +關(guān)注

    關(guān)注

    0

    文章

    103

    瀏覽量

    6029
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    請(qǐng)問(wèn)如何使用fx3芯片來(lái)對(duì)FPGA進(jìn)行并行配置?

    我閱讀過(guò)AN84868,了解到fx3可以對(duì)連接的FPGA芯片進(jìn)行串行配置;但是我的項(xiàng)目中,希望能盡量縮短FPGA配置的時(shí)間,因此希望能夠了解是否有辦法使用fx3芯片對(duì)外接的FPGA芯片
    發(fā)表于 05-28 08:30

    AI芯片算法不談智能,實(shí)現(xiàn)不談芯片

    有高性能的硬件和現(xiàn)有的計(jì)算機(jī)科學(xué)的輔助下,超出人類預(yù)計(jì)的好用。 2實(shí)現(xiàn)不談芯片既然是好用的算法模型,也是接下來(lái)的主流發(fā)展趨勢(shì),我們就暫且不考慮這些用詞細(xì)節(jié)的問(wèn)題,在上述三種人工智能的理解中,以我
    發(fā)表于 08-24 10:36

    并行編程對(duì)單芯片多處理性能有什么影響?

    并行控制編程將根據(jù)任務(wù)而不是輸入進(jìn)行工作劃分。如果將100通道的并行數(shù)據(jù)算法比作汽車工廠內(nèi)100個(gè)工人各自在組裝一輛汽車,那么并行控制程序就可以比作有100個(gè)工作崗位的組裝線,每個(gè)崗位完成
    發(fā)表于 08-01 06:36

    可編程并行接口芯片應(yīng)用

    可編程并行接口芯片應(yīng)用, 可編程定時(shí)器/計(jì)數(shù)器芯片8253/8254定時(shí)信號(hào)的產(chǎn)生 1.軟件定時(shí) 方法:根據(jù)所需時(shí)間常數(shù)設(shè)計(jì)一個(gè)延遲子程序。 優(yōu)點(diǎn):節(jié)省硬件 缺點(diǎn):執(zhí)行延時(shí)程序期間CP
    發(fā)表于 07-22 09:56

    MCS-51并行口的擴(kuò)展

    MCS51單片機(jī)內(nèi)部有4個(gè)并行口,當(dāng)內(nèi)部并行口不夠用時(shí)可以外擴(kuò)并行芯片。可外擴(kuò)的并行芯片很多
    發(fā)表于 12-20 02:27 ?36次下載
    MCS-51<b class='flag-5'>并行</b>口的擴(kuò)展

    14位并行模數(shù)轉(zhuǎn)換芯片AD9240及其應(yīng)用

    AD9240是AD公司推出的一種14位并行接口的分級(jí)型模,數(shù)轉(zhuǎn)換芯片.文中簡(jiǎn)要介紹了該芯片性能特點(diǎn)、內(nèi)部結(jié)構(gòu)、工作時(shí)序以及在視頻采集系統(tǒng)中的應(yīng)用方法,給出了由數(shù)字信號(hào)處理
    發(fā)表于 04-30 16:07 ?88次下載

    12位并行模/數(shù)轉(zhuǎn)換芯片AD1674及其應(yīng)用

    12位并行模/數(shù)轉(zhuǎn)換芯片AD1674及其應(yīng)用。
    發(fā)表于 01-25 10:26 ?68次下載

    基于Spark的BIRCH算法并行化的設(shè)計(jì)與實(shí)現(xiàn)

    在分布式計(jì)算和內(nèi)存為王的時(shí)代,Spark作為基于內(nèi)存計(jì)算的分布式框架技術(shù)得到了前所未有的關(guān)注與應(yīng)用。著重研究BIRCH算法在Spark上并行化的設(shè)計(jì)和實(shí)現(xiàn),經(jīng)過(guò)理論性能分析得到并行化過(guò)程中時(shí)間
    發(fā)表于 11-23 11:24 ?0次下載
    基于Spark的BIRCH算法<b class='flag-5'>并行</b>化的設(shè)計(jì)與實(shí)現(xiàn)

    基于并行搜索和快速插入的算法

    針對(duì)串行A*算法時(shí)間性能較差的問(wèn)題,提出了一種基于并行搜索和快速插入( PSFI)的算法。首先,研究了共享存儲(chǔ)平臺(tái)上的常見(jiàn)并行啟發(fā)式搜索算法;然后,通過(guò)使用一種延遲的單表搜索( DSTS)方法
    發(fā)表于 01-07 11:01 ?0次下載

    時(shí)間數(shù)據(jù)流的并行檢測(cè)算法

    針對(duì)現(xiàn)有長(zhǎng)持續(xù)時(shí)間數(shù)據(jù)流檢測(cè)算法的實(shí)時(shí)性差、檢測(cè)精度與估計(jì)精度低的問(wèn)題,提出長(zhǎng)持續(xù)時(shí)間數(shù)據(jù)流的并行檢測(cè)算法。基于共享數(shù)據(jù)結(jié)構(gòu)的長(zhǎng)持續(xù)時(shí)間數(shù)據(jù)流的并行
    發(fā)表于 03-06 15:54 ?0次下載
    <b class='flag-5'>時(shí)間</b>數(shù)據(jù)流的<b class='flag-5'>并行</b>檢測(cè)算法

    怎樣成為一名異構(gòu)并行計(jì)算工程師

    隨著深度學(xué)習(xí)(人工智能)的火熱,異構(gòu)并行計(jì)算越來(lái)越受到業(yè)界的重視。從開(kāi)始深度學(xué)習(xí)必GPU,到深度學(xué)習(xí)必計(jì)算力。計(jì)算力不但和具體的硬件
    的頭像 發(fā)表于 04-09 16:41 ?2443次閱讀
    怎樣成為一名異構(gòu)<b class='flag-5'>并行</b>計(jì)算工程師

    淺析云計(jì)算和并行計(jì)算

    并行計(jì)算可以劃分成時(shí)間并行和空間并行時(shí)間并行即流水線技術(shù),空間
    的頭像 發(fā)表于 05-03 12:01 ?4707次閱讀
    淺析云計(jì)算和<b class='flag-5'>并行</b>計(jì)算

    如何使用FPGA驅(qū)動(dòng)并行ADC和并行DAC芯片

    ADC和DAC是FPGA與外部信號(hào)的接口,從數(shù)據(jù)接口類型的角度劃分,有低速的串行接口和高速的并行接口。FPGA經(jīng)常用來(lái)采集中高頻信號(hào),因此使用并行ADC和DAC居多。本文將介紹如何使用FPGA驅(qū)動(dòng)并行ADC和
    的頭像 發(fā)表于 04-21 08:55 ?7231次閱讀

    芯片性能時(shí)間并行

    眾所周知,評(píng)估一顆芯片的好壞,PPA(performance,power,area)是最重要的指標(biāo)之一。
    發(fā)表于 06-27 16:04 ?1993次閱讀
    <b class='flag-5'>芯片</b><b class='flag-5'>性能</b>小<b class='flag-5'>談</b>—<b class='flag-5'>時(shí)間</b><b class='flag-5'>并行</b>

    Vitis HLS:使用任務(wù)級(jí)并行性的高性能設(shè)計(jì)

    電子發(fā)燒友網(wǎng)站提供《Vitis HLS:使用任務(wù)級(jí)并行性的高性能設(shè)計(jì).pdf》資料免費(fèi)下載
    發(fā)表于 09-13 17:21 ?0次下載
    Vitis HLS:使用任務(wù)級(jí)<b class='flag-5'>并行</b>性的高<b class='flag-5'>性能</b>設(shè)計(jì)
    主站蜘蛛池模板: 国产精品一久久香蕉国产线看 | 国产成人精品自线拍 | 久久免费视频在线观看6 | 肉动漫无修在线播放 | 成人中文字幕在线观看 | 粉色视频午夜网站入口 | 天上人间影院久久国产 | 在线精品视频免费观看 | 欧美性猛交XXXX乱大交极品 | 51久久夜色精品国产 | 免费观看高清黄页网址大全 | 欧美亚洲另类丝袜自拍动漫 | 成人免费观看在线视频 | 2019午夜福利757视频第12集 | 久久久久久久久人体 | 女人十八毛片水真多啊 | 黑人巨茎大战白人女40CMO | 亚洲高清毛片一区二区 | 一本色道久久综合亚洲精品蜜桃冫 | 巨胸美乳中文在线观看 | 免费中文字幕视频 | 欧美日韩亚洲一区二区三区在线观看 | 午夜福利免费0948视频 | 国产a级黄色毛片 | 日美欧韩一区二去三区 | 亚洲午夜久久影院 | 午夜国产福利 | 99无码熟妇丰满人妻啪啪 | 亚洲伊人国产 | 果冻传媒MV免费播放在线观看 | 99精品国产免费久久久久久下载 | 精品一区二区三区四区五区六区 | 日韩性大片 | 伊人草 | 伊人久久久久久久久久 | 久草在线在线精品观看 | 亚洲人成无码久久久AAA片 | 女人一级毛片免费观看 | 91久久偷偷看嫩草影院无费 | 青青草偷拍国产亚洲欧洲 | 欧美人与动牲交ZOOZ特 |