基于IoT設(shè)備的CNN推理機(jī)實(shí)現(xiàn)深度學(xué)習(xí)方案 - 全文

通過(guò)深度學(xué)習(xí)技術(shù)，物聯(lián)網(wǎng)（IoT）設(shè)備能夠得以解析非結(jié)構(gòu)化的多媒體數(shù)據(jù)，智能地響應(yīng)用戶(hù)和環(huán)境事件，但是卻伴隨著苛刻的性能和功耗要求。本文作者探討了兩種方式以便將深度學(xué)習(xí)和低功耗的物聯(lián)網(wǎng)設(shè)備成功整合。

近年來(lái)，越來(lái)越多的物聯(lián)網(wǎng)產(chǎn)品出現(xiàn)在市場(chǎng)上，它們采集周?chē)沫h(huán)境數(shù)據(jù)，并使用傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)理解這些數(shù)據(jù)。一個(gè)例子是Google的Nest恒溫器，采用結(jié)構(gòu)化的方式記錄溫度數(shù)據(jù)，并通過(guò)算法來(lái)掌握用戶(hù)的溫度偏好和時(shí)間表。然而，其對(duì)于非結(jié)構(gòu)化的多媒體數(shù)據(jù)，例如音頻信號(hào)和視覺(jué)圖像則顯得無(wú)能為力。

新興的物聯(lián)網(wǎng)設(shè)備采用了更加復(fù)雜的深度學(xué)習(xí)技術(shù)，通過(guò)神經(jīng)網(wǎng)絡(luò)來(lái)探索其所處環(huán)境。例如，Amazon Echo可以理解人的語(yǔ)音指令，通過(guò)語(yǔ)音識(shí)別，將音頻信號(hào)轉(zhuǎn)換成單詞串，然后使用這些單詞來(lái)搜索相關(guān)信息。最近，微軟的Windows物聯(lián)網(wǎng)團(tuán)隊(duì)發(fā)布了一個(gè)基于面部識(shí)別的安全系統(tǒng)，利用到了深度學(xué)習(xí)技術(shù)，當(dāng)識(shí)別到用戶(hù)面部時(shí)能夠自動(dòng)解開(kāi)門(mén)鎖。

物聯(lián)網(wǎng)設(shè)備上的深度學(xué)習(xí)應(yīng)用通常具有苛刻的實(shí)時(shí)性要求。例如，基于物體識(shí)別的安全攝像機(jī)為了能及時(shí)響應(yīng)房屋內(nèi)出現(xiàn)的陌生人，通常需要小于500毫秒的檢測(cè)延遲來(lái)捕獲和處理目標(biāo)事件。消費(fèi)級(jí)的物聯(lián)網(wǎng)設(shè)備通常采用云服務(wù)來(lái)提供某種智能，然而其所依賴(lài)的優(yōu)質(zhì)互聯(lián)網(wǎng)連接，僅僅在部分范圍內(nèi)可用，并且往往需要較高的成本，這對(duì)設(shè)備能否滿(mǎn)足實(shí)時(shí)性要求提出了挑戰(zhàn)。與之相比，直接在物聯(lián)網(wǎng)設(shè)備上實(shí)現(xiàn)深度學(xué)習(xí)或許是一個(gè)更好的選擇，這樣就可以免受連接質(zhì)量的影響。

然而，直接在嵌入式設(shè)備上實(shí)現(xiàn)深度學(xué)習(xí)是困難的。事實(shí)上，低功耗是移動(dòng)物聯(lián)網(wǎng)設(shè)備的主要特征，而這通常意味著計(jì)算能力受限，內(nèi)存容量較小。在軟件方面，為了減少內(nèi)存占用，應(yīng)用程序通常直接運(yùn)行在裸機(jī)上，或者在包含極少量第三方庫(kù)的輕量級(jí)操作系統(tǒng)上。而與之相反，深度學(xué)習(xí)意味著高性能計(jì)算，并伴隨著高功耗。此外，現(xiàn)有的深度學(xué)習(xí)庫(kù)通常需要調(diào)用許多第三方庫(kù)，而這些庫(kù)很難遷移到物聯(lián)網(wǎng)設(shè)備。

在深度學(xué)習(xí)任務(wù)中，最廣泛使用的神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)（CNNs），它能夠?qū)⒎墙Y(jié)構(gòu)化的圖像數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化的對(duì)象標(biāo)簽數(shù)據(jù)。一般來(lái)說(shuō)，CNNs的工作流程如下：首先，卷積層掃描輸入圖像以生成特征向量；第二步，激活層確定在圖像推理過(guò)程中哪些特征向量應(yīng)該被激活使用；第三步，使用池化層降低特征向量的大小；最后，使用全連接層將池化層的所有輸出和輸出層相連。

在本文中，我們將討論如何使用CNN推理機(jī)在物聯(lián)網(wǎng)設(shè)備上實(shí)現(xiàn)深度學(xué)習(xí)。

將服務(wù)遷移到云端

對(duì)于低功耗的物聯(lián)網(wǎng)設(shè)備，問(wèn)題在于是否存在一個(gè)可靠的解決方案，能夠?qū)⑸疃葘W(xué)習(xí)部署在云端，同時(shí)滿(mǎn)足功耗和性能的要求。為了回答這個(gè)問(wèn)題，我們?cè)谝粔KNvidia Jetson TX1設(shè)備上實(shí)現(xiàn)了基于CNN的物體推理，并將其性能、功耗與將這些服務(wù)遷移到云端后的情況進(jìn)行對(duì)比。

為了確定將服務(wù)遷移到云端后，是否可以降低功耗并滿(mǎn)足對(duì)物體識(shí)別任務(wù)的實(shí)時(shí)性要求，我們將圖像發(fā)送到云端，然后等待云端將結(jié)果返回。研究表明，對(duì)于物體識(shí)別任務(wù)，本地執(zhí)行的功耗為7 W，而遷移到云端后功耗降低為2W。這說(shuō)明將服務(wù)遷移到云端確實(shí)是降低功耗的有效途徑。

然而，遷移到云端會(huì)導(dǎo)致至少2秒的延遲，甚至可能高達(dá)5秒，這不能滿(mǎn)足我們500ms的實(shí)時(shí)性要求。此外，延遲的劇烈抖動(dòng)使得服務(wù)非常不可靠（作為對(duì)比，我們?cè)诿绹?guó)和中國(guó)分別運(yùn)行這些實(shí)驗(yàn)進(jìn)行觀(guān)察）。通過(guò)這些實(shí)驗(yàn)我們得出結(jié)論，在當(dāng)前的網(wǎng)絡(luò)環(huán)境下，將實(shí)時(shí)性深度學(xué)習(xí)任務(wù)遷移到云端是一個(gè)尚未可行的解決方案。

移植深度學(xué)習(xí)平臺(tái)到嵌入式設(shè)備

相比遷移到云端的不切實(shí)際，一個(gè)選擇是將現(xiàn)有的深度學(xué)習(xí)平臺(tái)移植到物聯(lián)網(wǎng)設(shè)備。為此，我們選擇移植由Google開(kāi)發(fā)并開(kāi)源的深度學(xué)習(xí)平臺(tái)TesnsorFlow來(lái)建立具有物體推理能力的物聯(lián)網(wǎng)設(shè)備Zuluko——PerceptIn的裸機(jī)ARM片上系統(tǒng)。Zuluko由四個(gè)運(yùn)行在1 GHz的ARM v7內(nèi)核和512 MB RAM組成，峰值功耗約為3W。根據(jù)我們的研究，在基于ARM-Linux的片上系統(tǒng)上，TensorFlow能夠提供最佳性能，這也是我們選擇它的原因。

我們預(yù)計(jì)能夠在幾天內(nèi)完成移植工作，然而，移植TensorFlow并不容易，它依賴(lài)于許多第三方庫(kù)（見(jiàn)圖1）。為了減少資源消耗，大多數(shù)物聯(lián)網(wǎng)設(shè)備都運(yùn)行在裸機(jī)上，因此移植所有依賴(lài)項(xiàng)可以說(shuō)是一項(xiàng)艱巨的任務(wù)。我們花了一個(gè)星期的精力才使得TensorFlow得以在Zuluko上運(yùn)行。此次經(jīng)驗(yàn)也使我們重新思考，相比移植一個(gè)現(xiàn)有的平臺(tái)，是否從頭開(kāi)始構(gòu)建一個(gè)新平臺(tái)更值得。然而缺乏諸如卷積算子等基本的構(gòu)建塊，從頭開(kāi)始構(gòu)建并不容易。此外，從頭開(kāi)始構(gòu)建的推理機(jī)也很難比一個(gè)久經(jīng)測(cè)試的深度學(xué)習(xí)框架表現(xiàn)更優(yōu)。

圖1 TensorFlow對(duì)第三方庫(kù)的依賴(lài)。因?yàn)橐蕾?lài)于許多第三方庫(kù)，將現(xiàn)有的深度學(xué)習(xí)平臺(tái)（如TensorFlow）移植到物聯(lián)網(wǎng)設(shè)備并不是一個(gè)簡(jiǎn)單的過(guò)程。

從頭開(kāi)始構(gòu)建推理機(jī)

ARM最近宣布推出其計(jì)算庫(kù)（ACL，developer.arm.com/technologies/compute-library），為ARM Cortex-A系列CPU 處理器和ARM Mali系列GPU實(shí)現(xiàn)了軟件功能的綜合集成。具體而言，ACL為CNNs提供了基本的構(gòu)建模塊，包括激活、卷積、全連接和局部連接、規(guī)范化、池化和softmax功能。這些功能正是我們建立推理機(jī)所需要的。

我們使用ACL構(gòu)建塊構(gòu)建了一個(gè)具有SqueezeNet架構(gòu)的CNN推理機(jī)，其內(nèi)存占用空間小，適合于嵌入式設(shè)備。SqueezeNet在保持相似的推理精度的同時(shí)，使用1×1卷積核來(lái)減少3×3卷積層的輸入大小。然后，我們將SqueezeNet推理機(jī)的性能與Zuluko上的TensorFlow進(jìn)行比較。為了確保比較的公平性，我們啟用了TensorFlow中的ARM NEON向量計(jì)算優(yōu)化，并在創(chuàng)建SqueezeNet引擎時(shí)使用了支持NEON的構(gòu)建塊。確保兩個(gè)引擎都使用了NEON向量計(jì)算，這樣任何性能差異將僅由平臺(tái)本身引起。如圖2所示，平均來(lái)言，TensorFlow處理227×227像素的RGB圖像需要420 ms，而SqueezeNet將處理相同圖像的時(shí)間縮短到320ms，加速了25％。

圖2 在TensorFlow上運(yùn)行的SqueezeNet推理機(jī)與使用ARM Compute Library（ACL）構(gòu)建的SqueezeNet推理機(jī)的性能。從頭開(kāi)始構(gòu)建簡(jiǎn)單的推理引擎不僅需要較少的開(kāi)發(fā)時(shí)間，而且相比現(xiàn)有的深度學(xué)習(xí)引擎，如TensorFlow，表現(xiàn)更加優(yōu)秀。

為了更好地了解性能增益的來(lái)源，我們將執(zhí)行過(guò)程分為兩部分：第一部分包括卷積、ReLU（線(xiàn)性整流函數(shù)）激活和級(jí)聯(lián)；第二部分包括池化和softmax功能。圖2所示的分析表明，SqueezeNet在第一部分中的性能相比TensorFlow提高23％，在第二部分中提高110％。考慮資源利用率，當(dāng)在TensorFlow上運(yùn)行時(shí)，平均CPU使用率為75％，平均內(nèi)存使用量為9MB;當(dāng)在SqueezeNet上運(yùn)行時(shí)，平均CPU使用率為90％，平均內(nèi)存使用量約為10MB。兩個(gè)原因帶來(lái)了性能的提升：首先，SqueezeNet提供了更好的NEON優(yōu)化，所有ACL運(yùn)算符都是使用NEON提供的運(yùn)算符直接開(kāi)發(fā)的，而TensorFlow則依靠ARM編譯器來(lái)提供NEON優(yōu)化。其次，TensorFlow平臺(tái)本身可能會(huì)引起一些額外的性能開(kāi)銷(xiāo)。

接下來(lái)，我們希望能夠從TensorFlow中榨出更多的性能，看看它是否能勝過(guò)我們構(gòu)建的SqueezeNet推理機(jī)。一種常用的技術(shù)是使用矢量量化，使用8位權(quán)重以精度來(lái)?yè)Q取性能。8位權(quán)重的使用，使得我們可以通過(guò)向量操作，只需一個(gè)指令便可計(jì)算多個(gè)數(shù)據(jù)單元。然而，這種優(yōu)化是有代價(jià)的：它引入了重新量化和去量化操作。我們?cè)赥ensorFlow中實(shí)現(xiàn)了這個(gè)優(yōu)化，圖3比較了有無(wú)優(yōu)化的性能。使用矢量量化將卷積性能提高了25％，但由于去量化和重新量化操作，也顯著地增加了開(kāi)銷(xiāo)。總體而言，它將整個(gè)推理過(guò)程減慢了超過(guò)100毫秒。

圖3 有無(wú)矢量量化的TensorFlow性能。手動(dòng)優(yōu)化現(xiàn)有的深度學(xué)習(xí)平臺(tái)（如TensorFlow）很困難，可能不會(huì)帶來(lái)顯著的性能提升。

網(wǎng)絡(luò)連接是易失的，因此我們想要確保能夠在本地設(shè)備上實(shí)現(xiàn)某種形式的智能，使其能夠在ISP或網(wǎng)絡(luò)故障的情況下繼續(xù)運(yùn)行。然而要想實(shí)現(xiàn)它，需要較高的計(jì)算性能和功耗。

盡管將服務(wù)遷移到云端能夠減少物聯(lián)網(wǎng)設(shè)備的功耗，但很難滿(mǎn)足實(shí)時(shí)性要求。而且現(xiàn)有的深度學(xué)習(xí)平臺(tái)是為了通用性任務(wù)而設(shè)計(jì)開(kāi)發(fā)的，同時(shí)適用于訓(xùn)練和推理任務(wù)，這意味著這些引擎未針對(duì)嵌入式推理任務(wù)進(jìn)行優(yōu)化。并且它們還依賴(lài)于裸機(jī)嵌入式系統(tǒng)上不易獲得的其他第三方庫(kù)，這些都使其非常難以移植。

通過(guò)使用ACL構(gòu)建塊來(lái)建立嵌入式CNN推理引擎，我們可以充分利用SoC的異構(gòu)計(jì)算資源獲得高性能。因此，問(wèn)題變?yōu)槭沁x擇移植現(xiàn)有引擎，還是從零開(kāi)始構(gòu)建它們更容易。我們的經(jīng)驗(yàn)表明，如果模型很簡(jiǎn)單，相比之下從頭開(kāi)始構(gòu)建它們?nèi)菀椎枚唷６S著模型越來(lái)越復(fù)雜，在某些情況下，可能我們遷移現(xiàn)有引擎相對(duì)更加高效。然而，考慮到嵌入式設(shè)備實(shí)際運(yùn)行的任務(wù)，不大可能會(huì)需要用到復(fù)雜的模型。因此我們得出結(jié)論，從頭開(kāi)始構(gòu)建一個(gè)嵌入式推理引擎或許是向物聯(lián)網(wǎng)設(shè)備提供深度學(xué)習(xí)能力的可行方法。

更進(jìn)一步

相比從頭開(kāi)始手動(dòng)構(gòu)建模型，我們需要一種更方便的方式來(lái)在物聯(lián)網(wǎng)設(shè)備上提供深度學(xué)習(xí)能力。一個(gè)解決方案是實(shí)現(xiàn)一個(gè)深度學(xué)習(xí)的模型編譯器，可以將給定的模型經(jīng)過(guò)優(yōu)化，編譯為目標(biāo)平臺(tái)上的可執(zhí)行代碼。如圖4中間的圖所示，這種編譯器的前端可以從主要的深度學(xué)習(xí)平臺(tái)（包括MXNet、Caffe、TensorFlow等）解析模型。然后，優(yōu)化器可以執(zhí)行額外的優(yōu)化，包括模型修剪，量化和異構(gòu)執(zhí)行。優(yōu)化后，由代碼生成器生成目標(biāo)平臺(tái)上可執(zhí)行代碼，可以是ACL（用于ARM設(shè)備），TensorRT（用于Nvidia GPU）或其他ASIC設(shè)備。

圖4 物聯(lián)網(wǎng)設(shè)備服務(wù)架構(gòu)。我們需要一個(gè)新的系統(tǒng)架構(gòu)來(lái)實(shí)現(xiàn)物聯(lián)網(wǎng)設(shè)備上的深度學(xué)習(xí)：首先，我們需要直接編譯和優(yōu)化深度學(xué)習(xí)模型生成目標(biāo)設(shè)備上的可執(zhí)行代碼; 其次，我們需要一個(gè)非常輕量級(jí)的操作系統(tǒng)，以實(shí)現(xiàn)多任務(wù)及其間的高效通信。IMU：慣性測(cè)量單元。

NNVM項(xiàng)目（github.com/dmlc/nnvm）是邁向這一目標(biāo)的第一步。我們已經(jīng)成功地?cái)U(kuò)展了NNVM來(lái)生成代碼，以便我們可以使用ACL來(lái)加速ARM設(shè)備上的深度學(xué)習(xí)操作。這種方法的另一個(gè)好處是，即使模型變得更加復(fù)雜，我們?nèi)匀豢梢暂p松地在物聯(lián)網(wǎng)設(shè)備上實(shí)現(xiàn)它們。

當(dāng)前的物聯(lián)網(wǎng)設(shè)備通常由于計(jì)算資源的限制而執(zhí)行單個(gè)任務(wù)。然而，我們預(yù)計(jì)很快將有能夠執(zhí)行多個(gè)任務(wù)的低功耗物聯(lián)網(wǎng)設(shè)備（例如，我們的Zuluko設(shè)備就包含了四個(gè)內(nèi)核）。為了使用這些設(shè)備，我們需要一個(gè)非常輕量級(jí)的消息傳遞協(xié)議來(lái)連接不同的服務(wù)。

如圖4所示，物聯(lián)網(wǎng)設(shè)備的基本服務(wù)包括傳感，感知和決策。傳感節(jié)點(diǎn)涉及處理來(lái)自例如攝像機(jī)，慣性測(cè)量單元和車(chē)輪測(cè)距的原始傳感器數(shù)據(jù)。感知節(jié)點(diǎn)使用已處理的傳感器數(shù)據(jù)，并對(duì)所捕獲的信息進(jìn)行解釋?zhuān)鐚?duì)象標(biāo)簽和設(shè)備位置。動(dòng)作節(jié)點(diǎn)包含一組規(guī)則，用于確定在檢測(cè)到特定事件時(shí)如何響應(yīng)，例如在檢測(cè)到所有者的臉部時(shí)解鎖門(mén)，或者當(dāng)檢測(cè)到障礙物時(shí)調(diào)整機(jī)器人的運(yùn)動(dòng)路徑。Nanomsg（nanomsg.org）是一個(gè)非常輕量級(jí)的消息傳遞框架，非常適合類(lèi)似的任務(wù)。另一個(gè)選擇是機(jī)器人操作系統(tǒng)，盡管我們發(fā)現(xiàn)對(duì)于物聯(lián)網(wǎng)設(shè)備來(lái)說(shuō)，其在內(nèi)存占用和計(jì)算資源需求方面顯得太重了。

為了有效地將深度學(xué)習(xí)與物聯(lián)網(wǎng)設(shè)備集成，我們開(kāi)發(fā)了自己的操作系統(tǒng)，包括用于消費(fèi)級(jí)傳感器輸入的傳感器接口，基于NNVM的編譯器，將現(xiàn)有的深度學(xué)習(xí)模型編譯并優(yōu)化為可執(zhí)行代碼，以及基于Nanomsg的消息傳輸框架來(lái)連接所有的節(jié)點(diǎn)。

筆者希望本文將激勵(lì)研究人員和開(kāi)發(fā)人員，在比以往更小的嵌入式設(shè)備中設(shè)計(jì)更加智能的物聯(lián)網(wǎng)系統(tǒng)。

閱讀全文

上一頁(yè)1 2 3全文

IOT(192934) IOT(192934)
深度學(xué)習(xí)(119797) 深度學(xué)習(xí)(119797)
cnn(21235) cnn(21235)

評(píng)論

相關(guān)推薦

通過(guò)FPGA實(shí)現(xiàn)深度神經(jīng)網(wǎng)絡(luò)的解決方案

BNN 的可用解決方案。該解決方案將用于展示如何利用一小部分 CNN 資源要求，為低功耗 KWS 應(yīng)用實(shí)現(xiàn) CNN 的高精度。

2019-03-19 08:58:00

11812

深度學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)分享：CNN經(jīng)典網(wǎng)絡(luò)之-ResNet

深度學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)分享：CNN 經(jīng)典網(wǎng)絡(luò)之-ResNet resnet 又叫深度殘差網(wǎng)絡(luò) 圖像識(shí)別準(zhǔn)確率很高，主要作者是國(guó)人哦深度網(wǎng)絡(luò)的退化問(wèn)題深度網(wǎng)絡(luò)難以訓(xùn)練，梯度消失，梯度爆炸

2022-10-12 09:54:42

685

IoT應(yīng)用和聯(lián)接IoT設(shè)備有什么挑戰(zhàn)？

幾乎無(wú)盡的市場(chǎng)和應(yīng)用可通過(guò)物聯(lián)網(wǎng)(IoT)享有改進(jìn)的生產(chǎn)力、控制和效率。許多提供互聯(lián)技術(shù)的產(chǎn)品和系統(tǒng)在可能受益于IoT之前還沒(méi)有使用。感知、處理、驅(qū)動(dòng)和互聯(lián)是IoT設(shè)計(jì)的塊，模塊化、即插即用的方案

2019-08-09 06:25:51

深度學(xué)習(xí)推理和計(jì)算-通用AI核心

摘要與深度學(xué)習(xí)算法的進(jìn)步超越硬件的進(jìn)步，你如何確保算法明天是一個(gè)很好的適合現(xiàn)有的人工智能芯片下發(fā)展？，這些人工智能芯片大多是為今天的人工智能算法算法進(jìn)化，這些人工智能芯片的許多設(shè)計(jì)都可能成為甚至在

2020-11-01 09:28:57

深度學(xué)習(xí)DeepLearning實(shí)戰(zhàn)

內(nèi)容2:課程一： Tensorflow入門(mén)到熟練：課程二：圖像分類(lèi)：課程三：物體檢測(cè)：課程四：人臉識(shí)別：課程五：算法實(shí)現(xiàn)：1、卷積神經(jīng)網(wǎng)絡(luò)CNN2、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN3、強(qiáng)化學(xué)習(xí)DRL4、對(duì)抗性生成

2021-01-09 17:01:54

深度學(xué)習(xí)與數(shù)據(jù)挖掘的關(guān)系

理解，但是在其高冷的背后，卻有深遠(yuǎn)的應(yīng)用場(chǎng)景和未來(lái)。深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的一種方式或一條路徑。其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)，它模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù)。比如其按特定的物理距離連接

2018-07-04 16:07:53

深度學(xué)習(xí)介紹

的網(wǎng)絡(luò)最終來(lái)實(shí)現(xiàn)更通用的識(shí)別。這些多層的優(yōu)點(diǎn)是各種抽象層次的學(xué)習(xí)特征。例如，若訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)（CNN）來(lái)對(duì)圖像進(jìn)行分類(lèi)，則第一層學(xué)習(xí)識(shí)別邊緣等最基本的東西…

2022-11-11 07:55:50

深度學(xué)習(xí)入門(mén)之基于python的理論與實(shí)現(xiàn)

深度學(xué)習(xí)入門(mén)-基于python的理論與實(shí)現(xiàn)(2)

2020-06-19 11:22:23

深度學(xué)習(xí)在汽車(chē)中的應(yīng)用

嵌入式開(kāi)發(fā)和平臺(tái)抽象；在TI硬件上實(shí)現(xiàn)用于加速CNN的高度優(yōu)化的內(nèi)核，以及支持從開(kāi)放框架（如Caffe和TensorFlow）到使用TIDL應(yīng)用程序編程界面的嵌入式框架進(jìn)行網(wǎng)絡(luò)轉(zhuǎn)換的轉(zhuǎn)換器。有關(guān)此解決方案的更多詳細(xì)信息，請(qǐng)閱讀白皮書(shū)“TIDL：嵌入式低功耗深度學(xué)習(xí)，” 并查看其它資源中的視頻。

2019-03-13 06:45:03

深度學(xué)習(xí)存在哪些問(wèn)題？

深度學(xué)習(xí)常用模型有哪些？深度學(xué)習(xí)常用軟件工具及平臺(tái)有哪些？深度學(xué)習(xí)存在哪些問(wèn)題？

2021-10-14 08:20:47

深度學(xué)習(xí)是什么

創(chuàng)客們的最酷“玩具”　　智能無(wú)人機(jī)、自主機(jī)器人、智能攝像機(jī)、自動(dòng)駕駛……今年最令硬件創(chuàng)客們著迷的詞匯，想必就是這些一線(xiàn)“網(wǎng)紅”了。而這些網(wǎng)紅的背后，幾乎都和計(jì)算機(jī)視覺(jué)與深度學(xué)習(xí)密切相關(guān)。　　深度學(xué)習(xí)

2021-07-19 06:17:28

深度學(xué)習(xí)模型是如何創(chuàng)建的？

具有深度學(xué)習(xí)模型的嵌入式系統(tǒng)應(yīng)用程序帶來(lái)了巨大的好處。深度學(xué)習(xí)嵌入式系統(tǒng)已經(jīng)改變了各個(gè)行業(yè)的企業(yè)和組織。深度學(xué)習(xí)模型可以幫助實(shí)現(xiàn)工業(yè)流程自動(dòng)化，進(jìn)行實(shí)時(shí)分析以做出決策，甚至可以預(yù)測(cè)預(yù)警。這些AI

2021-10-27 06:34:15

深度強(qiáng)化學(xué)習(xí)實(shí)戰(zhàn)

內(nèi)容2:課程一： TensoRFlow入門(mén)到熟練：課程二：圖像分類(lèi)：課程三：物體檢測(cè)：課程四：人臉識(shí)別：課程五：算法實(shí)現(xiàn)：1、卷積神經(jīng)網(wǎng)絡(luò)CNN2、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN3、強(qiáng)化學(xué)習(xí)DRL4、對(duì)抗性生成

2021-01-10 13:42:26

Arm Neoverse V1的AWS Graviton3在深度學(xué)習(xí)推理工作負(fù)載方面的作用

機(jī)器學(xué)習(xí) (ML) 是云和邊緣基礎(chǔ)設(shè)施中增長(zhǎng)最快的部分之一。在 ML 中，深度學(xué)習(xí)推理預(yù)計(jì)會(huì)增長(zhǎng)得更快。在本博客中，我們比較了三種 Amazon Web Services (AWS) EC2 云實(shí)例

2022-08-31 15:03:46

Azure IoT 怎么使用？

Azure IoT 中心是一項(xiàng)完全托管的服務(wù)，有助于在數(shù)百萬(wàn)臺(tái)設(shè)備和單個(gè)解決方案后端之間實(shí)現(xiàn)安全可靠的雙向通信。那么Azure IoT 怎么使用？

2021-04-02 07:49:51

Dllite_micro （輕量級(jí)的 AI 推理框架）

DLLite-Micro 是一個(gè)輕量級(jí)的 AI 推理框架，可以為 OpenHarmony OS 的輕量設(shè)備和小型設(shè)備提供深度模型的推理能力DLLite-Micro 向開(kāi)發(fā)者提供清晰、易上手的北向接口

2021-08-05 11:40:11

FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

硬件公司供貨的不斷增加，GPU 在深度學(xué)習(xí)中的市場(chǎng)需求還催生了大量公共云服務(wù)，這些服務(wù)為深度學(xué)習(xí)項(xiàng)目提供強(qiáng)大的 GPU 虛擬機(jī)。但是顯卡也受硬件和環(huán)境的限制。Larzul 解釋說(shuō)：“神經(jīng)網(wǎng)絡(luò)訓(xùn)練

2024-03-21 15:19:45

Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

設(shè)備”，沒(méi)錯(cuò)，雖然Nanopi迷你，但確實(shí)能夠運(yùn)行深度學(xué)習(xí)算法。但試用機(jī)會(huì)少的可憐，只有5個(gè)，難道一定要對(duì)申請(qǐng)志在必得嗎？NO！NO！NO！深度學(xué)習(xí)并不僅僅是好一點(diǎn)的Nanopi的特權(quán)，Nanopi2

2018-06-04 22:32:12

TDA4對(duì)深度學(xué)習(xí)的重要性

快速的部署到TI嵌入式平臺(tái)。 TDA4擁有TI最新一代的深度學(xué)習(xí)加速模塊C7x DSP與MMA矩陣乘法加速器，可以運(yùn)行TIDL進(jìn)行卷積等基本計(jì)算，從而快速地進(jìn)行前向推理，得到計(jì)算結(jié)果。當(dāng)深度學(xué)習(xí)遇上

2022-11-03 06:53:11

TF之CNN：CNN實(shí)現(xiàn)mnist數(shù)據(jù)集預(yù)測(cè)

TF之CNN：CNN實(shí)現(xiàn)mnist數(shù)據(jù)集預(yù)測(cè) 96%采用placeholder用法+2層C及其max_pool法+隱藏層dropout法+輸出層softmax法+目標(biāo)函數(shù)cross_entropy法+

2018-12-19 17:02:40

labview實(shí)現(xiàn)深度學(xué)習(xí)，還在用python？

如何使用labview實(shí)現(xiàn)深度學(xué)習(xí)應(yīng)用。ok樣本ng樣本這些圖片的特征是：ok與ok，ng與ng之間都有差異，傳統(tǒng)的方法要實(shí)現(xiàn)，就需要復(fù)雜的算法編程實(shí)現(xiàn)，如果用深度學(xué)習(xí)，則非常簡(jiǎn)單。1.準(zhǔn)備好樣本庫(kù)

2020-07-23 20:33:10

labview測(cè)試tensorflow深度學(xué)習(xí)SSD模型識(shí)別物體

安裝labview2019 vision，自帶深度學(xué)習(xí)推理工具，支持tensorflow模型。配置好python下tensorflow環(huán)境配置好object_detection API下載SSD模型

2020-08-16 17:21:38

【NanoPi K1 Plus試用體驗(yàn)】搭建深度學(xué)習(xí)框架

，使其更緊湊和更易debug，并提供了擴(kuò)展的便利性。課程內(nèi)容基本上是以代碼編程為主，也會(huì)有少量的深度學(xué)習(xí)理論內(nèi)容。課程會(huì)一步一步從Keras環(huán)境安裝開(kāi)始講解，并從最基礎(chǔ)的Keras實(shí)現(xiàn)線(xiàn)性回歸

2018-07-17 11:40:31

【詳解】FPGA：深度學(xué)習(xí)的未來(lái)？

，深度學(xué)習(xí)技術(shù)經(jīng)常在多節(jié)點(diǎn)計(jì)算基礎(chǔ)架構(gòu)間進(jìn)行拓展。目前的解決方案使用具備Infiniband互連技術(shù)的GPU集群和MPI，從而實(shí)現(xiàn)上層的并行計(jì)算能力和節(jié)點(diǎn)間數(shù)據(jù)的快速傳輸。然而，當(dāng)大規(guī)模應(yīng)用的負(fù)載

2018-08-13 09:33:30

【飛凌RK3568開(kāi)發(fā)板試用體驗(yàn)】RKNN模型推理測(cè)試

MobileNet是Google團(tuán)隊(duì)2017年提出一個(gè)深度學(xué)習(xí)模型，專(zhuān)注于移動(dòng)端或者嵌入式設(shè)備中的輕量級(jí)CNN網(wǎng)絡(luò)。模型推理中卷積操作占用了大部分的時(shí)間，因此MobileNet V1使用了深度可分離卷積對(duì)卷積

2022-12-08 19:06:16

一個(gè)利用物理系統(tǒng)實(shí)現(xiàn)深層網(wǎng)絡(luò)學(xué)習(xí)和推理的框架

看到這個(gè)文章都會(huì)有疑問(wèn)：這類(lèi)常見(jiàn)到的揚(yáng)聲器、三極管、光學(xué)透鏡怎么就能夠像深度學(xué)習(xí)網(wǎng)絡(luò)那樣完成學(xué)習(xí)訓(xùn)練和推理的呢？特別是這其中都是一些常見(jiàn)到的物理系統(tǒng)，這里面并沒(méi)有包含什么量子計(jì)算機(jī)、神經(jīng)計(jì)算機(jī)之類(lèi)結(jié)構(gòu)

2022-09-26 16:14:55

一層卷積能做啥？一層卷積可以做超分嗎？

高效運(yùn)行深度學(xué)習(xí)任務(wù)的硬件的迅速發(fā)展，AI芯片發(fā)展趨勢(shì)呈現(xiàn)出了非常好的前景；另一方面，只有少數(shù)SR架構(gòu)能夠在端側(cè)設(shè)備上實(shí)時(shí)處理非常小尺寸圖像。　　我們對(duì)該問(wèn)題的可能方案進(jìn)行了探索以期彌補(bǔ)經(jīng)典上采樣與輕量

2023-03-06 14:05:36

一文詳解CNN

1 CNN簡(jiǎn)介 CNN即卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks)，是一類(lèi)包含卷積計(jì)算的神經(jīng)網(wǎng)絡(luò)，是深度學(xué)習(xí)（deep learning）的代表算法之一，在圖像識(shí)別

2023-08-18 06:56:34

人工智能深度學(xué)習(xí)發(fā)展迅速，智能科技公司都已經(jīng)涉足人工智能產(chǎn)品的研發(fā)！

深度學(xué)習(xí)（Deep Learning）核心技術(shù)開(kāi)發(fā)與應(yīng)用1,Deep Learning—循環(huán)神經(jīng)網(wǎng)絡(luò)2,Deep Learning—CNN應(yīng)用案例3,Deep Learning—對(duì)抗性生成網(wǎng)絡(luò)4

2018-09-05 10:22:34

什么是深度學(xué)習(xí)？

深度學(xué)習(xí)是什么意思

2020-11-11 06:58:03

什么是深度學(xué)習(xí)？使用FPGA進(jìn)行深度學(xué)習(xí)的好處？

延遲，這對(duì)深度學(xué)習(xí)推理也很有效。上述圖像識(shí)別的深度學(xué)習(xí)有望應(yīng)用于自動(dòng)駕駛等對(duì)精度要求較高的系統(tǒng)中。然而，由于它也是一個(gè)具有嚴(yán)格延遲約束的系統(tǒng)，因此可能難以通過(guò) CPU 和 GPU 實(shí)現(xiàn)，它們?nèi)菀资艿?/div>

2023-02-17 16:56:59

什么是TD-LTE深度覆蓋解決方案？

通信技術(shù)發(fā)展的日新月異,對(duì)深度覆蓋的要求越來(lái)越高.什么是TD-LTE深度覆蓋解決方案？這些方案有什么優(yōu)勢(shì)？

2019-08-14 07:35:24

介紹英特爾?分布式OpenVINO?工具包

性能。英特爾?OpenlandOpen?管理軟件包包括英特爾?深度學(xué)習(xí)部署工具包（英特爾?DLDT）。適用于Linux *的OpenVINO?工具包的英特爾?分發(fā)版：在邊緣啟用基于CNN的深度學(xué)習(xí)推理通過(guò)

2021-07-26 06:45:21

充分利用Arm NN進(jìn)行GPU推理

計(jì)算（GPGPU），尤其是用作將運(yùn)算符實(shí)現(xiàn)為計(jì)算著色器的推理引擎的后端。GPU推理不僅具有優(yōu)于CPU推理的性能，還具有其他優(yōu)勢(shì)。在移動(dòng)CPU上執(zhí)行深度神經(jīng)網(wǎng)絡(luò)推理會(huì)帶來(lái)不必要的功耗增加成本，這會(huì)不利

2022-04-11 17:33:06

卷積神經(jīng)網(wǎng)絡(luò)CNN介紹

【深度學(xué)習(xí)】卷積神經(jīng)網(wǎng)絡(luò)CNN

2020-06-14 18:55:37

壓縮模型會(huì)加速推理嗎？

你好我使用 STM32CUBE-AI v5.1.2 ApplicationTemplate 將簡(jiǎn)單的 CNN 導(dǎo)入到 STM32L462RCT我發(fā)現(xiàn)壓縮模型對(duì)推理時(shí)間沒(méi)有影響。aiRun 程序在 8

2023-01-29 06:24:08

可分離卷積神經(jīng)網(wǎng)絡(luò)在 Cortex-M 處理器上實(shí)現(xiàn)關(guān)鍵詞識(shí)別

，接下來(lái)是密集全連接層。● 深度可分離卷積神經(jīng)網(wǎng)絡(luò) (DS-CNN)最近，深度可分離卷積神經(jīng)網(wǎng)絡(luò)被推薦為標(biāo)準(zhǔn) 3D 卷積運(yùn)算的高效替代方案，并已用于實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)的緊湊網(wǎng)絡(luò)架構(gòu)。DS-CNN 首先使用獨(dú)立

2021-07-26 09:46:37

基于深度學(xué)習(xí)的物聯(lián)網(wǎng)前端設(shè)備

作者：Liran Bar，CEVA成像與視覺(jué)DSP核心產(chǎn)品線(xiàn)市場(chǎng)總監(jiān)機(jī)器學(xué)習(xí)正快速成為物聯(lián)網(wǎng)（IoT）設(shè)備不可分割的特征。家用電器開(kāi)始裝備可以智能地回應(yīng)自然語(yǔ)音的語(yǔ)音驅(qū)動(dòng)接口。機(jī)器人開(kāi)始通過(guò)智能手機(jī)相機(jī)上的演示視頻學(xué)習(xí)如何在工廠(chǎng)車(chē)間移動(dòng)材料并為其他機(jī)器編程……

2019-07-19 08:21:38

基于賽靈思FPGA的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)設(shè)計(jì)

FPGA 上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) (CNN)。CNN 是一類(lèi)深度神經(jīng)網(wǎng)絡(luò)，在處理大規(guī)模圖像識(shí)別任務(wù)以及與機(jī)器學(xué)習(xí)類(lèi)似的其他問(wèn)題方面已大獲成功。在當(dāng)前案例中,針對(duì)在 FPGA 上實(shí)現(xiàn) CNN 做一個(gè)可行性研究

2019-06-19 07:24:41

好奇~！谷歌的 Edge TPU 專(zhuān)用 ASIC 旨在將機(jī)器學(xué)習(xí)推理能力引入邊緣設(shè)備

的 Edge TPU 扮演著關(guān)鍵角色——這款專(zhuān)用 ASIC 旨在將機(jī)器學(xué)習(xí)推理能力引入邊緣設(shè)備。在近一年之后，兩款產(chǎn)品以“Coral”的名號(hào)推出了“Beta 測(cè)試版”，且目前已經(jīng)可供感興趣的朋友購(gòu)買(mǎi)。另外，這

2019-03-05 21:20:23

如何實(shí)現(xiàn)嵌入式平臺(tái)與深度學(xué)習(xí)的智能氣象監(jiān)測(cè)儀器的設(shè)計(jì)

基于嵌入式平臺(tái)與深度學(xué)習(xí)的智能氣象監(jiān)測(cè)儀器設(shè)計(jì)方案一、概述二、整體框架三、人工智能部分：四、嵌入式部分4.1安卓主控4.2協(xié)處理器五、人機(jī)交互一、概述以目前常見(jiàn)移動(dòng)設(shè)備的存儲(chǔ)和計(jì)算能力，是不可能實(shí)現(xiàn)

2021-11-09 09:14:46

如何在嵌入式平臺(tái)實(shí)現(xiàn)CNN

單片機(jī)（Cortex-M內(nèi)核，無(wú)操作系統(tǒng)）可以跑深度學(xué)習(xí)嗎？ ——Read Air 2019.8.20Xu_CNN框架待處理：1.需要設(shè)計(jì)一個(gè)可讀寫(xiě)的消息棧（）2.函數(shù)的類(lèi)型參數(shù)使用結(jié)構(gòu)體傳入（已實(shí)現(xiàn)）3.動(dòng)態(tài)...

2021-12-09 08:02:27

當(dāng)AI遇上FPGA會(huì)產(chǎn)生怎樣的反應(yīng)

是人工智能大躍進(jìn)的基礎(chǔ)，在線(xiàn)下模型訓(xùn)練中Xeon-Phi、GPU等發(fā)揮著巨大的作用，而在線(xiàn)上的推理任務(wù)中，浪潮FPGA深度學(xué)習(xí)加速解決方案則能夠實(shí)現(xiàn)7倍以上的能效比提升。卷積網(wǎng)絡(luò)之父、Facebook

2021-09-17 17:08:32

怎么實(shí)現(xiàn)阿里云IOT與單片機(jī)的對(duì)接？

、燒錄、下載至單片機(jī)后通過(guò)串口調(diào)試助手能夠實(shí)現(xiàn)配置連接WIFI加入網(wǎng)絡(luò)，和遠(yuǎn)端服務(wù)器建立TCP聯(lián)系，但是云端設(shè)備始終處于未激活狀態(tài)，查找了很多做IOT通信方面的例程，很多例程都是基于云的SDK...

2021-11-22 06:55:04

探討一下深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用

下面來(lái)探討一下深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用，具體如下：1、深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究，包含多個(gè)隱層的多層感知器(MLP) 是一種原始的深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象

2021-10-27 08:02:31

探討機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的差異

學(xué)術(shù)專(zhuān)家對(duì) CNN 架構(gòu)進(jìn)行研究並舉辦比賽，目前較熱門(mén)的 CNN 模型有 LeNet、VGG、ResNet 等等，並經(jīng)由研究得知只要架構(gòu)的深度夠深，對(duì)於模型的準(zhǔn)確度越高，故而稱(chēng)為深度學(xué)習(xí)。大聯(lián)大旗下世平集團(tuán) ATU 部門(mén)可以提供相關(guān)設(shè)計(jì)方案，需要請(qǐng)聯(lián)繫 atu.cn@wpi-group.com

2019-09-20 09:05:05

有什么方法可以實(shí)現(xiàn)高能效IoT設(shè)備嗎？

如何利用模塊化平臺(tái)去實(shí)現(xiàn)高能效IoT設(shè)備？

2021-05-19 07:07:35

淺談深度學(xué)習(xí)之TensorFlow

使得實(shí)現(xiàn)復(fù)雜的 DNN 結(jié)構(gòu)成為可能，而不需要深入復(fù)雜的數(shù)學(xué)細(xì)節(jié)，大數(shù)據(jù)集的可用性為 DNN 提供了必要的數(shù)據(jù)來(lái)源。TensorFlow 成為最受歡迎的深度學(xué)習(xí)庫(kù)，原因如下：TensorFlow 是一個(gè)

2020-07-28 14:34:04

討論紋理分析在圖像分類(lèi)中的重要性及其在深度學(xué)習(xí)中使用紋理分析

紋理就能被更準(zhǔn)確地捕捉和分類(lèi)。　　在基于紋理的分類(lèi)任務(wù)重，紋理分析對(duì)于深度學(xué)習(xí)的重要性　　由于紋理基于局部模式，而傳統(tǒng)的深度學(xué)習(xí)方法強(qiáng)調(diào)復(fù)雜的特征，對(duì)紋理分類(lèi)沒(méi)有幫助，因此，傳統(tǒng)的CNN架構(gòu)不能很好

2022-10-26 16:57:26

超低功耗FPGA解決方案助力機(jī)器學(xué)習(xí)

IoT應(yīng)用。通過(guò)提供結(jié)合了靈活、超低功耗FPGA硬件和軟件解決方案、功能全面的機(jī)器學(xué)習(xí)推理技術(shù)，Lattice sensAI將加速網(wǎng)絡(luò)邊緣設(shè)備上傳感器數(shù)據(jù)處理和分析的集成。這些新的網(wǎng)絡(luò)邊緣計(jì)算解決方案

2018-05-23 15:31:04

NVIDIA深度學(xué)習(xí)平臺(tái)

為幫助數(shù)據(jù)科學(xué)家和開(kāi)發(fā)人員充分利用深度學(xué)習(xí)領(lǐng)域中的機(jī)遇，NVIDIA為其深度學(xué)習(xí)軟件平臺(tái)發(fā)布了三項(xiàng)重大更新，它們分別是NVIDIA DIGITS 4、CUDA深度神經(jīng)網(wǎng)絡(luò)庫(kù)(cuDNN)5.1和全新的GPU推理引擎(GIE)。　　 NVIDIA深度學(xué)習(xí)軟件平臺(tái)推三項(xiàng)重大更新

2016-08-06 15:00:26

1806

基于深度學(xué)習(xí)的嵌入視覺(jué)套件

，可以直接將 C 語(yǔ)言綜合到硬件加速模塊。EagleGo HD 可以幫助客戶(hù)快速實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò) CNN 相關(guān)設(shè)計(jì)，代替嵌入式 GPU，實(shí)現(xiàn)低功耗的人工智能前端設(shè)備。典型應(yīng)用：人臉識(shí)別，智能安防，汽車(chē)

2017-02-08 04:42:11

332

基于GPU實(shí)現(xiàn)的深度學(xué)習(xí)的數(shù)據(jù)庫(kù)

項(xiàng)目組基于深度學(xué)習(xí)實(shí)現(xiàn)了視頻風(fēng)格化和人像摳圖的功能，但這是在PC/服務(wù)端上跑的，現(xiàn)在需要移植到移動(dòng)端，因此需要一個(gè)移動(dòng)端的深度學(xué)習(xí)的計(jì)算框架。同類(lèi)型的庫(kù) caffe-Android-lib 目前

2017-09-28 20:02:26

深度學(xué)習(xí)在圖像超清化的應(yīng)用

深度學(xué)習(xí)的出現(xiàn)使得算法對(duì)圖像的語(yǔ)義級(jí)操作成為可能。本文即是介紹深度學(xué)習(xí)技術(shù)在圖像超清化問(wèn)題上的最新研究進(jìn)展。深度學(xué)習(xí)最早興起于圖像，其主要處理圖像的技術(shù)是卷積神經(jīng)網(wǎng)絡(luò)，關(guān)于卷積神經(jīng)網(wǎng)絡(luò)的起源，業(yè)界

2017-09-30 11:15:17

移動(dòng)AI翻譯官：深度學(xué)習(xí)推理突破賦力科大訊飛語(yǔ)音應(yīng)用

分享到從最初星際迷航系列的開(kāi)播之日起，人們就開(kāi)始?jí)粝胫约阂材軗碛幸慌_(tái)袖珍型實(shí)時(shí)翻譯設(shè)備；一直以來(lái)，大家都渴望能夠“破譯”醫(yī)生的筆跡。有賴(lài)于深度學(xué)習(xí)推理方面取得的進(jìn)步，作為中國(guó)最大AI科技公司

2018-02-20 22:49:00

710

深度學(xué)習(xí)方案ASIC、FPGA、GPU比較哪種更有潛力

幾乎所有深度學(xué)習(xí)的研究者都在使用GPU，但是對(duì)比深度學(xué)習(xí)硬鑒方案，ASIC、FPGA、GPU三種究竟哪款更被看好？主要是認(rèn)清對(duì)深度學(xué)習(xí)硬件平臺(tái)的要求。

2018-02-02 15:21:40

10206

Mask R-CNN：自動(dòng)從視頻中制作目標(biāo)物體的GIF動(dòng)圖

用深度學(xué)習(xí)模型——Mask R-CNN，自動(dòng)從視頻中制作目標(biāo)物體的GIF動(dòng)圖。

2018-02-03 14:19:27

10987

深度學(xué)習(xí)在IoT大數(shù)據(jù)和流分析中的應(yīng)用

這篇論文對(duì)于使用深度學(xué)習(xí)來(lái)改進(jìn)IoT領(lǐng)域的數(shù)據(jù)分析和學(xué)習(xí)方法進(jìn)行了詳細(xì)的綜述。

2018-03-01 11:05:12

7452

基于深度學(xué)習(xí)模型的點(diǎn)云目標(biāo)檢測(cè)及ROS實(shí)現(xiàn)

近年來(lái)，隨著深度學(xué)習(xí)在圖像視覺(jué)領(lǐng)域的發(fā)展，一類(lèi)基于單純的深度學(xué)習(xí)模型的點(diǎn)云目標(biāo)檢測(cè)方法被提出和應(yīng)用，本文將詳細(xì)介紹其中一種模型——SqueezeSeg，并且使用ROS實(shí)現(xiàn)該模型的實(shí)時(shí)目標(biāo)檢測(cè)。

2018-11-05 16:47:29

17181

深度學(xué)習(xí)處理器系統(tǒng)的設(shè)計(jì)實(shí)例介紹

2010年1月9日，Deephi的Yi Shan在法蘭克福的2018年XDF的Edge Track中提供了一個(gè)用例演示.Yi Shan討論了深度學(xué)習(xí)的成功，并分享了他們的全棧深度學(xué)習(xí)推理解決方案的用例。

2018-11-21 06:16:00

2396

Zerotech Dobby AI無(wú)人機(jī)與DeePhi的深度學(xué)習(xí)推理技術(shù)介紹

Zerotech Dobby AI是一款口袋大小的無(wú)人機(jī)，它使用深度學(xué)習(xí)來(lái)檢測(cè)由Xilinx Zynq SoC器件驅(qū)動(dòng)的人體手勢(shì)。該演示還將展示DeePhi的深度學(xué)習(xí)推理技術(shù)。

2018-11-26 06:21:00

2086

深度學(xué)習(xí)陷困境_人工智能遇瓶頸

現(xiàn)在，深度學(xué)習(xí)面臨著無(wú)法進(jìn)行推理的困境，這也就意味著，它無(wú)法讓機(jī)器具備像人一樣的智能。但是真正的推理在機(jī)器中是什么樣子的呢？如果深度學(xué)習(xí)不能幫助我們達(dá)到目的，那什么可以呢？

2018-12-01 09:41:12

3054

深度探析7大類(lèi)深度CNN創(chuàng)新架構(gòu)

深度卷積神經(jīng)網(wǎng)絡(luò)（CNN）是一種特殊類(lèi)型的神經(jīng)網(wǎng)絡(luò)，在各種競(jìng)賽基準(zhǔn)上表現(xiàn)出了當(dāng)前最優(yōu)結(jié)果。本綜述將最近的 CNN 架構(gòu)創(chuàng)新分為七個(gè)不同的類(lèi)別，分別基于空間利用、深度、多路徑、寬度、特征圖利用、通道提升和注意力。

2019-01-27 11:01:13

3930

面向圖譜的深度學(xué)習(xí)會(huì)迎來(lái)重大突破嗎

神經(jīng)網(wǎng)絡(luò)(Graph NN)是近來(lái)的一大研究熱點(diǎn)，尤其是DeepMind提出的“Graph Networks”，號(hào)稱(chēng)有望讓深度學(xué)習(xí)實(shí)現(xiàn)因果推理。

2019-02-13 09:37:07

2354

探析深度學(xué)習(xí)中的各種卷積

在信號(hào)處理、圖像處理和其它工程/科學(xué)領(lǐng)域，卷積都是一種使用廣泛的技術(shù)。在深度學(xué)習(xí)領(lǐng)域，卷積神經(jīng)網(wǎng)絡(luò)（CNN）這種模型架構(gòu)就得名于這種技術(shù)。但是，深度學(xué)習(xí)領(lǐng)域的卷積本質(zhì)上是信號(hào)/圖像處理領(lǐng)域內(nèi)的互相關(guān)（cross-correlation）。這兩種操作之間存在細(xì)微的差別。

2019-02-26 10:01:05

3093

多智體深度強(qiáng)化學(xué)習(xí)研究中首次將概率遞歸推理引入AI的學(xué)習(xí)過(guò)程

在傳統(tǒng)的多智體學(xué)習(xí)過(guò)程當(dāng)中，有研究者在對(duì)其他智能體建模 (也即“對(duì)手建模”, opponent modeling) 時(shí)使用了遞歸推理，但由于算法復(fù)雜和計(jì)算力所限，目前還尚未有人在多智體深度強(qiáng)化學(xué)習(xí) (Multi-Agent Deep Reinforcement Learning) 的對(duì)手建模中使用遞歸推理。

2019-03-05 08:52:43

4556

深度學(xué)習(xí)的調(diào)參經(jīng)驗(yàn)

對(duì)于深度學(xué)習(xí)本人也是半路出家. 現(xiàn)在的工作內(nèi)容主要就是使用CNN做CV任務(wù). 干調(diào)參這種活也有兩年時(shí)間了. 我的回答可能更多的還是側(cè)重工業(yè)應(yīng)用, 技術(shù)上只限制在CNN這塊.

2019-06-08 14:41:00

2136

如何使用MATLAB實(shí)現(xiàn)深度學(xué)習(xí)的方法研究分析

訓(xùn)練 CNN 需要相當(dāng)大量的數(shù)據(jù)，因?yàn)閷?duì)于典型的圖像分類(lèi)問(wèn)題，其需要學(xué)習(xí)幾百萬(wàn)個(gè)權(quán)值。從頭開(kāi)始訓(xùn)練 CNN 的另一個(gè)常見(jiàn)做法是使用預(yù)先訓(xùn)練好的模型自動(dòng)從新的數(shù)據(jù)集提取特征。這種方法稱(chēng)為遷移學(xué)習(xí)，是一種應(yīng)用深度學(xué)習(xí)的便捷方式，其無(wú)需龐大的數(shù)據(jù)集以及長(zhǎng)時(shí)間的訓(xùn)練。

2019-09-16 15:11:20

5433

深度學(xué)習(xí)和嵌入式視覺(jué)將成為熱門(mén)話(huà)題

深度學(xué)習(xí)技術(shù)成為機(jī)器視覺(jué)的熱門(mén)話(huà)題之一。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)領(lǐng)域，它使計(jì)算機(jī)能夠通過(guò)卷積神經(jīng)網(wǎng)絡(luò)（CNN）等體系結(jié)構(gòu)進(jìn)行訓(xùn)練和學(xué)習(xí)。

2019-08-23 17:02:03

758

賦能AI測(cè)試 Testin云測(cè)與英特爾合作將OCR模型推理效率提升6倍

OCR 深度學(xué)習(xí)方案使用的都是 GPU，通過(guò)其強(qiáng)大的并行計(jì)算能力來(lái)提升文本推理能力。

2019-11-22 09:43:00

730

百度飛槳深度學(xué)習(xí)平臺(tái)攜手IC設(shè)計(jì)領(lǐng)導(dǎo)廠(chǎng)商MediaTek

百度飛槳是自主研發(fā)、開(kāi)源開(kāi)放、功能最完備的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái)，集深度學(xué)習(xí)核心框架、基礎(chǔ)模型庫(kù)、端到端開(kāi)發(fā)套件、工具組件和服務(wù)平臺(tái)于一體，包含完整的開(kāi)發(fā)、訓(xùn)練、推理的端到端深度學(xué)習(xí)AI模型開(kāi)發(fā)工具鏈。

2020-05-29 14:59:40

2667

一份深度學(xué)習(xí)的學(xué)習(xí)筆記資料合集

學(xué)習(xí)。” 在這 5 堂課中，學(xué)生將可以學(xué)習(xí)到深度學(xué)習(xí)的基礎(chǔ)，學(xué)會(huì)構(gòu)建神經(jīng)網(wǎng)絡(luò)，并用在包括吳恩達(dá)本人在內(nèi)的多位業(yè)界頂尖專(zhuān)家指導(dǎo)下創(chuàng)建自己的機(jī)器學(xué)習(xí)項(xiàng)目。Deep Learning Specialization 對(duì)卷積神經(jīng)網(wǎng)絡(luò) （CNN）、遞歸神經(jīng)網(wǎng)絡(luò) （RNN）、長(zhǎng)短期

2020-09-01 08:00:00

如何去理解CNN卷積層與池化層計(jì)算？

概述深度學(xué)習(xí)中CNN網(wǎng)絡(luò)是核心，對(duì)CNN網(wǎng)絡(luò)來(lái)說(shuō)卷積層與池化層的計(jì)算至關(guān)重要，不同的步長(zhǎng)、填充方式、卷積核大小、

2021-04-06 15:13:25

2453

基于改進(jìn)CNN網(wǎng)絡(luò)與集成學(xué)習(xí)的人臉識(shí)別算法

全連接層，使得網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單且可移植性強(qiáng)。在改進(jìn)CNN網(wǎng)絡(luò)的基礎(chǔ)上，利用基于投票法的集成學(xué)習(xí)策略將所有個(gè)體學(xué)習(xí)器結(jié)果凸組合為最終結(jié)果，實(shí)現(xiàn)更準(zhǔn)確的人臉識(shí)別。實(shí)驗(yàn)結(jié)果表明，該算法在 Color Feret、AR和ORL人臉數(shù)據(jù)庫(kù)上的識(shí)別準(zhǔn)確率分別達(dá)到

2021-05-27 14:36:12

基于深度學(xué)習(xí)的發(fā)動(dòng)機(jī)零件檢測(cè)算法

針對(duì)人工和傳統(tǒng)自動(dòng)化算法檢測(cè)發(fā)動(dòng)機(jī)零件表面缺陷中準(zhǔn)確率和效率低下，無(wú)法滿(mǎn)足智能制造需求問(wèn)題提岀了一種基于深度學(xué)習(xí)的檢測(cè)算法。以 Faster r-CNN深度學(xué)習(xí)算法為算法框架，引入聚類(lèi)理論來(lái)確定

2021-06-03 14:51:54

基于深度學(xué)習(xí)的機(jī)器人示教系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

基于深度學(xué)習(xí)的機(jī)器人示教系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2021-06-30 15:53:37

深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用

2021-10-20 17:51:05

【無(wú)限停工中】在嵌入式平臺(tái)實(shí)現(xiàn)CNN

單片機(jī)（Cortex-M內(nèi)核，無(wú)操作系統(tǒng)）可以跑深度學(xué)習(xí)嗎？ ——Read Air 2019.8.20Xu_CNN框架

2021-11-26 09:51:05

MLSys 2021論文分析2—(通過(guò)算子調(diào)度以加速CNN推理)

IOS論文出自MIT的韓松實(shí)驗(yàn)室，第一作者為Yaoyao Ding，這是他在韓松實(shí)驗(yàn)室實(shí)習(xí)時(shí)的成果。現(xiàn)有的CNN推理加速技術(shù)關(guān)注于優(yōu)化算子內(nèi)部的并...

2022-01-25 18:09:36

如何使用框架訓(xùn)練網(wǎng)絡(luò)加速深度學(xué)習(xí)推理

在這篇文章中，我們解釋了如何使用 TensorFlow-to-ONNX-to-TensorRT 工作流來(lái)部署深度學(xué)習(xí)應(yīng)用程序，并給出了幾個(gè)示例。第一個(gè)例子是 ResNet-50 上的 ONNX-

2022-04-01 15:45:04

2473

用于深度學(xué)習(xí)推理的高性能工具包

　　綜上所述，這個(gè)新版本的 OpenVINO 工具包提供了許多好處，不僅優(yōu)化了用戶(hù)部署應(yīng)用程序的體驗(yàn)，還增強(qiáng)了性能參數(shù)。它使用戶(hù)能夠開(kāi)發(fā)具有易于部署、更多深度學(xué)習(xí)模型、更多設(shè)備可移植性和更高推理性能且代碼更改更少的應(yīng)用程序。

2022-07-12 10:08:57

864

用基于SRAM的測(cè)試芯片實(shí)現(xiàn)加速AI推理

瑞薩電子開(kāi)發(fā)了一種新的內(nèi)存處理器 (PIM) 技術(shù)，用于在低功耗邊緣設(shè)備中加速 AI 推理。用于基于 SRAM 技術(shù)的測(cè)試芯片實(shí)現(xiàn)了 8.8 TOPS/W 的運(yùn)行卷積神經(jīng)網(wǎng)絡(luò) (CNN) 工作負(fù)載

2022-07-21 15:50:32

1073

基于深度學(xué)習(xí)的焊接焊點(diǎn)缺陷檢測(cè)

深度學(xué)習(xí)主要包含卷積神經(jīng)網(wǎng)絡(luò)和Faster R-CNN兩種網(wǎng)絡(luò)模型，通過(guò)利用算法模型自動(dòng)學(xué)習(xí)的特點(diǎn)，不再受限于復(fù)雜多變的環(huán)境，可自動(dòng)提取缺陷特征，最終實(shí)現(xiàn)自動(dòng)檢測(cè)。

2022-10-19 15:08:48

1791

基于AdderNet的深度學(xué)習(xí)推理加速器

電子發(fā)燒友網(wǎng)站提供《基于AdderNet的深度學(xué)習(xí)推理加速器.zip》資料免費(fèi)下載

2022-10-31 11:12:28

深度學(xué)習(xí)在目標(biāo)檢測(cè)中的應(yīng)用

R-CNN 算法在 2014 年提出，可以說(shuō)是歷史性的算法，將深度學(xué)習(xí)應(yīng)用于目標(biāo)檢測(cè)領(lǐng)域，相較于之前的目標(biāo)檢測(cè)方法，提升多達(dá) 30% 以上

2022-10-31 10:08:05

1143

大規(guī)模推理時(shí)代深度學(xué)習(xí)加速的天花板在哪？

人工智能迎來(lái)第三次浪潮后，以深度學(xué)習(xí)為代表的AI已經(jīng)進(jìn)入應(yīng)用階段。而深度學(xué)習(xí) AI 需要進(jìn)行大量矩陣乘法以訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型，并利用推理將這些模型應(yīng)用于實(shí)際任務(wù)。

2022-12-15 10:51:11

516

智能工廠(chǎng)如何實(shí)現(xiàn)深度學(xué)習(xí)自動(dòng)化？

智能工廠(chǎng)如何實(shí)現(xiàn)深度學(xué)習(xí)自動(dòng)化？

2022-12-28 09:51:14

571

深度學(xué)習(xí)中的圖像分割

深度學(xué)習(xí)可以學(xué)習(xí)視覺(jué)輸入的模式，以預(yù)測(cè)組成圖像的對(duì)象類(lèi)。用于圖像處理的主要深度學(xué)習(xí)架構(gòu)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)，或者是特定的CNN框架，如AlexNet、VGG、Inception和ResNet。計(jì)算機(jī)視覺(jué)的深度學(xué)習(xí)模型通常在專(zhuān)門(mén)的圖形處理單元(GPU)上訓(xùn)練和執(zhí)行，以減少計(jì)算時(shí)間。

2023-05-05 11:35:28

729

?計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)訓(xùn)練推理框架

PyTorch是由Facebook人工智能研究小組開(kāi)發(fā)的一種基于Lua編寫(xiě)的Torch庫(kù)的Python實(shí)現(xiàn)的深度學(xué)習(xí)庫(kù)，也是目前使用范圍和體驗(yàn)感最好的一款深度學(xué)習(xí)框架。

2023-05-08 14:20:58

774

基于深度學(xué)習(xí)的散射成像研究進(jìn)展

卷積神經(jīng)網(wǎng)絡(luò)（CNN）是一種用于對(duì)目標(biāo)進(jìn)行重建、分類(lèi)等處理的深度學(xué)習(xí)方法。自2016年深度學(xué)習(xí)被首次應(yīng)用于散射成像，該研究一直是光學(xué)成像領(lǐng)域的熱門(mén)方向。

2023-05-24 09:51:21

166

PyTorch教程-14.8。基于區(qū)域的 CNN (R-CNN)

Studio 實(shí)驗(yàn)室在 SageMaker Studio Lab 中打開(kāi)筆記本除了第 14.7 節(jié)中描述的單次多框檢測(cè)之外，基于區(qū)域的 CNN 或具有 CNN 特征的區(qū)域 (R-CNN) 也是將深度學(xué)習(xí)

2023-06-05 15:44:37

339

飛凌嵌入式RK3588開(kāi)發(fā)板推理模型轉(zhuǎn)換及測(cè)試

RKNN（Rockchip Neural Network）是一種用于嵌入式設(shè)備的深度學(xué)習(xí)推理框架，它提供了一個(gè)端到端的解決方案，用于將訓(xùn)練好的深度學(xué)習(xí)模型轉(zhuǎn)換為在嵌入式設(shè)備上運(yùn)行的可執(zhí)行文件。

2023-06-05 16:11:47

736

基于FPGA的深度學(xué)習(xí)CNN加速器設(shè)計(jì)方案

因?yàn)?b class="flag-6" style="color: red">CNN的特有計(jì)算模式，通用處理器對(duì)于CNN實(shí)現(xiàn)效率并不高，不能滿(mǎn)足性能要求。因此，近來(lái)已經(jīng)提出了基于FPGA，GPU甚至ASIC設(shè)計(jì)的各種加速器來(lái)提高CNN設(shè)計(jì)的性能。

2023-06-14 16:03:43

1453

智造之眼丨深度學(xué)習(xí)應(yīng)用

智造之眼?科學(xué)設(shè)計(jì)深度學(xué)習(xí)各應(yīng)用流程，在盡量簡(jiǎn)化前期準(zhǔn)備工作的基礎(chǔ)上為客戶(hù)提供穩(wěn)定且準(zhǔn)確的深度學(xué)習(xí)解決方案。

2023-05-04 16:55:52

424

AI、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別及應(yīng)用

深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的區(qū)別在于隱藏層的深度。一般來(lái)說(shuō)，神經(jīng)網(wǎng)絡(luò)的隱藏層要比實(shí)現(xiàn)深度學(xué)習(xí)的系統(tǒng)淺得多，而深度學(xué)習(xí)的在隱藏層可以有很多層。

2023-07-28 10:44:27

296

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎

深度學(xué)習(xí)框架區(qū)分訓(xùn)練還是推理嗎深度學(xué)習(xí)框架是一個(gè)非常重要的技術(shù)，它們能夠加速深度學(xué)習(xí)的開(kāi)發(fā)與部署過(guò)程。在深度學(xué)習(xí)中，我們通常需要進(jìn)行兩個(gè)關(guān)鍵的任務(wù)，即訓(xùn)練和推理。訓(xùn)練是指使用訓(xùn)練數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)

2023-08-17 16:03:11

906

什么是卷積神經(jīng)網(wǎng)絡(luò)？如何MATLAB實(shí)現(xiàn)CNN？

卷積神經(jīng)網(wǎng)絡(luò)（CNN 或 ConvNet）是一種直接從數(shù)據(jù)中學(xué)習(xí)的深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)。 CNN 特別適合在圖像中尋找模式以識(shí)別對(duì)象、類(lèi)和類(lèi)別。它們也能很好地對(duì)音頻、時(shí)間序列和信號(hào)數(shù)據(jù)進(jìn)行分類(lèi)。

2023-10-12 12:41:49

422

深度學(xué)習(xí)在人工智能中的 8 種常見(jiàn)應(yīng)用

深度學(xué)習(xí)簡(jiǎn)介深度學(xué)習(xí)是人工智能（AI）的一個(gè)分支，它教神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和推理。近年來(lái)，它解決復(fù)雜問(wèn)題并在各個(gè)領(lǐng)域提供尖端性能的能力引起了極大的興趣和吸引力。深度學(xué)習(xí)算法通過(guò)允許機(jī)器處理和理解大量數(shù)據(jù)

2023-12-01 08:27:44

737

已全部加載完成

搜索歷史

基于IoT設(shè)備的CNN推理機(jī)實(shí)現(xiàn)深度學(xué)習(xí)方案 - 全文

評(píng)論