基于MCU的設(shè)計(jì)面臨越來越激進(jìn)的系統(tǒng)要求。無論是超低功耗,高性能還是兩者的難度組合,提供滿足當(dāng)今激進(jìn)目標(biāo)的設(shè)計(jì)都是一項(xiàng)艱巨的任務(wù)?;贛CU的設(shè)計(jì)中最常見的操作之一是數(shù)據(jù)移動(dòng)和數(shù)據(jù)傳輸功能的有效實(shí)現(xiàn),這對(duì)于達(dá)到低功耗或高處理目標(biāo)至關(guān)重要。詳細(xì)了解支持快速高效數(shù)據(jù)傳輸?shù)默F(xiàn)代MCU中包含的各種功能對(duì)于創(chuàng)建最佳MCU設(shè)計(jì)至關(guān)重要。
基礎(chǔ)知識(shí)
數(shù)據(jù)移動(dòng)可以從一個(gè)功能塊到另一個(gè)功能塊,或關(guān)閉-chip使用標(biāo)準(zhǔn)接口。片上和片外傳輸通常涉及標(biāo)準(zhǔn)外設(shè)或存儲(chǔ)器接口。現(xiàn)在許多外圍設(shè)備都包含更高級(jí)別的功能,這些功能可以獨(dú)立于CPU運(yùn)行。一個(gè)例子是將數(shù)據(jù)本地緩沖到外設(shè),以便在方便的數(shù)據(jù)包中完成傳輸,從而最大限度地減少CPU開銷。
使用特殊的數(shù)據(jù)傳輸資源可以有效地完成片上數(shù)據(jù)移動(dòng)。例如,外設(shè)和存儲(chǔ)器之間的數(shù)據(jù)傳輸可以使用智能直接存儲(chǔ)器訪問(DMA)功能完成。 CPU只需要參與設(shè)置傳輸參數(shù)(例如存儲(chǔ)器位置,傳輸長度和有效外設(shè)),并在傳輸完成時(shí)通知。 CPU可以在傳輸數(shù)據(jù)時(shí)執(zhí)行其他任務(wù),也可以將其置于低功耗模式以節(jié)省功耗。
許多現(xiàn)代MCU都包含先進(jìn)的片上總線結(jié)構(gòu),有助于支持多個(gè)數(shù)據(jù)傳輸同時(shí)發(fā)生。當(dāng)多個(gè)數(shù)據(jù)流同時(shí)移動(dòng)時(shí),可以實(shí)現(xiàn)最高的數(shù)據(jù)傳輸帶寬。此外,在這些情況下,與順序執(zhí)行數(shù)據(jù)傳輸相比,功耗通常要低得多。現(xiàn)代MCU中還包含許多其他功能和功能,可幫助實(shí)現(xiàn)高效的數(shù)據(jù)傳輸。這里不可能說明所有這些,但我們將回顧一些最常見的功能。一旦了解了這些,通過擴(kuò)展,將清楚如何使用其他功能來提高設(shè)計(jì)中的數(shù)據(jù)傳輸效率。我們將看看四個(gè)關(guān)鍵示例,了解如何提高數(shù)據(jù)傳輸效率:智能USB外設(shè)如何降低CPU開銷,智能DMA如何獨(dú)立管理復(fù)雜數(shù)據(jù)移動(dòng)要求,低功耗模式如何在數(shù)據(jù)傳輸過程中提高電源效率,以及先進(jìn)的片上總線矩陣如何支持多個(gè)同步數(shù)據(jù)傳輸功能。我們還將看到,當(dāng)這些功能結(jié)合使用時(shí),甚至可以實(shí)現(xiàn)更高的效率。
智能外設(shè):USB示例
USB是一個(gè)很好的示例外設(shè),用于顯示數(shù)據(jù)傳輸?shù)目赡芨倪M(jìn)。早期的USB實(shí)現(xiàn)最大吞吐量僅為1.5 Mb/秒,標(biāo)準(zhǔn)的一些元素基于這種慢速數(shù)據(jù)。隨著標(biāo)準(zhǔn)的更高性能版本的出現(xiàn)以及更廣泛的應(yīng)用程序的定位,USB外設(shè)實(shí)現(xiàn)需要變得更具創(chuàng)造性。特別是,接近12 Mbit/s全速USB標(biāo)準(zhǔn)的理論最大值需要一些差異化的功能。 Atmel為XMEGA MCU的USB外設(shè)實(shí)現(xiàn)增加了幾項(xiàng)功能,可顯著提高效率。這些功能也很好地說明了可以與其他類型的外設(shè)一起使用的類似技術(shù),以提高數(shù)據(jù)傳輸效率。
通常,單個(gè)內(nèi)存緩沖區(qū)用于外設(shè)數(shù)據(jù)傳輸。如果數(shù)據(jù)緩沖區(qū)已滿,MCU將以NAK(否定確認(rèn))消息進(jìn)行響應(yīng)。收到NAK后,主機(jī)將等待并稍后重試傳輸。它將繼續(xù)重試,直到MCU可以成功接收數(shù)據(jù)。 Atmel XMEGA MCU使用乒乓緩沖區(qū)來消除此問題。乒乓緩沖區(qū)使用兩個(gè)存儲(chǔ)區(qū)進(jìn)行數(shù)據(jù)傳輸。當(dāng)一個(gè)銀行滿員時(shí),主機(jī)可以將數(shù)據(jù)傳輸?shù)搅硪粋€(gè)銀行。兩個(gè)緩沖區(qū)之間的交替消除了重試并提高了整體數(shù)據(jù)帶寬。此外,如圖1所示,在乒乓配置中使用兩個(gè)存儲(chǔ)體,使MCU有更多時(shí)間處理數(shù)據(jù)。如沒有乒乓球的圖所示,CPU只能處理傳輸之間的數(shù)據(jù)。通過乒乓,CPU可以在傳輸周期的一部分期間處理數(shù)據(jù),并降低NAK被要求“趕上”數(shù)據(jù)處理要求的可能性。
圖1 :乒乓數(shù)據(jù)緩沖提高了效率(由Atmel提供)。
有助于提高Atmel XMEGA MCU數(shù)據(jù)傳輸效率的另一個(gè)關(guān)鍵特性是多數(shù)據(jù)包緩沖傳輸模式。當(dāng)通過USB端口傳輸?shù)臄?shù)據(jù)包超過全速USB的BULK傳輸模式中允許的最大值(64字節(jié))時(shí),使用此模式。在包含此功能之前,需要在主機(jī)上拆分?jǐn)?shù)據(jù)包,然后在接收器處合并,從而導(dǎo)致CPU負(fù)載增加。多數(shù)據(jù)包緩沖功能為USB外設(shè)添加專用硬件,以便在數(shù)據(jù)包大小大于最大USB數(shù)據(jù)包大小時(shí)自動(dòng)執(zhí)行數(shù)據(jù)包拆分和合并。請(qǐng)注意,此模式還減少了所需的中斷次數(shù),因?yàn)橹挥性谡麄€(gè)傳輸結(jié)束時(shí)才需要中斷CPU。這意味著CPU可以處理其他任務(wù)或進(jìn)入睡眠模式,直到整個(gè)傳輸完成并準(zhǔn)備好進(jìn)行處理。
結(jié)合乒乓緩沖和多傳輸模式可以提高傳輸帶寬5.6 Mb/s(在沒有任何特性的基線BULK傳輸實(shí)現(xiàn)中)為8.7 Mbits/s。也許更重要的是,在使用這兩種功能的情況下,CPU負(fù)載從46%(在基線中)降低到僅9%。這些功能的結(jié)合使用可以在性能和功耗方面實(shí)現(xiàn)出色的改進(jìn),這正是智能外設(shè)可為您的設(shè)計(jì)帶來的好處。在下一個(gè)設(shè)計(jì)中尋找關(guān)鍵外圍設(shè)備的類似功能。有關(guān)更多信息,Atmel提供有關(guān)XMEGA USB連接的產(chǎn)品培訓(xùn)模塊。
使用智能DMA進(jìn)行高效的數(shù)據(jù)傳輸
大多數(shù)設(shè)計(jì)人員熟悉的第一個(gè)面向數(shù)據(jù)傳輸?shù)奶厥夤δ芸赡苁侵苯觾?nèi)存訪問(DMA)。此塊可以自動(dòng)將數(shù)據(jù)從源移動(dòng)到目標(biāo)。第一代DMA傳輸功能只不過是一個(gè)地址寄存器,它可以與一個(gè)小型狀態(tài)機(jī)一起遞增,以管理存儲(chǔ)器的讀寫信號(hào)。現(xiàn)代DMA控制器包括高級(jí)功能,可以從最復(fù)雜的數(shù)據(jù)傳輸操作中盡可能地卸載CPU。 Renesas RX621 MCU系列DMA實(shí)現(xiàn)是一個(gè)很好的例子,可以看到一些可用于數(shù)據(jù)傳輸功能的更高級(jí)功能。
RX621 MCU DMA控制器(圖2)可以連接到中斷控制器,以便中斷驅(qū)動(dòng)數(shù)據(jù)轉(zhuǎn)移是可能的。例如,智能外設(shè)可以緩沖數(shù)據(jù),直到數(shù)據(jù)包可用于傳輸。它可以向DMA控制器發(fā)出中斷,并且數(shù)據(jù)包可以移動(dòng)到主存儲(chǔ)器以供CPU處理。在大量數(shù)據(jù)包可用之前,CPU可能不需要處理數(shù)據(jù),因此DMA控制器可以等到已經(jīng)傳輸了足夠的數(shù)據(jù)包以便向CPU發(fā)出啟動(dòng)中斷。請(qǐng)注意DMA與外設(shè)數(shù)據(jù)緩沖區(qū),較大的主內(nèi)存緩沖區(qū)和集成中斷系統(tǒng)的使用如何協(xié)同工作以消除CPU數(shù)據(jù)傳輸開銷。您可以通過將算法與MCU中的自主數(shù)據(jù)傳輸資源相匹配來實(shí)現(xiàn)顯著的效率提升。
圖2:Renesas RX621 DMA控制器框圖(由Renesas提供)。
RX621 DMA控制器具有四個(gè)獨(dú)立通道和多種尋址模式,無需CPU干預(yù)即可支持復(fù)雜的數(shù)據(jù)傳輸。例如,在DMA傳輸期間使用偏移量添加會(huì)跳過存儲(chǔ)器序列中的地址。這允許在目的地地址處自動(dòng)收集分散的源數(shù)據(jù)元素。您甚至可以使用偏移添加功能實(shí)現(xiàn)復(fù)雜的操作,如矩陣翻轉(zhuǎn)(數(shù)據(jù)元素的X和Y位置交換)。當(dāng)所有需要的數(shù)據(jù)連續(xù)存儲(chǔ)時(shí),這些類型的操作可以為非常有效的CPU處理分段數(shù)據(jù)。如果CPU需要不按順序訪問數(shù)據(jù),則緩存未命中可能會(huì)顯著降低處理效率。尋找類似的機(jī)會(huì)來收集數(shù)據(jù),以便在數(shù)據(jù)處理算法的“內(nèi)部循環(huán)”中實(shí)現(xiàn)高效的CPU訪問。
RX621還包括兩個(gè)其他DMA功能,可進(jìn)一步提高數(shù)據(jù)傳輸效率,數(shù)據(jù)傳輸控制器(DTC)和外部存儲(chǔ)器DMA控制器(EXDMA)。 DTC是類似DMA的功能,但數(shù)據(jù)傳輸信息(起始地址,傳輸長度等)作為激活向量存儲(chǔ)在主存儲(chǔ)器中。這允許支持更復(fù)雜的數(shù)據(jù)傳輸操作。一旦當(dāng)前傳輸完成,可以通過自動(dòng)移動(dòng)到新的激活向量來實(shí)現(xiàn)傳輸鏈。通過管理傳輸記錄中的各種鏈接,可以定義復(fù)雜的數(shù)據(jù)傳輸操作,然后根據(jù)所需操作的需要將其鏈接在一起。 CPU開銷最小化,因?yàn)樗恍枰趥鬏攩?dòng)之前管理鏈接配置數(shù)據(jù)的設(shè)置和拆除EXDMA子系統(tǒng)專為外部存儲(chǔ)器總線傳輸而設(shè)計(jì)。它具有兩個(gè)通道和普通DMA控制器的許多常規(guī)功能。另外一種傳輸模式Cluster Transfer可以有效地用于管理復(fù)雜的數(shù)據(jù)緩沖結(jié)構(gòu)。雙地址模式用于有效地同時(shí)進(jìn)行兩次數(shù)據(jù)傳輸。一次數(shù)據(jù)傳輸將數(shù)據(jù)集從一個(gè)位置移動(dòng)到集群存儲(chǔ)區(qū)域。第二次傳輸用于將數(shù)據(jù)從群集區(qū)域移動(dòng)到不同的存儲(chǔ)區(qū)域。這種方法可以簡化網(wǎng)絡(luò)數(shù)據(jù)包和視頻幀的數(shù)據(jù)結(jié)構(gòu)管理,從而消除CPU實(shí)現(xiàn)常見的緩沖區(qū)管理功能。尋找更專業(yè)的DMA控制器功能,因?yàn)镸CU變得更加注重應(yīng)用。
使用低功耗模式提高數(shù)據(jù)傳輸效率
實(shí)例表明,通過消除CPU甚至復(fù)雜的數(shù)據(jù)傳輸操作中的低級(jí)別參與,有很多機(jī)會(huì)減少CPU開銷。這引出了一個(gè)問題,“如果不需要實(shí)現(xiàn)數(shù)據(jù)傳輸操作,CPU應(yīng)該做什么?”在某些情況下,將CPU操作與數(shù)據(jù)傳輸重疊是有效的。通常捕獲大量數(shù)據(jù)然后讓CPU執(zhí)行算法的處理和控制部分。如果可以捕獲下一個(gè)數(shù)據(jù)集,則通過使用外設(shè)和DMA控制器在CPU對(duì)先前數(shù)據(jù)集進(jìn)行計(jì)算時(shí)實(shí)現(xiàn)數(shù)據(jù)傳輸,有效處理帶寬顯著增加。如果您發(fā)現(xiàn)CPU足夠強(qiáng)大,只需要一小部分處理能力,那么將CPU置于低功耗模式可能是有意義的,直到需要進(jìn)行數(shù)據(jù)處理。
德州儀器MSP430 MCU系列具有多種低功耗模式,可用于在算法的一部分不需要CPU時(shí)切斷功率。如圖3底部所示,低功耗模式下有兩個(gè)時(shí)鐘源:按需高速數(shù)字控制振蕩器(DCO)源時(shí)鐘,MCLK和始終開啟的低速外設(shè)時(shí)鐘,ACLK。在活動(dòng)模式下,MCU處于最高功率狀態(tài)。兩個(gè)時(shí)鐘都處于活動(dòng)狀態(tài),MCU的功耗約為250μA。在CPU關(guān)閉模式下,CPU關(guān)閉且時(shí)鐘均打開,功耗為35μA。在待機(jī)模式下,CPU和DCO時(shí)鐘關(guān)閉,而ACLK打開。在此模式下,功耗為0.8μA。最后,在全關(guān)模式下,CPU和時(shí)鐘關(guān)閉,功耗僅為0.1μA。通過減少CPU處于活動(dòng)模式的時(shí)間,并且如果待機(jī)功率足夠低,則可以最小化由圖3頂部曲線下面積表示的總功率。
圖3:TI MSP430有功功率,待機(jī)功耗和快速時(shí)鐘喚醒時(shí)間(由德州儀器提供)。
在Active Power中花費(fèi)的時(shí)間不僅取決于所需的處理時(shí)間量,還取決于轉(zhuǎn)換進(jìn)入和退出低功耗狀態(tài)所需的時(shí)間。在TI MSP430上(有關(guān)更多信息,請(qǐng)參閱TI產(chǎn)品培訓(xùn)模塊),MCLK可在200 ns內(nèi)激活,使喚醒時(shí)間幾乎瞬間完成。這種快速喚醒時(shí)間意味著等待時(shí)鐘變?yōu)榛顒?dòng)狀態(tài)所浪費(fèi)的功率更少,因此可以立即開始處理??焖偬幚砟芰Γ焖賳拘褧r(shí)間和低功耗模式下的低功耗是高效MCU設(shè)計(jì)的“最佳點(diǎn)”。確保在MCU設(shè)計(jì)中仔細(xì)考慮這些元素。
使用片上總線矩陣進(jìn)行多個(gè)同步數(shù)據(jù)傳輸
在前面的示例中您可能已經(jīng)考慮過的一個(gè)可能的瓶頸,其中有大量的同時(shí)數(shù)據(jù)傳輸正在發(fā)生,要求多個(gè)片上總線有效地承載所有這些數(shù)據(jù)流量。具有高效多總線實(shí)現(xiàn)的MCU的一個(gè)例子是飛思卡爾Kinetis K70 MCU。 K70使用縱橫開關(guān)(如圖4所示)連接各種總線主模塊和總線從模塊。圖左側(cè)的八個(gè)總線主站可以連接到圖右側(cè)的八個(gè)從站。請(qǐng)注意,某些主服務(wù)器共享端口。例如,DMA和EzPort共享主端口M2。這些主設(shè)備永遠(yuǎn)不會(huì)同時(shí)處于活動(dòng)狀態(tài),因此共享相同的主端口并不會(huì)發(fā)生沖突。
在某些多總線實(shí)現(xiàn)中,主設(shè)備可以連接到哪個(gè)從設(shè)備存在限制。 Kinetis K70實(shí)現(xiàn)了縱橫開關(guān),因此每個(gè)主設(shè)備都可以連接到每個(gè)從設(shè)備。這支持大量重疊的數(shù)據(jù)傳輸。特別是Kinetis K70的一個(gè)應(yīng)用是針對(duì)需要大量數(shù)據(jù)傳輸?shù)膬?yōu)化,是觸摸屏LCD圖形用戶界面(GUI)。圖4中的圖表顯示LCD控制器背景平面和LCD控制器圖形窗口都具有單獨(dú)的主設(shè)備。還有多個(gè)DRAM控制器從設(shè)備,因此兩個(gè)LCD主設(shè)備都可以訪問DRAM中自己的內(nèi)存緩沖區(qū)。這顯著降低了管理GUI顯示的CPU開銷。
圖4:飛思卡爾Kinetis K70縱橫交換機(jī)支持重疊數(shù)據(jù)傳輸(由飛思卡爾提供)。
縱橫交換機(jī)上的其他主機(jī)也可以重疊操作以提高效率。例如,以太網(wǎng)主設(shè)備可以通過DRAM控制器直接向/從DRAM傳輸數(shù)據(jù),而DMA控制器則管理速度較慢的外設(shè)和片上存儲(chǔ)器之間的傳輸。算法可以根據(jù)處理要求輕松優(yōu)化,而不會(huì)遇到連接不太良好的總線系統(tǒng)會(huì)造成的人為瓶頸。有關(guān)更多信息,請(qǐng)參閱飛思卡爾Kinetis產(chǎn)品培訓(xùn)模塊。
總結(jié)
具有特殊數(shù)據(jù)傳輸功能和智能外設(shè)的MCU可以實(shí)現(xiàn)非常高水平的數(shù)據(jù)傳輸效率。但是,由于數(shù)據(jù)傳輸是絕大多數(shù)MCU設(shè)計(jì)中最常用的功能,因此了解如何有效地使用這些功能對(duì)于實(shí)現(xiàn)低功耗和高性能的積極設(shè)計(jì)目標(biāo)至關(guān)重要。本文中說明的示例可以擴(kuò)展到各種其他數(shù)據(jù)傳輸功能,因此您可以達(dá)到設(shè)計(jì)所需的效率水平。
-
mcu
+關(guān)注
關(guān)注
146文章
17184瀏覽量
351694 -
控制器
+關(guān)注
關(guān)注
112文章
16401瀏覽量
178555 -
存儲(chǔ)器
+關(guān)注
關(guān)注
38文章
7514瀏覽量
164003
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論