色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

細說SPI主機發送性能最大化實現方案

先楫半導體HPMicro ? 2023-07-31 23:03 ? 次閱讀

一、背景

在《先楫hpm6000的SPI外設使用四線模式操作讀寫華邦flash》一文中介紹了先楫SPI外設是為flash器件而生的控制器,但是樓主在該篇文章讀寫flash的頁是用的poll輪詢讀寫spi fifo的接口,并沒用DMA來進行加速優化。本篇就是基于SPI配合DMA實現理論速度性能。

二、問題點

(一) SPI FIFO poll阻塞發送無法發揮SPI理論速度性能

使用spi poll阻塞的時候,雖然能實現數據的完整傳輸,但是傳輸的時間并不能達到理想傳輸速度,比如SPI四線模式下,30M的SPI SCLK時鐘,理論可以達到15MB/S速度。但實際測量當中并未達到該性能。從邏輯分析儀看到,發送flas一頁數據,也就是256字節,從開始傳輸到結束傳輸的時間需要37.034us,合計為6.91MB/S,與理論速度相差了2到3倍的距離。


53e38048-2fb3-11ee-bbcf-dac502259ad0.png

從波形上看,導致這個速度達不到原因就在于,每個字節之間存在了一定的間隔時間,這些間隔的累積導致傳輸時間變長,導致總的時間變長,進而速度遠遠跟不上。

5418fe94-2fb3-11ee-bbcf-dac502259ad0.png

(二)使用了DMA仍然有SPI SCLK時鐘不連續問題

從(一)的問題可以看出,要想達到理論速度,必須消除每個字節的SCLK間隔,縮短傳輸時間。這時候需要DMA來加持速度性能,但實際上,在使用了相關配置之后,速度雖然有些提升,但還是存在些許間隔產生。


在這里的例子驗證條件是:SPI SCLK時鐘頻率為50M,主機發送512字節。理論傳輸速度可以25MB/S.從邏輯分析儀可看到,間隔有所縮短,但依然存在字節間隔。512字節傳輸需要45.97us,合計為11.173MB/S。距離25MB/S也有兩倍的差距。

5442dd9a-2fb3-11ee-bbcf-dac502259ad0.png

三、解決問題

在二問題的所有描述當中,速度達不到理想性能,歸根到底是字節之間產生間隔累積形成。

所以我們的問題解決點是:再配合DMA,進行其他優化。達到理想速度性能。


(一) 使用AHB SRAM(內存32KB空間)作為數據交互RAM。

在HPM6000系列中,AHB/APB外設總線連接了一個內存為32KB空間的AHB SRAM,與之同時連接的也有DMA控制器之一HDMA。


從官方文檔可知,AHB SRAM和HDMA以及SPI外設同樣位于AHB/APB外設總線中,AHB SRAM是專門給HDMA進行低延時訪問的內存,也是SPI進行DMA低延時傳輸保證。

5481dde2-2fb3-11ee-bbcf-dac502259ad0.png

在上面的DMA搬運中,待發送的數據放在AXI SRAM中。那么把這發送的數據放在AHB SRAM,看下會不會有所提升。

54ac15c6-2fb3-11ee-bbcf-dac502259ad0.png

從以下邏輯分析儀結果看出,傳輸512字節,相比放在AXI_SRAM中,在AHB_SRAM只需要22.97us,縮短了23us, 合計22MB/S,提高了兩倍速度性能。當仍與25MB/S理想速度有些許差距。

54c34318-2fb3-11ee-bbcf-dac502259ad0.png

通過放大波形查看,有些字節依然產生間隔,這也是導致速度沒達到理想速度的原因。

54daedba-2fb3-11ee-bbcf-dac502259ad0.png

(二)使用DMA的burst突發傳輸

先楫的DMA,對于源地址數據來說,支持突發傳輸。例如傳輸位寬為8,設置burst數量為4,那么就是相當一次DMA請求設置了4個節拍,連續傳輸4個字節。是單次傳輸的4倍效率。在這里來說,待發送的數據就是源地址數據。

5504adee-2fb3-11ee-bbcf-dac502259ad0.png

先楫的SPI控制器有四個字的FIFO數據空間,每個FIFO是32位。SPI請求DMA搬運是通過發送FIFO閾值請求。從效率上來看,最好是一次請求中能把FIFO數據全部搬運。從上面的優化流程來看,都設置為了默認,TX FIFO閾值設置為了0,也就是只要TXFIFO有一個為空就請求一次,DMA的源數據burst數量為0,也就是相當設置了1個節拍的突發傳輸,傳輸寬度為8位,一次DMA請求就塞給一次FIFO,等待FIFO完全塞滿后這時候沒法請求,所以會導致一次周期的間隔,當DMA收到請求后連這樣能解釋上面為何每隔四個字節會產生間隔的原因。

553c9e70-2fb3-11ee-bbcf-dac502259ad0.png

所以這里我們可以SPI的TXFIFO閾值為3,當出現一個空位的時候就請求一次,設置burst數量為2,也就是四個字節,一次請求搬運四個字節。通過邏輯分析儀可看到:


配合(一)的方案,傳輸512字節,只需要20.468us,合計為25MB/S左右,接近了理想速度性能了。

5591a99c-2fb3-11ee-bbcf-dac502259ad0.png

放大波形查看,也能看到SCLK時鐘連續了。

55b32838-2fb3-11ee-bbcf-dac502259ad0.png

(三)壓榨性能(使用SPI的字節合并merge功能)

先楫官方手冊說明的是SPI時鐘可以80M,保守是40M。在四線模式下,SPI時鐘SCLK為80M,相比單線來說可以提高四倍性能傳輸,也就是可以達到40MB/S。


但是在實際操作的時候,分頻SPI SCLK頻率到66M,又出現了SCLK時鐘不連續的情況,導致與理想速度不符合。

55d5be02-2fb3-11ee-bbcf-dac502259ad0.png

仔細翻下官方手冊,可以知道SPI有個寄存器是TRANSFMT,有一個位是DATAMERGE,對于描述如下:

55f75526-2fb3-11ee-bbcf-dac502259ad0.png

特別說明的是,由于SPI的數據FIFO是32位,這個功能只在數據單位長度為8位的時候有效,而且合并的數據量需要以四的整數倍。如此來說,在配置DMA的時候,傳輸寬度可以從8位變到32位,傳輸的帶寬也能提高了四倍。那么我們這樣配置下,邏輯分析儀結果如下:

在66M的SPI SCLK時鐘下,邏輯分析儀抓到的SCLK能保持連續,并且數據能對得上。512字節耗時15.352us,合計33MB/S左右,與理論速度33MB/S接近。


564514f0-2fb3-11ee-bbcf-dac502259ad0.png

80M的SPI SCLK頻率,傳輸512字節,耗時12.794us,合計40MB/S左右,也能滿足預期40MB/S速度。

566b762c-2fb3-11ee-bbcf-dac502259ad0.png

SCLK波形也能保持連續。

568a2266-2fb3-11ee-bbcf-dac502259ad0.png

四、號外(單線SPI總線可以達到120M)

四線模式既然能達到80M,那么樓主想試下80M的單線,也是沒問題的,效果如下:

56aeecc2-2fb3-11ee-bbcf-dac502259ad0.png

再嘗試一把,把SPI SCLK分頻到120M,只是稍微有點間隔,但單線SPI也是沒問題的。

56c8aec8-2fb3-11ee-bbcf-dac502259ad0.png

五、總結

對于先楫這個SPI外設來說,配合DMA,SPI的數據FIFO以及相關SPI配置,能達到手冊描述的性能。無論是四線模式還是二線模式還是單線模式,都能到達80M的SPI時鐘性能。


對于SCLK不連續的問題在于DMA搬運和SPI傳輸不同步造成,導致傳輸間隔中斷,特別是SPI頻率越來越高的情況下。解決同步問題就不會有SCLK不連續的問題存在。

以上內容來自先楫開發者原創分享。

我們始終相信開發者共創的力量。先楫社區堅持開源共享、互惠互利,貼近每一個開發者,一步一個腳印,一點一滴積累,為成為更好的我們而不斷努力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 主機
    +關注

    關注

    0

    文章

    998

    瀏覽量

    35178
  • 時鐘
    +關注

    關注

    11

    文章

    1736

    瀏覽量

    131587
  • SPI
    SPI
    +關注

    關注

    17

    文章

    1711

    瀏覽量

    91760
  • dma
    dma
    +關注

    關注

    3

    文章

    565

    瀏覽量

    100678
收藏 人收藏

    評論

    相關推薦

    光伏發電如何實現能效最大化

    光伏發電實現能效最大化是一個綜合性的問題,需要從多個方面入手。以下是一些關鍵措施: 一、選用優質設備 太陽能板 :選用具有高光電轉化效率和穩定性的太陽能板是基礎。例如,單晶硅太陽能板通常比多
    的頭像 發表于 12-05 11:06 ?307次閱讀

    運營商如何實現差異化連接

    如今,運營商正置身于一場關于如何極致釋放5G投資的高難度挑戰。本期《信觀察》將聚焦于如何通過“差異化連接”推動基于性能的服務,進而實現可擴展、可持續的解決方案,助力運營商將5G投資的價值“最大
    的頭像 發表于 11-18 14:38 ?252次閱讀

    spi master接口的fpga實現

    前言 當你器件的引腳賊少的時候,需要主機和從機通信,spi就派上了用場,它可以一對多,但只是片選到的從機能和主機通信,其他的掛機。 spi:serial peripheral inte
    的頭像 發表于 11-16 10:35 ?464次閱讀
    <b class='flag-5'>spi</b> master接口的fpga<b class='flag-5'>實現</b>

    KM振動分析與動平衡服務實現工廠設備效率最大化

    振動儀
    KM預測性維護專家
    發布于 :2024年10月16日 15:57:14

    擴展塢使用技巧:如何最大化你的筆記本電腦接口能力

    最大化您的筆記本電腦接口能力,以下是一些實用的擴展塢使用技巧: 了解您的需求:在購買擴展塢之前,明確您需要哪些類型的端口(如HDMI, USB-C, RJ45等)以及是否需要充電功能,以選擇最適合
    的頭像 發表于 10-08 10:52 ?534次閱讀

    液冷充電槍線最大化提高充電效率

    法法易提供的液冷充電槍線可以最大化的提升充電效率,讓大家的充電時間進一步縮短。? 液冷充電槍線使用液體循環來冷卻電纜,以避免因高溫而導致電纜損壞或充電速度減緩。而且液冷充電槍線采用銅芯導線和耐高溫、耐磨損、
    的頭像 發表于 09-11 14:25 ?418次閱讀

    Renesa RA如何使用SPI實現高速比特流的發送

    有些特殊的外設會使用基于SPI模式,發送連續比特流來傳輸數據。本文主要介紹對于Renesa RA,如何使用SPI實現高速比特流的發送
    的頭像 發表于 07-22 14:38 ?1555次閱讀
    Renesa RA如何使用<b class='flag-5'>SPI</b>來<b class='flag-5'>實現</b>高速比特流的<b class='flag-5'>發送</b>

    wifi的發送支持DMA嗎?

    wifi的發送支持DMA嗎? send(),這個函數是阻塞的嗎?怎么發送可以最大化發送頻率?我想在發送完成后處理一些東西,可不可以設置
    發表于 06-24 07:33

    請問esp32c3 spi slave從機端不能實時發送數據嗎?

    都是預先填充sendbuf,在阻塞等待spi主機發起,數據能正常發送 能否實現spi_slave_transmit等待,事件觸發,填充s
    發表于 06-21 08:15

    STM32作為主機,通過SPI進行數據交互,發送數據的時候出現亂碼怎么解決?

    我們使用ESP32-pico-mini與STM32DIY一款電子產品。使用ESP32做從機,STM32作為主機,通過SPI進行數據交互,當時鐘頻率為40MHz時,從STM32到ESP32傳輸音頻
    發表于 06-12 06:20

    PCB設計優化指南:如何最大化EMC性能效果?

    電源平面與GND平面相鄰,平面間距離很小,有最佳的磁通抵消效果和低的電源平面阻抗。主電源及其對應的地布在4、5層,層厚設置時,增大S2-P之間的間距,縮小P-G2之間的間(相應縮小G1-S2層之間的間距),以減小電源平面的阻抗,減少電源對S2的影響。
    發表于 04-08 14:22 ?1406次閱讀
    PCB設計優化指南:如何<b class='flag-5'>最大化</b>EMC<b class='flag-5'>性能</b>效果?

    STM32G070 SPI主機只接收模式關閉SPI使能后為什么還有時鐘輸出?

    使用STM32G070,一個板子實現主機只接收,另一個板子實現從機只發送,通信波形上發現主機SPI
    發表于 03-28 07:08

    SPI雙機通信中,時鐘信號由主機提供,那么從機向主機發送數據時需要時鐘信號嗎?

    SPI雙機通信中,時鐘信號由主機提供,那么從機向主機發送數據時需要時鐘信號嗎?從機是怎樣通知主機產生時鐘信號的?
    發表于 03-14 06:49

    虹科分享 | 實現網絡流量的全面訪問和可視性——Profitap和Ntop聯合解決方案

    這次和大家分享如何捕捉、分析和解讀網絡數據,從而更有效地監控網絡流量,實現網絡性能最大化。首先來看一個實際的問題——“網速太慢”。
    的頭像 發表于 01-18 10:40 ?424次閱讀
    虹科分享 | <b class='flag-5'>實現</b>網絡流量的全面訪問和可視性——Profitap和Ntop聯合解決<b class='flag-5'>方案</b>

    用于并行采樣的EVADC同步轉換,如何在最大化采樣率的同時最大限度地減少抖動?

    ; 必須設置相位同步器才能讓 EVADC 達到其有記錄的性能。" SSE=0、USC=1 設置會降低 ADC 結果精度嗎? 請告知最適合我的手機殼的設置是什么? 為了實現最小的抖動、最大的采樣率和最準確的結果,我還應
    發表于 01-18 07:59
    主站蜘蛛池模板: 国产3级在线观看| 亚洲AV久久婷婷蜜臀无码不卡| a免费在线观看视频| 亚洲AV综合99一二三四区| 蜜芽一二三区| 国内精品久久久久影院老司| www.青青草.com| 在线黑人抽搐潮喷| 午夜国产精品视频| 欧美最猛12teevideos欧美| 狠狠综合久久综合88亚洲| 东北成人社区| gogo免费在线观看| 最近2019中文字幕免费| 亚洲AV色香蕉一区二区9255| 日本xxxx19| 内射少妇36P亚洲区| 久久精品电影久久电影大全| 国产精品久久免费视频| 啊…嗯啊好深男男小黄文 | 色一伦一情一区二区三区| 久久综合电影| 久久不射网| 激情欧美日韩一区二区| 国产三级视频在线| 国产成人精品视频播放| 八妻子秋霞理在线播放| 99热在线播放| 97夜夜澡人人爽人人模人人喊| 又黄又粗又爽免费观看| 亚洲无线码一区在线观看| 亚洲高清视频在线| 小女生RAPPER入口| 无码国产成人午夜在线观看不卡| 日本阿v直播在线| 日本成熟bbxxxxxxxx| 青草在线在线d青草在线| 欧美精品一卡二卡| 欧洲兽交另类AVXXX| 人与禽物videos另类| 青青青青青青草|