摘要:通過分析920T核ARM 處理器的高速片上系統總線AHB時序及其靜態存儲控制器SMC接口模型,研究IBM PC/AT和IEEE PC/104總線規范,提出一種在ARM 平臺上實現兼容PC/104總線的方案.深入探討兩種平臺體系在存儲器結構、指令系統及總線時序等方面的巨大差異,給出了克服這些差異并實現總線功能兼容的方法.該兼容總線解決了在ARM 平臺上無法使用標準PC/104模板的難題,采用該方案有利于在嵌入式系統的設計中兼取ARM 處理器和PC/AT體系的優勢.?????????
引 言
???? PC/104 是一種專門為嵌入式應用而定義的工業控制總線規范.以IBM PC/AT總線規范為基礎的個人計算機及其外圍設備在應用上取得了巨大的成就,IEEE一996稱之為ISA(工業標準架構:Industry Standard Architecture)總線.PC/104是ISA標準的延伸,定義在IEEE-P996.1中,稱為兼容PC嵌入式模塊標準.PC/104實質上是一種緊湊型的ISA,其信號定義和Pc/AT基本一致,但電氣和機械規范卻完全不同,是一種優化、小型、堆疊式結構的嵌入式總線系統.PC/104總線來自于實踐發展的需要,同時得益于PC技術的迅速發展,由于其開發環境友好、兼容芯片豐富、標準支持廣泛等優勢,受到了眾多從事嵌入式產品生產商和系統集成商的歡迎,盡管現在ISA設備已不常見,但PC/104在嵌入式系統領域卻仍是通行的標準.
ARM是當前嵌入式系統應用中的熱門技術.由于ARM處理器的卓越性能、較低的價格以及業內半導體廠商的廣泛支持,在嵌入式環境中有廣泛的應用.ARM 公司創造了CHIPLESS模式,該公司通過將高效的ARM 內核授權給半導體公司,由半導體公司根據實際的應用情況加上各種外圍的功能電路來構成一塊完整的芯片,這種模式使半導體廠商得以有能力生產功能強大的各種專用處理器芯片.AR M在設計上基于SoC思想,優先考慮對每一個具體應用使用最大可能集成周邊設備的單一芯片,但在板極擴展方面仍然缺乏能被廣泛接受的新工業標準.
1 PC/AT模型和PC/104總線
1.1 總線信號
?? PC/104_4 ]是一種16位總線,但可向前兼容8位XT模式,典型總線時鐘為8 MHz,4個時鐘脈沖可完成一次完整的總線訪問,必要時可插入一個額外的等待周期以適應低速外設.在嵌入式系統開發中常用以下信號.
1.1.1 地址和數據信號線
? BALE總線地址鎖存使能信號線,由平臺CPU驅動.當ISA擴展卡或DMA控制器占用總線時,它也被置為邏輯1.
SA~19:O>:低2O根地址信號線,由當前總線的擁用者驅動.
LAd 23:17> :鎖存地址信號線,用來訪問16MB的存儲器地址空間.由當前總線擁有者或DMA控制器驅動.
SD<15:0> :數據信號線.
1.1.2 總線周期控制信號線
MEMR#:存儲器讀信號線.
MEMW #:存儲器寫信號線.
IOR#:I/O I/O讀信號線.
IOW #:I/O I/O寫信號線.
1.1.3 中斷和DMA(Direct Memory Access)信號線
IRQx:中斷請求信號線.
DRQx:DMA請求信號線.
DACKx#:DMA應答信號線.
1.2 地址空間
??? PC/AT系統使用不同的指令訪問存儲器空間和IO端I:1空間,訪問存儲器空間時PC/104總線驅動MEMR#和MEMW#信號,訪問存儲器空間時PC/104總線驅動IOR#和IOW #信號.兩個空間使用同一套地址線,但是由于端口空間只有64K有效,所以進行IO 端口訪問時地址線上只有SA<15:O>是有效的.
??? PC/AT系統有專門的端口訪問指令用于實現端口訪問,Linux用戶程序只需以root權限調用ioperm()指定需操作的端口地址范圍,之后即可自由訪問這些端口.由于用于訪問端口的一組宏實際上直接對應CPU的端口訪問指令,所以存取效率很高.
1.3 PC/104總線周期
PC/104總線周期分為CPU驅動和DMA控制器驅動兩大類,在嵌入式應用中較常用的是CPU驅動的IO讀/IO寫周期.
?
圖1中采用8 MHz時鐘的標準PC/104總線£Rd大于300 ns,tAF應大于250 ns,tRDpw約為500 ns。
2 EP9315(ARM920T)體系
2.1 存儲器結構和地址空間
???? EP9315是Cirrus Logic公司生產的典型ARM 920 TDM I(Thumb,Debug,M ultiply,Em—bedded ICE macrocel1)32位哈佛結構處理器.EP9315有一個通用存儲器訪問接口,支持SDRAM,SRAM,ROM,及FLASH(包括N0R FLASH)等不同形式的存儲器,各種存儲器訪問均共享數據總線DA[3l:O]和地址總線AD[Z5:o],使用統一的訪問控制邏輯 。
??? 與X86模型不同,ARM 平臺只實現一個物理地址空間,在Bo0T成功后只擁有一個唯一的虛地址空間,CPU不設立專門的外設I/O指令,訪問外設I/O端口和內存單元使用相同的指令.
?? 引腳CSn[7:6]和CSn[3:O]用于存儲器芯片的選通,除發生時間略有差異之外(圖2),基本上可視為地址總線的高位線.
2.2 AHB總線時序和SRAM 接口
?? AHB(Advanced High-Speed Bus)是EP93 1 5內部920T核與存儲器、DMA,存儲器等設備實現高速互聯的系統總線.EP9315的AHB具有完善的多主控沖突仲裁能力,其典型工作頻率可達100 MH。
靜態存儲控制器SMC(Static Memory Controller)與920T核心通過AHB互聯,支持存儲器的8/16/32位訪問方式.SMC最多可提供8個組,每個組均可支持SRAM,ROM,FLASH EPROM 等存儲器的訪問,各組可以對數據總線寬度和速度等參數獨立配置.圖2描述了SRAM 讀操作時序.
?
圖中f刪為CSn到RDn的延遲,最大值為3 ns;tDAs是RDn無效前的數據總線建立時間,最小值為12+tHcI tRDD 是RDn有效時間,典型值為t HcI K×(W ST1+ 2)。
HCLK是AHB總線的工作頻率,該頻率的高低直接影響系統全局性能,因此通常配置為上限100 MHz,此時相應周期£脅 為10 ns.WSTI用于控制sMc對SRAM/R0M 的訪問速度,寄存器SMCBCR0—3, SMCBCR6-7 (地址0x80080000—0x8008001C)的第5-9位分別為相應各組的WST1.WST1的默認值為0xlF,即默認情況下SMC使用
最低的訪問速度,顯然fRDD 為330 ns,小于PC/104總線中的500 ns(圖1).
3 PC/104總線實現
3.1 總線驅動
??? 在EP9315支持的各類總線接口邏輯中,SMC提供的SRAM/ROM 時序與PC/104總線最為接近.將外部設備所需的PC端口空間和存儲器空間均映射至統一的虛擬空間中即可實現訪問.
? 注意到PC/104總線使用標準TTL邏輯電平,而EP9315的處理器是3.3 V器件,在極端負載情況下無法保證系統穩定工作.TI的雙電源總線收發器1T45,2T45,16T245等可用于實現電平轉換,圖3是1T45的引腳邏輯圖.
?
地址總線及訪問控制信號均由CPU驅動,外部設備始終處于被動接收狀態,正確設定數據流向即可.
數據總線信號是時分雙向傳輸的,為遍免出現總線沖突,必須保證除非CPU 透過該收發器對外設進行讀訪問,否則收發器的CPU 側應始終處于高阻狀態.為此,16T245等具有輸出使能端的器件只需使輸出無效即可,而對于無使能端的收發器則應使CPU側處于輸入狀態(高阻).
確認CPU 已向兼容PC/104總線發起讀操作的有效方法是檢查RDn的下降沿是否發生.一旦RDn下降,應立即將收發器置成從外設流向CPU方向,且輸出使能有效,并至少保持至RDn上升沿之后,以保證可靠讀取.
3.2 端口映射
??? SMC的存儲器分組片選信號CSn可作為高位地址線參加這址譯碼.任取CSi和CSj組用于兼容總線,即可分別實現O-0x3FFFFFF的獨立存儲器地址和IO端口地址.可用地址數量已經遠超出XT系統中的1 M(存儲器)和1 K(IO端口).
??? 在Linux系統中,io.h文件中聲明了函數iore—map(),用于將兼容總線上外部資源的物理地址映射到核心虛地址空間中.iounmap()函數用于取消ioremap()所做的映射.上述操作都應在設備驅動程序中執行.在外部資源成功映射到核心虛地址后,使用指向核心虛地址的指針就可訪問相應設備資源,但顯然這種訪問方式與在X86平臺下差異較大.
??? 將兼容總線視為一個獨立的字符設備,為其編寫驅動程序,實現對指定偏移地址的讀寫函數,此處的偏移地址即對應PC/104總線中的物理地址 .
??? 對inb(),outb()等X86平臺下的常見的底層端口操作函數,可用宏替換的方式轉由驅動中的相應讀寫函數實現.
3.3 總線時序控制
??? 綜合前文所述,盡管SMC的SRAM 訪問時序非常接近PC/lO4總線,但是要實現高兼容性的PC/lO4,仍有兩方面問題需要解決,一是SMC驅動的SRAM 讀寫速度遠高于PC/104總線,二是為解決電平兼容問題引入的總線收發器,其數據流向和輸出使能需要適當的控制.
??? 以下VHDL代碼根據SMC輸出的RDn和WRn設置EIOR和EIOW 時序,并適時輸出信號EXIDR,EXOE控制收發器數據流向和輸出使能.
ECLK是頻率為27 MHz是時鐘脈沖.
If ECLK’EVENT and ECLK一‘1’then
if(? )then __地址無效
EXoE< 一:1’;
EXDlR< 一‘1’;
EIOR< 一‘1’;
rdreg< 一0;
else
if rdreg< 1 l then
rdreg< 一rdreg+ 1;
EXOE< 一‘0’;
else
rdreg< 一0;
EXDIR< 一‘1’;
EXoE< 一‘1’;
end if;
if rdreg< 2 or rdreg> 6 then
EIOR< 一‘1’;
EIOW < 一‘1’;
elsif rdreg一2 or rdreg= 3 then
if RDn一‘1’then
EIOR< 一‘1’;
EXDIR< 一‘1’;
elsif W Rn一‘1’then
EIOW < 一‘0’;
EXDIR< 一‘1’;
end if;
end if;
上述代碼適當延遲了關閉雙電源收發器的輸出使能和數據流向重設時間,保證數據總線穩定,使CPU 和外設有足夠的時間進行輸入輸出操作.
圖4中曲線2是兼容PC/104地址空間內任意地址信號經收發器緩沖后的譯碼結果,曲線1和曲線3是對該地址進行讀操作時的RDn和IOR信號.
圖4中RDn由EP9315直接驅動,原始邏輯電平為3.3 V,實驗電路對該信號電平進行了無時延的處理.
目前主流元器件在速度上都已能兼容PCI總線,因此盡管SMC驅動的SRAM 讀寫速度高于標準PC/104總線,但只要保證各控制信號問關系清晰(圖4b),是不會造成總線訪問失敗的.
4 結束語
??? 利用ARM 系統成本較低,功耗更小,啟動速度快,指令效率高的的特點,兼取PC/AT系統和PC/104總線設備在產業化基礎方面的優勢,在ARM平臺上構建PC/104總線,有助于利用現有資源,保護已有投資.由于ARM 與PC/AT模型在處理器架構上有本質性的差異,在ARM 平臺上構建的PC/104總線在所有的具體應用中要做到與標準PC/104規范完全兼容幾乎是不可能,但是在特定的應用需求及確定的操作系統下這種努力是完全可行并且有效的。對于特定的應用而言,通常只需顧及PC/104總線時序的一個子集,這就大大降低了系統現實的難度。兼容PC/104總線在使用遵守ISAPnP(Plug and Play)規范的設備時有較多的困難。另外在使用包含中斷請求和DMA需求的設備時也需要專門的考慮。
評論
查看更多