無線網絡通信正在不斷發生著變化。所有新的4G空中接口(WiMAX、LTE、UMB、802.20、WiBRO、下一代PHS等等)都共享著某些公共的技術:所有接口都基于正交頻分多址接入(OFDMA);所有接口使用MIMO(多入多出);所有接口都采用“扁平化架構”并且都基于IP(互聯網協議)。
本文將討論其中的前兩項:具體地說,首先是介紹如何實現OFDMA的核心DSP算法,然后是被LTE用來實現上行鏈路的新技術,最后簡要介紹用于WiMAX和LTE的MIMO(所有IP方面的內容不在本文討論范圍內)。本文討論的前提條件是采用軟件定義的架構。
OFDM使用大量緊鄰的正交子載波。每個子載波采用傳統的調制方案(如正交幅度調制)進行低符號率調制,其數據速率保持與相同帶寬下的傳統單載波調制方案相同。增強性能的OFDMA技術允許通過給多個用戶分配特殊頻率并共享信道。
采用單載波方案的OFDM的主要優點是無需復雜的均衡濾波器就能夠應付多種信道條件。例如,很長的銅線中產生的高頻衰減,窄帶干擾以及由于多徑導致的頻率選擇性衰落。由于OFDM可以看作使用許多慢速調制的窄帶信號,而不是使用一個快速調制的寬帶信號,因此信道均衡可以得到簡化。低符號率可以充分利用符號間可提供的保護間隔,從而使得處理時域擴展(time-spreading)成為可能,并能消除碼間干擾(ISI)。
在目前為止的大多數系統中,如WiFi、16d和16e WiMAX和LTE下行鏈路,核心算法一直是FFT。然而,LTE上行鏈路進行了革新,要求使用更復雜的離散傅里葉變換(DFT)。
所有這些系統不僅需要高速FFT處理,而且要求靈活性。頻增的市場壓力要求供應商發布的產品兼容較早的標準,但也必須具備足夠的靈活性,以便能通過簡單的軟件升級而升級到最終版本,或者是讓同一個系統支持不同的模式或不同的標準(如用于LTE和WiMAX的公共平臺)。
然而,也可以采用可編程平臺,這種可編程平臺可以在靈活的軟件引擎上高效地實現面向硬件的算法。picoChip公司的高性能PC102就是一個很好的例子,它結合了軟件開發環境的面市時間和提取優勢以及在算法中采用并行機制帶來的性能優勢。
FFT其實就是離散傅里葉變換(DFT)的一種高效實現。對于一個N點DFT來說,直接實現要求N2次復雜的乘法與加法運算,但作為一個提供難以置信的效率增益的完美例子,經典的FFT只要求N2N次運算。
有兩種方法可以將DFT減少為一系列更簡單的運算。一種方法是執行頻域抽取,另一種方法是執行時域抽取。這兩種方法需要相同數量的復雜乘法和加法運算。兩者的主要區別是,時域抽取接受數字翻轉的輸入,產生正常順序的輸出,而頻域抽取則接受正常順序的輸入,產生數字翻轉的輸出。輸入和輸出運算由所謂的蝶形運算完成。每個蝶形運算都要將輸入乘上復雜的旋轉因子e-j2πn/N。
流水線FFT可以采用對串行輸入流的實時連續處理進行表征。面向硬件的方法通過盡量減少復雜乘法器的數量和所需的存儲空間來減少硅片的成本或面積。這樣可以在一定的面積上并行計算更多的單元。
FFT算法涉及到數據的暫時分離,這是由蝶形運算執行的一項任務。由于樣值要從輸入流中的不同點處獲取,因此流水線FFT需要對數據進行緩存和重新排序。目前有許多不同的架構可以解決這個問題。本文的FFT用例采用了標準的radix-4頻域抽取算法。
1 FFT的picoArray實現方案
picoChip PC102是一款高性能的多核DSP,專門針對無線做過優化。它在單個裸片上集成了300多個種類略有不同的處理器(或“陣列單元”):每個處理器均是自帶存儲器的傳統16位哈佛結構DSP,如表1所示。
表1:PC102處理器變化和存儲器分布(*FFT的最大數量受限于可用MEM類AE的數量)
picoArray編程模型使得組裝流水線結構變得非常容易,這也是實現FFT所用的方法。舉例來說,每個radix-4蝶形運算包括4個復雜的乘法(注意,第4個蝶形運算只包含復雜的加法),并被映射到一個獨立的處理器。每個陣列單元都是從內部總線獲取輸入數據,經過處理后再向流水線中的下一個DSP提供輸出。由于總的吞吐量受限于最慢的陣列單元,因此理想情況下陣列單元上的每個環回都應花相同數量的周期才能實現最佳的性能。例如,如果每個陣列單元在8個周期內處理每個樣值,那么最大吞吐量在160MHz時可達每秒20M個采樣。
FFT實現接收16+j16、左對齊、按順序輸入的數據,提供16+j16、也按順序的輸出數據。在每個蝶形運算中會發生位增加現象,其中2個位用于加法,16個位用于復雜的乘法,這種位增加在采用就近舍入策略的40位STNA2 AE累加器中很容易管理。這種機制可以保持中間值的最佳可能精度 ,從而達到較高的輸出數據信噪比。圖1a顯示了本實現中的單元。
圖1b:FFT內部單元;并行FFT可實現LTE上行鏈路要求的更高吞吐量DFT
表2總結了PC102上的256點FFT的性能。表2給出了復雜采樣速率在10MSps和80MSps之間的256點FFT所要求的資源,并給出了在PC102上能以每個速率點執行的最大FFT數量。從表中可以看出,單個10MSps FFT需要約1.5%的資源。
表2:picoArray上的OFDMA采用的256點 16+j16 FFT的資源使用
從圖1b可以看出如何通過整合“構建模塊”FFT來獲得更高的吞吐量--顯然并行架構是非常適合的。
雖然目前大多數標準采用OFDM(WiFi、802.16d、Flash OFDM)或OFDMA(802.16e),但LTE選用的上行鏈路發送機制是最新的SC-FDMA(單載波FDMA),也稱為DFT擴展OFDM。
與傳統OFDMA相比,SC-FDMA的優點是信號具有更低的峰值/平均功率比(PAPR),因為它采用了固有的單載波結構。這在上行鏈路中尤其重要,因為在上行鏈路中更低的PAPR可以使移動終端在發送功效方面得到更大的好處,并進而延長電池使用時間。因此一些人士認為,SC-FDMA“集兩者之大成”,即單載波的低PAPR和多載波的魯棒性。當然,天下沒有免費的午餐,這些好處的代價是增加了數字處理的復雜性,如上所述。
SC-FDMA上行鏈路的實現如圖2所示,其中DFT位于OFDM調制器之前,這表明比標準OFDMA要多一些步驟。
圖2:SC-FDMA或DFT擴展OFDM
眾所周知,如果變換點數可以分解成少量的數(素數),就可以高效地實現DFT。分解時素數越少,實現越簡單。當然,經典FFT使用單個素數因子2。
LTE中的DFT預編碼器尺寸取決于為指定用戶的上行鏈路數據發送分配的子信道數量。
其中N是子載波的數量,a、b和c在 N ≤1320 條件下都大于等于0 (20MHz帶寬時)。對于指定的用戶,N范圍可以從12個音 (a,b,c=0,即單個資源模塊)到1296,總共35個不同的選擇,這些音再一起經過調制形成單載波上行鏈路。然而,這是在手機發送器側,因為基站接收機要處理許多用戶,每個用戶從這些選項中作出選擇,針對所有可能的幀配置的總允許變換器數量是531、783、569。這種靈活性顯然增加了接收iDFT的復雜性。
用于分解iDFT的技術是“分而治之”,主要原理與大家熟悉的FFT相同,但iDFT的長列表無法被分解成單個素數因子。相反,每個音可以被分解成長度為2、3和5的三個短iDFT。這些是iDFT的“引擎”。在本例實現中,一些iDFT已經被分解成素數因子(如4、8和9)以外的其他因子,以便將流水線級的最大數量減小至3,從而帶來縮短延遲的好處。
圖3顯示了LTE iDFT的邏輯結構,這種結構可用來在PC102/PC20x上實現20MHz的LTE eNodeB。
圖3:LTE iDFT庫結構
流水線級必須能夠實現所有35種可能的iDFT功能,并動態地重新配置和避免由于不同長度iDFT同時流過而造成的任何流水線危害。最簡單的架構是重新排序+級緩沖對A、B和C都成為用來實現所有6個iDFT引擎的相同功能塊的實例(如果計算1點iDFT就是7臺引擎,即通過不變)。更優化的解決方案確認只有一級需要實現9點引擎,另外一級需要實現8點引擎,第三級需要4點引擎,加上2、3和5個引擎,因為任何iDFT長度都不需要超過一個9、8或4。
使事情復雜化的因素之一是,LTE是一個帶寬可擴展的系統(簡言之,TDD/FDD都是1.25MHz~20MHz)。表3列出了不同模式時的不同實現方式。雖然與FFT相比靈活性有一定的代價(見表2),但值得注意的是,這種架構在實現這些配置時效率仍然特別高:即使所需的20MHz+20MHz FDD(最壞情況)資源也仍只占PC102的10%。
表3:picoArray上可擴展iDFT的資源使用
2 MIMO
MIMO是指在發送機和接收機上使用多幅天線以改善通信性能,它是所有4G系統的一個特點。
MIMO不需要增加帶寬或發送功率就能顯著地提高數據吞吐量和鏈路距離,并具有更高的頻譜效率(每秒每赫茲帶寬可傳更多的位)和鏈路可靠性或空間分集性能(降低了衰落)。
發送(TX)端有m幅天線,接收(RX)端有n幅天線,就形成了一個mn的MIMO,此時信道的數量就等于所有組合之和:例如一個22的MIMO就有4個“信道”(1-1,1-2,2-1,2-2),性能將達到SISO系統中香農極限值的兩倍。你只能從4個“信道”中發送2倍的信息,因為你需要“解開”信道矩陣才能提取信息。在實際應用中,信道不是完全獨立的(存在一定的相關性),因此優勢有所降低。事實上有個似是而非的結論,即信道越差(更多的多徑等),MIMO的用處就越大,因為信道相關性越少。在自由空間中,由于4個信道非常相似,因此帶來的好處非常有限。
MIMO有多種不同的使用方式。拿WiMAX下行鏈路來說,它有兩種標準的MIMO模式:Matrix A和Matrix B。前者也被稱為空間時間編碼(STC),它通過兩幅發射天線以不同的形式發送相同的信號。由于發送的是相同的符號,數據速率在SISO上不會提高,但由于兩種形式(s和-s*)不同,接收機有更好的機會恢復數據,因此魯棒性和范圍(針對指定的數據速率)得到了改善。為了在下行鏈路中實現這一技術,雖然符號率塊不受影響(發送的一個符號),但現在有兩個突發鏈(burst chain),它們用不同調制形式的信息饋送到兩幅天線。
Matrix B則相反,它通過發送兩個不同的符號來獲得雙倍的數據速率。在這種情況下,共有兩個突發鏈(針對兩幅天線),每個鏈處理獨立的符號;在實際應用中,它將不是簡單的復制,而是符號率部分將被設計得更加快速,然后將輸出信號交替發送給兩個TX分支。實際系統同時支持兩種模式,可以根據每個用戶要求選擇Matrix A或B:向條件較好的系統以較快的速度發送數據,而使用STC能使蜂窩邊緣的系統受益。
這非常適合多核架構。如圖4所示,有兩個獨立的突發鏈饋送倒兩幅天線:同樣的架構被簡單地例示了兩次,這對工程師來說非常簡單。這個特殊的圖實際上稍微有些復雜,在實際應用中,許多系統都結合使用MIMO和多種空間技術,如波束成形、“調零”(null-steering)天線或SDMA。這個特殊設計共有8幅天線,配置為每個MIMO分支4幅,每個天線都可以獨立控制。
圖4:具有兩個獨立突發鏈的MIMO下行鏈路系統
在接收機側,信號處理相對更加復雜:不僅因為Matrix B有更高的峰值數據速率,而且用于區分不同信號的接收機特別復雜。
3 本文小結
空中接口正變得越來越復雜,并且依賴于更復雜的算法才能獲得最佳的性能、效率和范圍。基于FFT的OFDMA已經成為下一代無線的標準技術。但最新的技術,如LTE,也在尋求做出更多的改善:它們采用更復雜的技術,如SC-FDMA,并要求靈活的DFT技術。
我們可以使用軟件可編程架構來模仿面向硬件的折中所具有的優勢和靈活性,引導系統制造商更早地進入需要WiMAX和LTE等算法的市場。這樣就能讓他們比競爭對手更早地推出產品,并仍確保與標準的兼容。事實上,一個合適的架構可以實現從一個公共平臺開始的所有標準(如802.16d/e和LTE,以及下一代PHS或UMB)。擴展這種架構以支持MIMO相對比較簡單。
評論
查看更多