知識詛咒(Curse of Knowledge),是指我們掌握了某知識,就很難體會沒有它的感覺,不理解獲得知識以前的狀態及還未獲得該知識的人,從而產生溝通障礙。
計算機體系結構正在消亡 (Architecture is dying)?其背后可能是對傳統的馮·諾伊曼體系結構在應對多樣化應用時局限的無奈,以及對摩爾定律的放緩甚至終結的擔心。那么,計算機體系結構又將面對怎樣的未來呢?
01?關于計算機體系結構
計算機體系架構(Computer Architecture)泛指計算機硬件系統設計的各個方面,包括指令集架構(Instruction Set Architecture,ISA),微體系結構(Microarchitecture),內存系統(Memory System),存儲設備(Storage De- vice),網絡設備(Networking Device)等。
半導體技術與計算機體系結構是推動信息技術創新的兩個核心技術,都是幕后英雄,往往不為大眾所知。摩爾定律的終結使得芯片設計師再也不能“無償地”每18個月將設計中的晶體管數量提高一倍。而計算機體系架構演進導致了性能的增長,帶來的各種好處顯而易見。自1985年以來,計算機體系結構的革新貢獻了約80倍 的性能增長,與半導體技術進步的貢獻相當。
由于大多數半導體技術與計算機體系結構的創新是對上層應用透明的,應用與軟件的開發人員們無需參與底層技術創新就能體驗這些技術進步帶來的各種好處。
盡管依然能夠制造出更多更小的晶體管,但已不像過去那樣了,單個晶體管的功耗已不能很好地按比例縮小。由于傳感器、移動設備、終端與數據中心等大多數產品都不能容忍功耗的不斷增長,必須考慮各種手段來緩解功耗增長。納米級特征的制造偏差,嚴重地降低了晶體管的長期可靠性。隨著新技術(如芯片堆疊技術) 與新挑戰(如數據中心)的出現,必須通過局部性原理來管理計算部件之間的通信,從而實現合理的成本和能耗目標。設計、驗證、制造和測試的一次性成本不斷增加,導致這些成本更難被分攤。
也就是說,在失去幾近完美的工藝技術按比例縮小所帶來的好處時,該如何構建從傳感器到云端的基礎設施,如何從性能到隱私等多個角度去讓計算機體系結構來增加價值?
02?對計算機體系結構的需求是什么?
新應用場景的不斷涌現,對計算能力的需求在日益增長。在物聯網時代,嵌入式傳感器產生的連續數據流和由大量多媒體內容無處不在,數字化信息在爆炸式增長。出于健康、商業和其他目,處理此類數據需要高效地平衡計算、通信和存儲的關系。
為傳感器提供足夠的能力以便在生成/ 收集數據的地方篩選和處理它們,以達到最優能效,通信所需的能量大大超過計算。很多數據流產生數據如此之快,以至存儲在成本上不可行,數據必須被立即處理掉。在其他情況下,環境的限制和聚合不同數據源的需求影響了在哪兒執行這些任務。此類的權衡提出了對混合架構的需求,在節約能耗的同時有效地降低數據傳輸。?
為了保護服務的邊界、環境和服務自身,計算資源必須隨時可用,并隨時準備高效地提供服務。這樣的可用性需要底層的硬件和軟件提供可靠性、安全性和自我管理功能,而這些特征是目前大多數系統都不能提供的。雖然當前大型機和醫療設備都在努力實現5個9的可用性(每年僅5分鐘的不可用時間),但實現這一目標仍然花費巨大。這就要求計算機體系結構在很多層面上實現這樣的可用性,而且成本低廉。?
隨著我們對數據的依賴不斷增加,會變得更加依賴對計算性能的權衡,以確保可用、隱私和安全的交易。信息安全要優先考慮,而目前的計算系統極易受攻擊。網絡信息戰不再是假象,通過互聯網,對政府網站的攻擊早已司空見慣。這就需要新的硬件系統、體系結構、固件和操作系統,以便為上面的應用中所需分布式信息安全提供保障。
03?對計算體系結構的挑戰
各種新興的應用需要體系結構保障數據的安全性和隱私性,容忍日益變得不可靠的晶體管帶來的故障,以及增強可編程性、可驗證性和可移植性。保證軟硬件可靠性比以往任何時候都重要;對一些植入式醫療設備而言, 尤其事關生死。重新考慮安全和隱私的問題,并且定義系統結構級界面,以使硬件作為可信源更高效地支持安全服務。
3.1將計算機體系結構作為基礎設施
計算機體系結構必須超越那種優化每一個孤立設備的情況,接受跨環境協同設計帶來的挑戰。在智能感知領域,核心的約束是在非常嚴格的能量、尺寸和成本的限制下完成計算。大規模計算的需求只能通過將成百上千個處理器的能力合并成為一個大規模分布式計算機才能完成,互聯網搜索引擎已經展示出這種計算范式的社會重要性。
由于用戶界面對于計算能力的要求越來越高,例如多點觸控、語音識別、AR/VR、全息影像、3D場景重建等等,甚至移動應用也正向數據和計算密集型轉變,這些應用將需要現有設備的單位能量運算率從現在的約百億次運算/瓦提升若干個數量級。對于運行時而言,計算機體系結構要允許程序功能被分別劃分到端邊云,并且這種劃分還要能夠動態地適應云端上行可靠性和能效的變化。
也就是說,計算機體系結構將作為基礎設施,是覆蓋從傳感器延伸到云的生態系統體系結構。
3.2 能耗優先的挑戰
針對服務器領域的能耗解決方案與針對便攜設備領域的解決方案有著顯著的差異。然而,無論是對高端的服務器領域還是便攜、傳感器設備領域,對計算性能永無止境的需求都將使得功耗、能耗和散熱成為計算機體系結構的掣肘因素。
在體系結構層,需要提出更高效、更合理的多核體系結構。在軟件層,需要研究如何最大限度減少不必要的通信。在編程模型層次,需要編程環境既可以支持專家級的程序員對整個機器進行控制,又可以對普通程序員提供簡單的局部性模型。在應用層,需要高能效的算法級策略來減少操作數量、訪存數量和處理器間的通信量,充分利用異構系統的優勢。在編譯層,需要新的法有效地在功耗效率與性能之間做出權衡,同時兼顧二進制代碼的可靠性。
也就是說,降低能耗可能需要從三個途徑加以解決:跨層次的能效優化,對“并行”的重構和有效利用“專用計算”。
3.3 工藝技術的挑戰
新技術和新工藝驅動了電路、功能單元、微結構和計算機系統的新型設計。非易失性存儲技術可以提供很高的存儲密度和功 率效率,但需要針對器件能力重新設計內存和外存系統結構。裸片堆疊技術雖然擁有降低連線延遲,提高片上帶寬等多種優勢,但仍需面對電子設計自動化、設計和工藝支持等多種挑戰。新工具必須要滿足新技術的要求,能夠支持功能綜合、邏輯綜合、版圖設計等;異構計算更是挑戰著在寄存器傳輸級設計之前對系統建模的能力,還要面對著結構的多樣性和加速部件數量的急遽增加。
3.4 跨層次接口的挑戰
計算機體系結構中的可編程性是指研制的軟件應滿足性能、能耗、可靠性以及安全性等指標。
過去,人們關注的是軟件工程技術, 以性能和能耗為代價提高編程者的生產率。當能效以及其他目標變得更加重要時,需要新的技術來削減編程抽象層次,從而消除不必要的低效。已有的改善可編程性的技術(包括DSL、動態腳本語言如Python和Javascript等)只是部分的解決方案。
然而,當前的指令集不能提供有效的方式來捕獲軟件意圖或將關鍵的高層信息傳遞給硬件。新的高層接口需要封裝并將編程者和編譯器的知識傳遞給硬件,從而獲得更高的效率與有價值的新功能。可以使程序員能在更高層次表達并行度、局部性、計算依賴以及關鍵的共享和通信模式的接口。這種接口可使硬件更簡單和有效,并具有高效的通信能力且能最大程度減少數據移動的同步原語,支持異構并行。
當然,這需要能夠清晰地識別長期數據及程序依賴關系,以便軟硬件調度器能夠動態地識別代碼中的關鍵路徑。沒有分析、管理與優化通信的能力,則沒有辦法保證性能、能耗與服務質量的目標。當考慮大數據應用場景時,由于涉及眾多龐大系統之間的數據協作,數據管理會變得更加復雜。現有的系統缺乏合適的軟硬件抽象層來描述通信關系。
對可靠性而言,要求跨層次接口能夠在單一應用中為不同模塊之間指明細粒度的保護邊界,能夠把安全當成一級公民,并且能確定應用的彈性需求與期望。應用的某些部分也許要能容忍硬件故障,以便運行起來能效更高。所有的這些接口都可以從合適的計算機體系結構中獲益,比如信息流的追蹤、不變量的生成和檢查、事務恢復塊、可重構等等。
04?計算體系結構的發展趨勢
4.1 硬件設計大眾化
開發硬件必須像開發軟件一樣簡單、便宜和靈活。與在通用處理芯片相比,專用硬件方案單位操作上可提高能效 10000 倍 ,此類能效的提升對于物聯網應用至關重要。“大眾化”的硬件設計, 也就是讓硬件設計變得像軟件設計那樣敏捷、便宜和開放。軟件開發團隊可以利用豐富的、擁有現成 的可重用部件的生態系統, 使用高級語言加速提高單個開發者的能力,并依靠強大和自動化的程序分析、綜合、測試和調試來保 證品質。
4.2 云計算是對計算機體系結構創新的抽象
云計算利用規模化不僅是為了自身業 務,也是為了投資 IT 的客戶利益,已經前所未有地使用了專用計算機架構。無論是高端的超級計算 機,還是商業的云端產品,GPU 變得無處不在,FPGA也促進其數據中心的計算專用化。專用集成電路云 展示了如何協同開發大量高度專用的處理器,從而讓關鍵應用得到明顯加速。
虛擬化這類技術將硬件和軟件創新透明地引入到了現有的軟件系統。虛擬化使得云提供商可以為了更快、 更便宜的技術替換處理器、存儲器和網絡部件,而不必與消費者溝通協調,也促成了資源的超額認購,在消費者對特定資源的需求具有時變、 碎片化特征的情況下,在消費者之間進行透明的資源共享。超額訂購對云計算的成本結構很重要,和單獨的消費者購買專屬資源比較,它使得云供應商以極低的價格提供 IT資源。
4.3 垂直化趨勢
3D 集成為芯片設計提供了一個新的擴展維度, 盡管摩爾定律終結了,仍然可以在一個單系統上集成更多的晶體管,可以從 3個維度縮減互聯開銷, 并實現各種混合制造技術的緊密集成。因此,3D 結構內部的系統組件具有更高的能效、更寬的帶寬和更低的延遲。
4.4 計算機體系結構“更接近物理層”
新的存儲器件正在進入商用化,與傳統存儲層次部件相比,這些新器件在開銷、密度、延遲、吞吐量、可靠性和壽命等方面完全不同。碳納米管可以保證更高的密度和更低的功耗,并且可用在三維基底上,這使得碳納米管成為體系結構方案是非常可行的。量子計算和超導邏輯,能夠提供 “免費”的通信,傳輸信號幾乎不消耗能量 。DNA 計算已經演示了簡單的邏輯操作,許多成果也表明了 DNA 作為存儲器和納米結構自組裝的數字媒介具備潛力。
4.5 機器學習作為核心負載
目前的重點是支持云端的機器學習,但是在諸如智能手機和超低功耗傳感器節點等低功耗設備中支持機器學習應用也非常重要。幸運的是,許多機器學習內核具有相對規整的結構,能夠在準確率和資源需求之間進行權衡。因此,它們適用于專用硬件、重構和近似計算等技術。
計算機體系結構是計算機硬件系統的表達,發展趨勢是彌合應用領域和器件領域之間的鴻溝,確保信息技術有一個堅實的未來。
審核編輯:劉清
評論
查看更多