回顧計算機發展的歷史,任何一個計算架構的成功都離不開強大的硬件,但這背后更需要繁榮的軟件生態。
1960年的集中式計算出現后,諸多基礎軟件應運而生,隨后進入“Win-tel”獨霸PC的時代,近年來,Intel和Linux又帶來了分布式計算的高潮。
如今,隨著5G的到來,移動互聯網業務進一步發展,大數據、物聯網、人工智能等創新應用場景層出不窮,應用場景的多樣性催生出數據的多樣性,導致原有的單一計算架構明顯跟不上龐雜的業務需求,業界對提出一種全新計算架構的呼聲愈烈。
很快,華為瞄準了多樣性算力架構。在去年9月的華為全聯接大會上,他們提出了“鯤鵬+昇騰”的雙引擎計算戰略以應對算力需求的爆發式增長。
這是一個全棧協同創新的過程,需要硬件提供算力,軟件釋放算力,盡最大可能讓上層應用使用算力,并且最終創造價值。硬件是整個生態的基礎,但決定多算力架構能否取得成功的關鍵樞紐是軟件,這是華為需要啃下的另一塊硬骨頭。
四大基礎軟件再升級
要想充分釋放硬件的算力,需要先了解其瓶頸究竟是什么。
華為鯤鵬計算領域副總裁江大勇告訴CSDN,在硬件方面,ARM這樣的主流處理器從百核甚至到千核的多核方向發展,但問題在于,核數的線性增長并不意味著算力的效能會隨之增長,因為算力的分配和調度復雜度的增加反而會消耗一部分算力的效能。與此同時,端邊云協同的趨勢對ARM計算架構也提出了相應需求,而X86、ARM和xPU的異構計算框架的趨勢也正在形成。
如此,多核多算力的硬件架構轉變相應地迫使基礎軟件架構做出調整。
去年以來,趁著國內開源的熱烈氣氛,華為也相繼開源了四大基礎軟件:openEuler(歐拉)操作系統、openGauss(高斯)數據庫、openLooKeng(羅庚)高性能數據虛擬化引擎,以及MindSpore全場景AI計算框架。
操作系統是所有計算機系統軟件的“根”,但目前的操作系統并不能很好地支持多樣性算力和ARM等架構。華為則希望面向未來的場景,通過openEuler創建一個創新平臺,能夠全面支持ARM,X86,RISC-V 等現在主流計算機架構。openEuler已于去年12月31日正式開源。
而在9月24日的HC大會分論壇上,江大勇發布了openEuler 20.09版本,包括極致性能、安全可信、生態引擎三大特點,背后提供支撐的項目主要是輕量級虛擬機StratoVirt 1.0和云原生容器iSula 2.0,secGear機密計算框架和IMA完整性度量架構,自動化測試平臺Compass-CI和UKUI桌面。OpenEuler21.03及后續版本,將在云、邊、端全場景協同上持續創新,支持應用一次開發,多場景部署。
目前,openEuler操作系統,代碼量超過100萬行,代碼貢獻者數量已超過1000個,下載量超1.4萬次,社區訪問量超過150萬次,已有多家伙伴基于openEuler做了商業應用。
同樣,數據庫是基礎軟件皇冠上的明珠,也是客戶業務系統的核心,所有應用軟件的運行和數據處理都要與其進行數據交互。雖然以MySQL, PGSQL為代表的開源數據庫已成為主流選擇,但真正的企業級用戶對企業關鍵數據、核心業務的承載體,有著性能、安全和運維的更高要求。江大勇認為,現在開源的數據庫沒有完全達到企業級的能力。
今年6月已經開源的openGauss數據庫則具備企業級性能,包括高性能、高可用、高安全三大特性。openGuass第一個開源版本聚焦在與鯤鵬協同性能優化上,基于2路鯤鵬服務器,性能可達到150萬tmpC,相對業界主流產品的 性能超過50%。
而在今年12月底,openGauss還會進一步迭代企業級特性,包括行列混合存儲引擎,支持混合負載,內存引擎MOT達到250W tmpC,有512個功能參數推薦的智能運維以及安全審計。明年3月底,openGauss則會關注企業安全,實現全密態數據庫和智能增強功能。江大勇稱,未來,openGauss將在每6個月發布一個新版本,每年發布一個穩定版本。
面向海量數據,盡管目前有HBase、Hadoop、Hive,MySQL等各種數倉,但缺乏統一的SQL接口,支持多數倉的軟件,這是大數據使用的一大難題。
今年3月,華為開源的openLooKeng則是一個數據虛擬化引擎,致力于為大數據用戶提供極簡的數據分析體驗,讓用戶像用“數據庫”一樣使用“大數據”。
openLooKeng具備引擎歸一、多樣分析,生態引擎以及高可靠、易用性特點,可以進行跨格式、跨倉、跨域使用,讓開發者做數據治理更加簡單。江大勇稱,百億級的數據量可以做到10秒級的分析處理。未來,openLooKeng將在極致性能、全場景高效融合分析、批流交互式方面持續突破。
此外,華為正式發布了端邊云全場景的AI計算框架MindSpore 1.0:支持模型、算子及硬件處理單元級全自動并行;對端邊云設備如手機、攝像機、服務器等全場景自適配;開發流程極簡,開發者可基于MindSpore快速實現模型導入、靈活調試。
為什么要開源基礎軟件
開源軟件的商業模式早已被驗證。華為也希望通過開源的方式快速構建上述基礎軟件能力,并繁榮軟件生態。
事實上,在Linux最新的內核5.8版本中,華為在全球范圍對內核的貢獻排名第二,修改代碼量全球排名第一。另外,華為還為ARM架構打通全棧能力,貢獻了全球超過40+的主流開源社區。
這些基礎軟件能開源也主要得益于華為過去10多年的技術積累,比如openEuler、openGauss數據庫在開源前,就已在運營商業務中廣泛使用,背后凝結了數千名工程師的技術研發投入。
由此也不難看出,現在的華為在貢獻開源和引領開源上是齊頭并進。
當然,華為也并非能完全參考英特爾等廠商的開源模式。江大勇對CSDN稱,與原來其他廠商做產品和解決方案不同,華為做計算產業更強調“生態”,這就決定了華為“有所為有所不為”。
這一點也讓華為在基礎軟件的開源策略上更加清晰,華為所做的即是為開發者和合作方提供開發工具和應用實踐等底層支持,幫助后者應用快速遷移到整個鯤鵬平臺,以此促進計算產業的發展。
在江大勇看來,現在應用的發展已經遠快于以前做應用標準的方式,所以開源可能是當下更能被認可和接受的一種趨勢,而通過這種方式也更能促進社會效率的提升。更重要的是,通過開源社區的協作模式把底層的基礎技術做好后,差異化應用也會更快落地,社會效益也會更大,這也會形成事實上的統一標準。
最具挑戰的是開源意識
對華為來說,開源上述四大基礎軟件只是開始。因為應用、處理器、新的項目需求還在不斷發展,江大勇認為,只開源這些軟件并不足夠。
“openEuler剛開放的時候大約有30多個SIG組,但現在已經有70多個,因為不斷地有開發者提出了新的業務需求或創新想法,也有開發者主動把RISC-V等能力開放到了社區。”
他預計,在分布式方面,未來可能還會增加一些新的能力,在元函數方面,可能在今年年底或明年年初也會有相應能力開放。而要壯大軟件功能和生態,更重要的是依靠開發者社區的力量。
作為一家公認的執行力強悍的企業,華為在社區建設上也卓有成效。近期的鯤鵬開發者活動首次進行18個城市同步聯動,采用線下+線上的方式進行,吸引了上萬名開發者參與。
在江大勇看來,中國的開發者軟件開發者數量并不少,但需要形成一種活躍的開源社區文化,而不只是把社區當做代碼托管的地方。
而通過華為在構建開發者社區和生態過程中的經歷,他也總結了中國開源需要提升的地方:
首先,開源社區本身的代碼托管等基礎設施服務要加強;其次,中國需要有更適合的開源協議;最后,最具挑戰的是擁有開源意識和文化,他認為,應該鼓勵高校學生和研究機構參與到開源中,加快社會性的協同創新,持續性支持和發揚開源協作精神。最終,讓中國開發者實現從貢獻開源進一步在全球范圍內引領開源。
責任編輯:tzh
-
處理器
+關注
關注
68文章
19404瀏覽量
230840 -
ARM
+關注
關注
134文章
9164瀏覽量
368690 -
Linux
+關注
關注
87文章
11342瀏覽量
210174
發布評論請先 登錄
相關推薦
評論