演講嘉賓 | 孫海龍
回顧整理 | 廖 濤
排版校對(duì) | 李萍萍
嘉賓簡(jiǎn)介
孫海龍,北京航空航天大學(xué)教授。目前擔(dān)任CCF協(xié)同計(jì)算專委副秘書(shū)長(zhǎng)、開(kāi)源發(fā)展委員會(huì)執(zhí)行委員,入選國(guó)家級(jí)青年人才計(jì)劃。主要研究群體智能、智能化軟件開(kāi)發(fā)方法、開(kāi)源軟件和分布式系統(tǒng)等。主持了國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目、國(guó)家自然科學(xué)基金專項(xiàng)重點(diǎn)項(xiàng)目及面上項(xiàng)目等。在OSDI、IJCAI、AAAI和ICSE等發(fā)表論文130余篇,獲得中國(guó)發(fā)明專利授權(quán)40余項(xiàng)、美國(guó)發(fā)明專利授權(quán)2項(xiàng)。獲國(guó)家技術(shù)發(fā)明二等獎(jiǎng)2項(xiàng)、教育部科技進(jìn)步一等獎(jiǎng)3項(xiàng)。
內(nèi)容來(lái)源
第一屆開(kāi)放原子開(kāi)源基金會(huì)OpenHarmony技術(shù)峰會(huì)——開(kāi)發(fā)者工具分論壇
視頻回顧
打開(kāi) 嗶哩嗶哩APP 搜索 OpenHarmony-TSC 視頻更清晰
正 文 內(nèi) 容
建立開(kāi)源生態(tài)是發(fā)展系統(tǒng)軟件的有效途徑,群智方法是開(kāi)源生態(tài)構(gòu)建與治理的重要手段。創(chuàng)新群智化社區(qū)構(gòu)建、持續(xù)性生態(tài)治理和全鏈?zhǔn)桨踩u(píng)估等技術(shù),研發(fā)支撐工具與系統(tǒng),助力OpenHarmony生態(tài)發(fā)展和萬(wàn)物智聯(lián)新場(chǎng)景。來(lái)自北京航空航天大學(xué)軟件學(xué)院的孫海龍教授在第一屆OpenHarmony技術(shù)峰會(huì)上圍繞群智驅(qū)動(dòng)的泛在操作系統(tǒng)分享了在開(kāi)源生態(tài)構(gòu)建與治理方面的相關(guān)研究進(jìn)展。
01?
系統(tǒng)軟件與開(kāi)源生態(tài)
如今,隨著個(gè)人設(shè)備和技術(shù)的普及,國(guó)內(nèi)外越來(lái)越多的優(yōu)質(zhì)開(kāi)源軟件和項(xiàng)目選擇“開(kāi)源”。開(kāi)源的操作系統(tǒng)有:Linux、OpenHarmony、Android、openEuler等;開(kāi)源的編譯器有:GCC、javac、PyPy、rustc、LLVM、OpenArkCompiler等;開(kāi)源的大數(shù)據(jù)和數(shù)據(jù)庫(kù)管理系統(tǒng)有:Hadoop、Spark、MySQL、openGauss、TiDB等,開(kāi)源的云計(jì)算有:OpenStack、Docker;開(kāi)源的人工智能模型有:TensorFlow、PyTorch、MindSpore、PaddlePaddle等。
開(kāi)源軟件和開(kāi)源軟件開(kāi)發(fā)的概念是不一樣的。什么是開(kāi)源軟件呢?一般來(lái)說(shuō),滿足國(guó)際OSI公認(rèn)的10條準(zhǔn)則的軟件就可以稱之為開(kāi)源軟件。那什么是開(kāi)源軟件開(kāi)發(fā)呢?開(kāi)源軟件開(kāi)發(fā)指的是基于開(kāi)源模式的軟件開(kāi)發(fā)方法(“集市”模式),如Linux的開(kāi)發(fā)就采用了典型的開(kāi)源軟件開(kāi)發(fā)方法。此外,有些開(kāi)源軟件(如Unix、早期的Minix等)的開(kāi)發(fā)并未采用典型的開(kāi)源軟件開(kāi)發(fā)方法,而是采用了“大教堂”模式。
建立開(kāi)源生態(tài)是系統(tǒng)軟件研發(fā)的有效途徑。系統(tǒng)軟件研發(fā)是一個(gè)復(fù)雜工作,通常需要涉及多人協(xié)作,如果不開(kāi)源,在開(kāi)發(fā)效率和代碼質(zhì)量上存在一定局限性。舉個(gè)“Delphi效應(yīng)”的例子:當(dāng)需要多人討論一個(gè)復(fù)雜問(wèn)題時(shí),通常是少數(shù)資深專家在熱烈交流,而多數(shù)非資深專家不敢發(fā)表意見(jiàn),導(dǎo)致集體產(chǎn)生的結(jié)論只能代表少數(shù)人的觀點(diǎn),缺乏合理性。因此,“Delphi方法”建議討論者背對(duì)背討論,匿名發(fā)表觀點(diǎn),再進(jìn)行匯聚和迭代,形成Delphi效應(yīng),輸出更加合理的結(jié)論。面向系統(tǒng)軟件研發(fā)建立開(kāi)源生態(tài)是一個(gè)重要模式,通過(guò)開(kāi)源的途徑,有利于匯聚集體智慧,進(jìn)而提高開(kāi)發(fā)效率和代碼質(zhì)量。Linux項(xiàng)目的健康茁壯“成長(zhǎng)”也得益于開(kāi)源的“東風(fēng)”。
02?
泛在操作系統(tǒng)開(kāi)源生態(tài)
隨著信息技術(shù)進(jìn)入人機(jī)物融合的泛在計(jì)算時(shí)代,出現(xiàn)了許多新的計(jì)算模式和應(yīng)用場(chǎng)景,在這些新場(chǎng)景下,人機(jī)物融合泛在計(jì)算要求向下管理海量異構(gòu)資源、向上支撐各類大規(guī)模應(yīng)用,發(fā)展泛在操作系統(tǒng)是必然趨勢(shì),也是破解“昆蟲(chóng)綱悖論”難題的一種途徑。
建立泛在操作系統(tǒng)的開(kāi)源生態(tài)面臨哪些挑戰(zhàn)?
群智貢獻(xiàn)不確定:大規(guī)模開(kāi)放群體與開(kāi)源資源難以進(jìn)行有效協(xié)作組織,如何實(shí)現(xiàn)高效群智激發(fā)匯聚?
生態(tài)演化不確定:建立跨域關(guān)聯(lián)形成全局視圖并進(jìn)行動(dòng)態(tài)調(diào)控缺乏有效技術(shù)手段,如何實(shí)現(xiàn)高效生態(tài)構(gòu)建與可持續(xù)健康治理?
生態(tài)安全不確定:泛在操作系統(tǒng)復(fù)雜供應(yīng)鏈對(duì)潛在安全威脅的傳染放大效應(yīng),如何建立生態(tài)級(jí)的安全保障體系?
如何應(yīng)對(duì)泛在操作系統(tǒng)開(kāi)源生態(tài)不確定性?傳統(tǒng)的工程范式能夠應(yīng)對(duì)生產(chǎn)規(guī)模化危機(jī),強(qiáng)調(diào)生產(chǎn)控制、聚焦軟件產(chǎn)品、有組織且承諾確定性,缺乏多樣性。當(dāng)前的開(kāi)源范式能夠應(yīng)對(duì)演化多樣性危機(jī),鼓勵(lì)創(chuàng)作自由、關(guān)注軟件作品、無(wú)組織且不承諾確定性。國(guó)防科大的王懷民院士提出軟件開(kāi)發(fā)的“群智范式”,通過(guò)融合工程范式與開(kāi)源范式的優(yōu)勢(shì),形成“宏觀演化,微觀求精”的核心理念,為應(yīng)對(duì)泛在操作系統(tǒng)開(kāi)源生態(tài)的不確定性提供了新途徑。
基于群智范式的思路,從以下3個(gè)方面構(gòu)建良好的泛在操作系統(tǒng)開(kāi)源生態(tài):
生態(tài)構(gòu)建:面向泛在操作系統(tǒng)開(kāi)源生態(tài)構(gòu)建的群智激發(fā)與匯聚,優(yōu)化開(kāi)源貢獻(xiàn)的“長(zhǎng)出率”;
持續(xù)治理:泛在操作系統(tǒng)開(kāi)源生態(tài)的可持續(xù)演化機(jī)理與調(diào)控,開(kāi)源項(xiàng)目的“長(zhǎng)成率”;
安全保障:泛在操作系統(tǒng)開(kāi)源生態(tài)的全鏈?zhǔn)桨踩治雠c保障,開(kāi)源制品的“長(zhǎng)優(yōu)率”。
如何實(shí)現(xiàn)AI驅(qū)動(dòng)/群智驅(qū)動(dòng)呢?孫海龍教授所帶領(lǐng)的國(guó)家自然科學(xué)基金項(xiàng)目團(tuán)隊(duì)有以下研究進(jìn)展:
一、群智范式:基于群智熵的激發(fā)匯聚度量。從群智范式的視角認(rèn)識(shí)和梳理開(kāi)源項(xiàng)目的生命周期,嘗試建立開(kāi)源項(xiàng)目及其生態(tài)的度量指標(biāo),并建立與群智激發(fā)匯聚的關(guān)聯(lián)。進(jìn)而,圍繞開(kāi)源群體協(xié)作和系統(tǒng)迭代演化,構(gòu)建基于群智熵的開(kāi)源度量評(píng)估體系,探索群智開(kāi)源背后的本質(zhì)。以RubyOnRails為案例,分析了該項(xiàng)目在12年長(zhǎng)周期發(fā)展變化中群智激發(fā)熵的變化情況,如下圖所示:
二、群智化構(gòu)建:開(kāi)源新手的助長(zhǎng)策略。目前,盡管開(kāi)源社區(qū)提出了眾多機(jī)制降低新手加入門(mén)檻,但是目前還不清楚新手是否還需要專家的指導(dǎo),如何指導(dǎo),以及指導(dǎo)對(duì)新手有多大意義。因此,可以通過(guò)分析good first issue解決過(guò)程中專家的參與情況,了解專家參與程度、指導(dǎo)關(guān)系結(jié)構(gòu)、討論主題、指導(dǎo)重要性,提高指導(dǎo)效率。
三、持續(xù)性治理:開(kāi)源中的公司行為研究。通過(guò)對(duì)OpenStack(一個(gè)有超過(guò)十年開(kāi)發(fā)歷史、成百個(gè)公司參與、有上千個(gè)項(xiàng)目的開(kāi)源云計(jì)算操作系統(tǒng))開(kāi)展研究發(fā)現(xiàn),結(jié)果發(fā)現(xiàn)由公司主導(dǎo)開(kāi)源項(xiàng)目的開(kāi)發(fā)這一現(xiàn)象不管是從整體開(kāi)發(fā)角度還是單個(gè)版本,都非常普遍。并且,超過(guò)70%的項(xiàng)目被不到20%的公司主導(dǎo),超過(guò)一半的主導(dǎo)公司會(huì)同時(shí)主導(dǎo)多個(gè)項(xiàng)目的開(kāi)發(fā)。通過(guò)隨機(jī)篩選60個(gè)被主導(dǎo)的項(xiàng)目,定性分析主導(dǎo)公司的背景、OpenStack、特定項(xiàng)目的目標(biāo)和項(xiàng)目類型功能等,進(jìn)而通過(guò)擬合生存分析模型,發(fā)現(xiàn)公司主導(dǎo)與項(xiàng)目的生存概率存在顯著負(fù)相關(guān)關(guān)系。被單一公司主導(dǎo)的項(xiàng)目更可能走向死亡 (死亡風(fēng)險(xiǎn)會(huì)增加126%)。此外,公司是利益驅(qū)動(dòng)的,相比受自身興趣愛(ài)好驅(qū)動(dòng)的志愿者,公司的參與帶有更強(qiáng)的不確定性。經(jīng)過(guò)統(tǒng)計(jì)發(fā)現(xiàn),超過(guò)一半的公司在對(duì)openstack做貢獻(xiàn)之后選擇撤出。進(jìn)一步發(fā)現(xiàn),隨著版本演化,離開(kāi)的公司數(shù)逐漸增加,超過(guò)了新加入的公司數(shù):某個(gè)版本加入的公司,后續(xù)會(huì)有一半撤出;當(dāng)前版本還在做貢獻(xiàn)的公司,有12%會(huì)在下一個(gè)版本撤出。基于問(wèn)卷調(diào)查結(jié)果顯示,公司撤出原因多樣,撤出行為的預(yù)測(cè)受多種因素影響,其中“目標(biāo)已實(shí)現(xiàn)”以及“目標(biāo)已失敗”是公司撤離開(kāi)源項(xiàng)目的最主要原因。
四、全鏈?zhǔn)桨踩U希汗?yīng)鏈構(gòu)建方法/缺陷定位與修復(fù)方法/工具原型系統(tǒng)。由于項(xiàng)目數(shù)量多、依賴關(guān)系復(fù)雜,目前缺乏一種有效的供應(yīng)鏈建模方法。因此復(fù)雜軟件系統(tǒng)的供應(yīng)鏈仍然是“黑箱”(以深度學(xué)習(xí)開(kāi)源框架為例)。通過(guò)構(gòu)建和分析供應(yīng)鏈,能夠了解其結(jié)構(gòu)、應(yīng)用領(lǐng)域和演化因素,為探索泛在OS等復(fù)雜軟件生態(tài)的未來(lái)發(fā)展提供支撐。通過(guò)對(duì)供應(yīng)鏈的結(jié)構(gòu)、演化因素以及領(lǐng)域分布等進(jìn)行分析,形成逐層的全網(wǎng)深度學(xué)習(xí)供應(yīng)鏈構(gòu)建方法。此外,傳統(tǒng)軟件缺陷的檢測(cè)與修復(fù)技術(shù)存在著難診斷、耗時(shí)長(zhǎng)、需求大、發(fā)展快的挑戰(zhàn)。基于遷移學(xué)習(xí)將挖掘到的深度語(yǔ)義知識(shí)遷移到目標(biāo)項(xiàng)目的定位與修復(fù)任務(wù)中,進(jìn)而對(duì)缺陷修復(fù)模板進(jìn)行調(diào)優(yōu),能夠提升定位和修復(fù)任務(wù)的性能。另一方面,通過(guò)構(gòu)建供應(yīng)鏈依賴分析系統(tǒng)、社區(qū)風(fēng)險(xiǎn)分析工具以及開(kāi)源生態(tài)健康度量化評(píng)估工具等,并結(jié)合開(kāi)源軟件應(yīng)用市場(chǎng)反饋,構(gòu)建工具原型系統(tǒng),保障全鏈?zhǔn)桨踩U稀?/p>
目前,孫海龍教授所在團(tuán)隊(duì)已經(jīng)在基于群智范式的泛在OS開(kāi)源生態(tài)理論、關(guān)鍵技術(shù)及系統(tǒng)的研究上取得進(jìn)展,發(fā)表A類論文6篇,獲得ICSE' 22 Distinguished Paper Award 1項(xiàng),研發(fā)了開(kāi)源軟件供應(yīng)鏈全息知識(shí)圖譜構(gòu)建技術(shù),面向OpenHarmony, openEuler和Ubuntu等操作系統(tǒng)實(shí)例進(jìn)行了技術(shù)驗(yàn)證,并進(jìn)一步提升了GitLink對(duì)開(kāi)源生態(tài)的服務(wù)能力。
希望群智范式、GitLink等開(kāi)源理論、方法與系統(tǒng)助力OpenHarmony等操作系統(tǒng)的開(kāi)源生態(tài)構(gòu)建與治理,為我國(guó)開(kāi)源創(chuàng)新戰(zhàn)略的實(shí)施做出貢獻(xiàn)。
E N D
點(diǎn)擊下方閱讀原文獲取演講PPT。
關(guān)注我們,獲取更多精彩。
審核編輯 黃宇
-
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
6889瀏覽量
123605 -
開(kāi)源
+關(guān)注
關(guān)注
3文章
3398瀏覽量
42649 -
OpenHarmony
+關(guān)注
關(guān)注
25文章
3744瀏覽量
16494
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論