過去10年,人工智能技術的革新深刻改變了社會生產(chǎn)和生活方式。時至今日,人工智能技術和算法依然面臨落地應用方面的種種困難。展望未來,讓企業(yè)用上并用好人工智能,讓企業(yè)的人工智能應用可持續(xù),是人工智能技術和算法在產(chǎn)業(yè)領域落地應用至關重要的環(huán)節(jié)。
中國工程院劉合院士研究團隊在中國工程院院刊《中國工程科學》2022年第6期發(fā)表《我國企業(yè)人工智能應用現(xiàn)狀與挑戰(zhàn)》一文。文章著眼我國AI產(chǎn)業(yè)的健康可持續(xù)發(fā)展,從企業(yè)AI應用落地的實際案例出發(fā),梳理業(yè)界現(xiàn)狀、剖析發(fā)展挑戰(zhàn)、探討根本原因、提出應對策略。企業(yè)AI落地應用的復雜性表現(xiàn)在業(yè)務需求、數(shù)據(jù)、算法、基礎設施、配套方案等多個維度,應用成熟度取決于數(shù)據(jù)的準備程度及治理水平。在國家宏觀層面,有必要構(gòu)建更友好的AI產(chǎn)業(yè)生態(tài)環(huán)境,促進AI全產(chǎn)業(yè)鏈協(xié)同發(fā)展;以更有力的具體舉措支持AI產(chǎn)業(yè)的技術研發(fā),特別是全棧AI、AI基礎平臺及工具體系、AI根技術等,提高我國AI核心技術的自主可控能力;鼓勵企業(yè)積極實施數(shù)字化轉(zhuǎn)型,采用AI技術進行智能化升級,形成AI產(chǎn)業(yè)技術研發(fā)、企業(yè)AI落地創(chuàng)新的強耦合及雙向循環(huán)。
一、前言
當今世界正在經(jīng)歷數(shù)字化技術驅(qū)動產(chǎn)業(yè)變革的發(fā)展過程,人工智能(AI)、大數(shù)據(jù)、物聯(lián)網(wǎng)、云計算、第五代移動通信等也在重塑創(chuàng)新版圖和產(chǎn)業(yè)鏈分工。國家高度重視這一發(fā)展趨勢,發(fā)布了《新一代人工智能發(fā)展規(guī)劃》(2017年),旨在促進AI技術和產(chǎn)業(yè)高速發(fā)展,加速滲透到更多應用領域,進一步擴大關聯(lián)產(chǎn)業(yè)規(guī)模;支持AI和實體經(jīng)濟深度融合,建設數(shù)字中國、智慧社會,推進數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化,形成具有國際競爭力的數(shù)字產(chǎn)業(yè)集群。蓬勃發(fā)展的AI產(chǎn)業(yè),為AI領域“產(chǎn)學研”合作創(chuàng)造了機遇,也在技術創(chuàng)新和落地應用方面提出了新的要求。
AI是借由人工制造的計算機來表現(xiàn)人類智慧的技術,經(jīng)歷了數(shù)十年的發(fā)展和沉浮。2000年以來,以深度學習為代表的統(tǒng)計學習方法顯著增強了AI算法的通用性,提升了各項基礎任務的應用性能,創(chuàng)造了將AI算法應用于大量實際問題的機會;過去10年里,AI技術的革新深刻改變了社會生產(chǎn)和生活方式,逐漸催生了AI產(chǎn)業(yè)。然而時至今日,AI技術和算法依然面臨落地應用方面的種種困難,也就引發(fā)了我們的思考:要想真正讓企業(yè)用上AI、用好AI,讓企業(yè)的AI應用可持續(xù),學術界、產(chǎn)業(yè)界需要聚焦解決哪些事情,應當如何協(xié)同以有效實現(xiàn)算法落地?
本文著眼于我國企業(yè)AI應用的落地及可持續(xù)發(fā)展,就面臨的挑戰(zhàn)、潛在的解決方案提出構(gòu)思。從AI應用于生產(chǎn)的實際案例出發(fā),梳理業(yè)界發(fā)展現(xiàn)狀及存在的問題,剖析AI產(chǎn)業(yè)發(fā)展面臨的迫切挑戰(zhàn),據(jù)此探討成因及應對策略,以期為我國AI產(chǎn)業(yè)健康發(fā)展提供基礎參考。
二、人工智能發(fā)展的總體現(xiàn)狀和趨勢
(一)人工智能技術發(fā)展態(tài)勢
自1956年概念提出至今,AI的發(fā)展經(jīng)歷了3次浪潮。
① 第一次浪潮(1956—1974年)是AI的誕生時期,重在讓機器具備邏輯推理能力,開發(fā)的計算機可解決代數(shù)應用題、證明幾何定理、學習并使用英文程序;研發(fā)了首款感知神經(jīng)網(wǎng)絡軟件和聊天軟件(即時通訊軟件)。
② 第二次浪潮(1980—1987年),AI變得更為實用,可解決某些領域特定問題的AI程序(“專家系統(tǒng)”)開始獲得企業(yè)應用;知識庫系統(tǒng)、知識工程成為當時研究的主要方向。
③ 第三次浪潮(1993年至今),計算性能的基礎性障礙被逐步克服,“智能代理”范式獲得廣泛接受;深度學習的理論突破使得AI技術發(fā)展超越了研究人類智能的范疇?;ヂ?lián)網(wǎng)、云計算、大數(shù)據(jù)、芯片、物聯(lián)網(wǎng)等新興技術為AI技術的發(fā)展提供了充足的數(shù)據(jù)支持與算力支撐,以“AI+”為代表的業(yè)務創(chuàng)新模式逐步成熟。從全球?qū)W術數(shù)據(jù)庫中遴選出的2011—2020年AI領域十大熱門研究主題有:深度神經(jīng)網(wǎng)絡、特征抽取、圖像分類、目標檢測、語義分割、表示學習、生成對抗網(wǎng)絡、語義網(wǎng)絡、協(xié)同過濾、機器翻譯。
AI產(chǎn)業(yè)可按基礎層、技術層、應用層進行劃分。基礎層主要指計算平臺和數(shù)據(jù)中心,如云計算平臺、高性能計算芯片、數(shù)據(jù)資源等,為AI應用提供數(shù)據(jù)支持與算力支撐。技術層指AI算法和技術,是AI產(chǎn)業(yè)的核心構(gòu)成。應用層指面向特定產(chǎn)業(yè)和場景專門研發(fā)的產(chǎn)品及服務,是AI產(chǎn)業(yè)的自然延伸。制約AI產(chǎn)業(yè)發(fā)展的因素有很多,如數(shù)據(jù)質(zhì)量、泛化能力、可解釋性等。本研究認為,企業(yè)AI落地應用是復雜的系統(tǒng)工程,主要制約因素是可解釋性。對于傳統(tǒng)的機器學習,特征提取由專家或富有經(jīng)驗的人員手動完成,嵌入了大量的專業(yè)知識;雖然提取的特征可能不夠全面,但因其良好的可解釋性而備受學術界的推崇。深度學習的特征提取則通過神經(jīng)網(wǎng)絡自動完成,因無需專家參與而減少了人為干預,對特征的提取通常也更為全面。然而,以深度學習為主的神經(jīng)網(wǎng)絡模型無法給出合理的特征解釋;如果AI不能理解知識或行為之間的深層邏輯,在采用已有模型去應對未知變量時就很容易引起模型崩塌。因此,企業(yè)AI落地應用的關鍵在于將長期積累形成的專家知識融入AI模型,據(jù)此構(gòu)建知識與數(shù)據(jù)融合的神經(jīng)網(wǎng)絡模型,從而提高模型的可解釋性和泛化能力。
(二)人工智能的國內(nèi)外進展
AI發(fā)展的經(jīng)濟社會意義正在成為世界多數(shù)國家的共識,一系列AI發(fā)展戰(zhàn)略和計劃相繼提出并得到快速更新。各國積極設立AI研究機構(gòu),引導研發(fā)投入并注重人才培養(yǎng),建設算力和數(shù)據(jù)基礎設施,提高平臺和資源應用水平,制定行業(yè)應用政策法規(guī),以期為AI應用發(fā)展創(chuàng)造良好的環(huán)境。例如,美國國家科學技術委員會發(fā)布的《國家人工智能研究和發(fā)展戰(zhàn)略計劃:2019年更新版》,突出了AI研發(fā)投資的優(yōu)先事項,聚焦領域前沿的快速發(fā)展。歐盟委員會通過了《人工智能法》提案(2021年),旨在構(gòu)建值得全球信賴的AI中心,加強歐盟范圍內(nèi)AI的使用、投資和創(chuàng)新活動。
在我國,AI技術持續(xù)創(chuàng)新和突破,AI資源持續(xù)優(yōu)化整合,AI產(chǎn)業(yè)結(jié)構(gòu)逐漸完善。
① 近年來,我國的AI相關專利申請數(shù)量居世界首位,增速明顯高于其他國家;我國學者在國際一流會議和期刊上發(fā)表的論文數(shù)量穩(wěn)步增長,成為AI社區(qū)的重要貢獻力量。
② 建立AI計算中心和創(chuàng)新中心,面向產(chǎn)業(yè)需求提供基礎數(shù)據(jù)資源、計算資源、關鍵算法服務,顯著降低了中小型企業(yè)的研發(fā)成本和行業(yè)準入門檻,帶動了AI“產(chǎn)學研”協(xié)同創(chuàng)新;國產(chǎn)AI開源學習框架和開源軟件不斷豐富,昇思、飛槳等開源框架加速了行業(yè)技術創(chuàng)新。
③ AI為企業(yè)數(shù)字化轉(zhuǎn)型升級提供了源動力,智能產(chǎn)業(yè)加速創(chuàng)新發(fā)展,智能機器人、智慧城市、智能交通、智能制造等方向發(fā)展迅猛,以行業(yè)深化應用為眾多企業(yè)帶來了實際價值;總結(jié)數(shù)百個企業(yè)項目的實踐后發(fā)現(xiàn),AI算法進入核心生產(chǎn)系統(tǒng)的比例接近30%,將AI引入核心生產(chǎn)系統(tǒng)后帶來的效率提升平均超過18%。
三、我國企業(yè)人工智能應用的典型案例
在我國,隨著相關技術的不斷演進,AI算法逐步從實驗驗證走向企業(yè)落地。例如,以華為云計算技術有限公司為代表的AI企業(yè),已將AI落地應用于能源(如智能勘探、生產(chǎn)巡檢、智慧加油站)、城市治理(如智能辦公 / 辦事、政務智能熱線)、交通運輸(如智慧高速、智能網(wǎng)聯(lián)、城市交通治理)、工業(yè)制造(如工藝優(yōu)化、優(yōu)化控制、工業(yè)視覺)、醫(yī)藥醫(yī)療(如醫(yī)學影像、臨床輔助、藥物研發(fā))、銀行與金融(如智能風控、智能營銷、智能雙錄)等垂直領域。無論是交通運輸、工業(yè)制造等面向企業(yè)的服務,還是智慧醫(yī)療、互聯(lián)網(wǎng)等面向個人的應用,AI算法都正在或者已經(jīng)進入核心生產(chǎn)流程,在創(chuàng)造價值的同時也伴生新的問題,反哺和驅(qū)動了AI算法研發(fā)。
(一)智能油氣勘探
智能油氣勘探是AI算法在能源產(chǎn)業(yè)落地應用的重要場景之一,可以認為AI算法深刻地改變了這一行業(yè)。在智能化,碳達峰、碳中和目標的時代背景下,石油勘探開發(fā)領域的智能化轉(zhuǎn)型是能源行業(yè)極為核心而又無法規(guī)避的發(fā)展模式。這是因為,隨著石油資源品質(zhì)的不斷劣質(zhì)化,油氣資源開采的難度持續(xù)加大,開采成本逐年攀高;拋棄“儲量為重”的舊觀點,樹立“數(shù)據(jù)為重”的新理念,加大數(shù)據(jù)挖掘力度并提升數(shù)據(jù)價值,是油氣勘探開發(fā)面臨的新挑戰(zhàn);數(shù)據(jù)、算力、算法、場景“四位一體”,共同驅(qū)動AI技術在石油勘探開發(fā)領域的“以點帶面”式應用。
近年來,AI技術已逐步應用于石油勘探開發(fā)中的沉積儲層研究、測井解釋、物探處理、鉆完井、油藏工程等多個方向,取得了一定的進展。
① 在沉積儲層研究方面,一些學者借助巖心圖像的智能分析手段實現(xiàn)了沉積儲層的精準量化,工業(yè)應用效果良好且應用潛力突出。
② 在測井方面,部分石油企業(yè)、科研機構(gòu)利用機器學習、深度學習,在曲線重構(gòu)、巖性識別、儲層參數(shù)預測、油氣水層識別、智能分層、成像測井等方面完成了基礎研究及初步應用。
③ 在物探方面,利用目標檢測、圖像分割、圖像分類等計算機視覺技術,實現(xiàn)了構(gòu)造解釋、地震相識別、地震波場正演、地震反演、初至拾取、地震數(shù)據(jù)重建與插值、地震屬性分析等地震數(shù)據(jù)處理解釋。
④ 在鉆井AI應用方面,主要體現(xiàn)在井眼軌道智能優(yōu)化、智能導向鉆井、鉆速智能優(yōu)化等。
⑤ 在油藏工程方面,利用精細分層注水“硬數(shù)據(jù)”,實現(xiàn)了數(shù)據(jù)驅(qū)動下的油氣水井智能注水優(yōu)化,有效提高了采收率。此外,基于循環(huán)神經(jīng)網(wǎng)絡的產(chǎn)量預測、生產(chǎn)措施智能優(yōu)化等應用點上也取得了初步效果。
具體來看,巖石薄片智能鑒定是計算機視覺技術在巖心分析上的代表性案例。傳統(tǒng)薄片鑒定依賴于巖礦鑒定專家在顯微鏡下的目估觀察,存在鑒定效率低、人員數(shù)量不足、鑒定結(jié)果不易精準量化等不足。巖石薄片智能鑒定通過收集并標注海量的薄片圖像,建立深度學習所需的標簽樣本庫;利用計算機視覺技術構(gòu)建巖石顆粒分割、礦物成分鑒定、孔隙結(jié)構(gòu)分析、巖石結(jié)構(gòu)分析等智能模型,使鑒定結(jié)果更加直觀、量化、精準(見圖1)。智能分層注水是AI在油氣田開發(fā)應用方面的另一個典型案例,作為第四代智能分層注水技術,利用注水開發(fā)中的“硬數(shù)據(jù)”,結(jié)合計算幾何、形態(tài)學等技術來優(yōu)化生產(chǎn)參數(shù),實現(xiàn)數(shù)據(jù)驅(qū)動的油氣水井智能注水優(yōu)化;形成的水驅(qū)油藏流場識別技術,實現(xiàn)了注水效果的評價、分析、實時監(jiān)測與智能控制,為注水優(yōu)化、井網(wǎng)層系調(diào)整、深部調(diào)剖等提供了可靠的方案決策依據(jù),顯著提高了采收率。
圖1 巖石薄片智能鑒定的部分結(jié)果
中國石油天然氣集團有限公司在“十三五”時期建設了認知計算平臺,相應的功能架構(gòu)如圖2所示。平臺實現(xiàn)了多個重點場景應用,如地震初至波自動拾取、地震層位自動解釋、測井油氣層識別、抽油機井工況診斷、單井產(chǎn)量及含水規(guī)律預測等;在中國石油天然氣股份有限公司西南油氣田分公司、長慶油田分公司等企業(yè)進行了試點應用,取得良好效果,如地震層位智能解釋將人工解釋所需約1個月的工作量降至一周內(nèi),測井油氣層智能識別將解釋符合率提高了10個百分點且單井解釋耗時從1天壓縮至10 min。
圖2 中國石油認知計算平臺功能架構(gòu)
注:GPU表示圖形處理器;FPGA表示現(xiàn)場可編程邏輯門陣列;CPU表示中央處理器。
也要注意到,雖然AI技術在石油勘探開發(fā)領域的應用穩(wěn)健展開并不斷取得新進展,但較之于看圖識花、動作識別、智能修圖等通用技術領域,相應進展仍是較為緩慢的,技術研究與落地應用之間仍存在不小的距離,尚處于“知易行難”的發(fā)展階段。石油勘探開發(fā)領域的場景復雜,需要綜合利用測井、地震、遙感等手段進行多維度分析,具有系統(tǒng)工程特征,無法僅靠數(shù)據(jù)驅(qū)動的模型來解決問題,而通用技術領域的業(yè)務場景相對簡單且所見即所得,需要識別的對象也是常見物品。同時,石油勘探開發(fā)領域面臨嚴峻的數(shù)據(jù)質(zhì)量問題,建模所用的數(shù)據(jù)多是處理解釋過的,存在小樣本、數(shù)據(jù)失真等情況;相比之下,通用技術領域的數(shù)據(jù)多為實時采集的大數(shù)據(jù),各類公開數(shù)據(jù)集也為行業(yè)建模提供了豐富的數(shù)據(jù)來源。在研發(fā)生態(tài)方面,石油勘探開發(fā)等特定領域也相對薄弱;近年來開源的多種AI模型及代碼為AI建模提供了豐富的預訓練模型,但多是針對通用技術領域所構(gòu)建,較難直接遷移到石油領域應用。
(二)智慧城市治理
城市是人類文明的重要標志、工商業(yè)發(fā)展的產(chǎn)物,也代表著人類對更高質(zhì)量生活的追求。數(shù)字時代為城市所有物體、服務、空間的數(shù)字化提供了基礎。然而,不斷增加的主體與要素、快節(jié)奏的生產(chǎn)生活方式,對城市治理提出了更高要求。以AI算法為核心的“智慧城市”系統(tǒng),在大規(guī)模算力、大數(shù)據(jù)技術的支持下,能夠有效鏈接建筑、學校、醫(yī)院、公共交通等城市要素,實現(xiàn)城市中各類場景的智能化決策。智慧城市的基本策略是將數(shù)據(jù)變成城市治理的資源,進而應用此資源賦能基層治理。
智能政務專線、城市交通治理是智慧城市的典型應用案例。
① 傳統(tǒng)12345熱線的服務范圍不斷延伸,導致客服人員壓力增加、服務效率降低。智能熱線方案提取政務法規(guī)、文件、內(nèi)外部通知、工單等數(shù)據(jù),建立包括事件、時間、地點、責任主體、解決措施在內(nèi)的知識圖譜。利用知識圖譜相關算法,智能識別居民來電意圖,輔助人工坐席崗與居民進行高效交流,通過分析歷史訴求及處置情況來智能派單,形成“接得更準、分得更快、辦得更實”的熱線服務模式。在試點城市,整體派單效率提升超過50%,工單處置周期縮短20%以上,大幅改善了工單辦結(jié)的滿意度。
② 早晚高峰是城市交通面臨的巨大挑戰(zhàn)。為了緩解路網(wǎng)壓力增大造成的調(diào)度困難,智能調(diào)控信控方案利用電子警察解析的結(jié)構(gòu)化數(shù)據(jù),分析各路口車流規(guī)律并結(jié)合交警人工經(jīng)驗進行配時建模;在構(gòu)建路口流量、綠燈空放等目標函數(shù)的基礎上,將交通知識的數(shù)學描述以約束條件的形式整合到最優(yōu)信控配時的建模過程。在試點城市,實現(xiàn)了主干道平均車速提升18%,道路排隊溢出次數(shù)下降20%,早高峰提前10~15 min消散,顯著緩解了早晚高峰的交通擁堵現(xiàn)象。
智慧城市治理是AI算法面臨的極大挑戰(zhàn)。城市治理場景復雜且變化迅速,對AI算法的高級指標(如通用性、可遷移性等)提出了更高要求。城市治理需要結(jié)合圖像、語言、語音等多種模態(tài)的數(shù)據(jù),也契合了未來AI算法朝著多模態(tài)方向發(fā)展的趨勢。然而,當前的AI算法在靈活度、魯棒性等方面距離實際應用還存在不小的差距,往往需要進行針對性研發(fā)以適應不同的場景,導致開發(fā)及應用成本居高不下,也就難以規(guī)模化、規(guī)范化地“復制”到其他城市中去。
四、基于案例實踐促成企業(yè)人工智能應用的若干關鍵要素分析
(一)人工智能的科學研究和需求驅(qū)動同樣重要
AI作為通用目的技術,現(xiàn)階段在企業(yè)應用落地時產(chǎn)生了新穎而積極的成效,但也面臨著諸多問題和挑戰(zhàn)。目前,AI算法缺乏規(guī)范性,開發(fā)效率較低,這是因為不同行業(yè)和企業(yè)的數(shù)據(jù)模態(tài)、數(shù)據(jù)體量及質(zhì)量、硬件環(huán)境等均有較大差別。在傳統(tǒng)的開發(fā)模式下,AI算法在場景之間的遷移能力差,開發(fā)者往往需要針對不同場景分別設計神經(jīng)網(wǎng)絡結(jié)構(gòu)、執(zhí)行特定的優(yōu)化與部署流程;缺乏統(tǒng)一規(guī)范的開發(fā)模式,開發(fā)出的算法也無法滿足泛化性、魯棒性、安全性、可解釋性等要求。解決這些問題,需要從科學研究、企業(yè)應用落地兩方面同步著手。
1. 依據(jù)企業(yè)技術需求進行AI算法的迭代演進
從訓練數(shù)據(jù)的角度看,大數(shù)據(jù)時代的絕大部分數(shù)據(jù)都沒有標注信息。例如,從互聯(lián)網(wǎng)公開領域獲取的數(shù)據(jù)中,具有語義標簽的數(shù)據(jù)占比低于1%;為了充分利用這些數(shù)據(jù)以提升大模型的質(zhì)量,需要構(gòu)建高效的自監(jiān)督學習算法。雖然學術界提出了針對圖像、文本等特定模態(tài)的自監(jiān)督學習算法,但訓練效率有限、訓練所得模型的能力難以評估。不同模態(tài)數(shù)據(jù)之間存在差異性,也使得從圖像、文本等數(shù)據(jù)中學習的語義知識難以在同一語義空間中對齊。需要設計跨模態(tài)的模型訓練和評測方案,擺脫對模型體量的盲目追求,讓大模型不再依賴下游任務而是根據(jù)自身對數(shù)據(jù)的理解能力進行評測,這樣才能解決AI落地過程中的模型生產(chǎn)問題。
從模型的角度看,深度學習的重要障礙在于模型的泛化能力和可解釋性。當模型遇到不在訓練數(shù)據(jù)分布范圍之內(nèi)的測試樣本時,模型的效果會顯著下降,加之神經(jīng)網(wǎng)絡模型通常無法解釋自身推理過程,使得專業(yè)人員對模型預測結(jié)果持懷疑態(tài)度,也就限制了模型在實際生產(chǎn)場景下的應用。遷移學習、對抗攻防、激活單元可視化等技術研究盡管取得了一定進展,但距離魯棒、可泛化、可解釋的AI算法尚有距離。
鼓勵學科交叉研究,推動AI與其他學科融合,以雙向互促實現(xiàn)協(xié)同發(fā)展。將AI算法應用于其他學科的前沿研究(如醫(yī)學影像、生物制藥、科學計算等)潛力巨大,但對AI算法提出了更高要求。例如,科學計算區(qū)別于與傳統(tǒng)的AI應用場景,AI算法設計面臨輸入數(shù)據(jù)是否完備、數(shù)據(jù)量是否充足、計算架構(gòu)是否合理等實質(zhì)性挑戰(zhàn),解空間的復雜度極高。因此,AI算法需要具備處理不確定性數(shù)據(jù)的能力并與知識計算、自動機器學習等算法相結(jié)合,才能輔助各學科的科學家探索未知領域。
2. 在技術體系與架構(gòu)設計中有機結(jié)合場景、算法和平臺
基于深度學習的AI算法需要大量的計算資源,訓練成本較高。企業(yè)在技術體系與架構(gòu)設計中,應追求與AI行業(yè)有機結(jié)合,在云端部署大模型,合理規(guī)避基于通用數(shù)據(jù)訓練模型的過程;配合高效工具鏈,以較低的成本在私有數(shù)據(jù)上驗證大模型,便于將模型部署到端側(cè)和邊側(cè)設備,從而降低使用成本。這一發(fā)展方式才能讓更多的企業(yè)受惠于AI算法。
AI作為新興的交叉學科,關鍵基礎源自計算機科學的細分領域。將AI算法落地到企業(yè)應用,需要不同類型的人員緊密配合:具備AI專業(yè)級技能的算法開發(fā)者和架構(gòu)師,理解AI基礎邏輯的產(chǎn)品經(jīng)理,接受AI應用理念的企業(yè)技術人員。應鼓勵AI培訓深入企業(yè),通過實際案例提高企業(yè)技術和管理人員對AI的深刻認知,從而創(chuàng)造良好的協(xié)同環(huán)境。
(二)以系統(tǒng)性思維推進企業(yè)人工智能應用落地
當前,企業(yè)界對于AI的認知水平參差不齊,許多企業(yè)甚至認為“AI就是算法”,忽略了“基礎設施”“配套方案”,使得AI應用落地的復雜度被嚴重低估,往往導致項目應用成效低下甚至失敗。實際場景具有需求多變性、數(shù)據(jù)多樣性的特點,往往需要結(jié)合領域?qū)<业男袠I(yè)知識將多種模型進行組合,才能打通企業(yè)的業(yè)務生產(chǎn)系統(tǒng)。企業(yè)在實施AI應用時,需要建立系統(tǒng)思維,統(tǒng)籌考慮點 / 面、上 / 下、橫向 / 縱向維度的因素,確?!巴袋c清晰、步驟合理、量力而行”。在開發(fā)和應用階段都需堅持系統(tǒng)性思維,這對AI行業(yè)與企業(yè)的協(xié)同進步是極為必要的。
AI應用開發(fā)的全流程作為一項系統(tǒng)工程,其本質(zhì)是將算法開發(fā)的流水線進行工程化,形成降本增效的應用場景;通過子流程的密切配合,形成小型閉環(huán)(見圖3)。其中,數(shù)據(jù)標注用于將數(shù)據(jù)集打上標簽以支持后續(xù)算法的訓練;數(shù)據(jù)處理對異常數(shù)據(jù)進行清洗和整理,通過數(shù)據(jù)增強和精煉等方式提高數(shù)據(jù)量;算法訓練開發(fā)新算法或者選擇已有算法,使用數(shù)據(jù)進行訓練已建立模型;模型評估基于測試數(shù)據(jù)集對模型進行評估,反復進行調(diào)優(yōu);應用生成對多個模型進行邏輯編排,指定輸入 / 輸出路徑;應用評估基于業(yè)務數(shù)據(jù)集開展進一步評估;部署推理包含應用的部署、監(jiān)控和維護。例如,在監(jiān)控和維護階段發(fā)現(xiàn)異常時,系統(tǒng)會將數(shù)據(jù)回流到數(shù)據(jù)標注環(huán)節(jié),進行難例標注后補充異常數(shù)據(jù),重新發(fā)起算法訓練。
AI進入企業(yè)核心生產(chǎn)環(huán)境也是一項系統(tǒng)工程,最重要的環(huán)節(jié)是行業(yè)機理模型與AI模型的結(jié)合。各個行業(yè)都有長期的專業(yè)積累,形成了涵蓋物理、化學、生物等知識表達,數(shù)量眾多的機理模型。為了在不同行業(yè)落地應用,AI算法應結(jié)合行業(yè)知識、企業(yè)專有數(shù)據(jù),完成通用到專用的轉(zhuǎn)變。在此過程中,應緩解通用數(shù)據(jù)與行業(yè)數(shù)據(jù)之間的領域鴻溝,支持大模型與各類行業(yè)知識庫的整合,降低大模型在各個行業(yè)的微調(diào)成本。
應用系統(tǒng)工程的方法論,開展需求分解、架構(gòu)設計、系統(tǒng)開發(fā)、集成驗證,形成端到端的解決方案。以某企業(yè)落地的工業(yè)優(yōu)化控制項目為例,AI系統(tǒng)依托云端計算平臺,以容器化部署方式對外提供服務接口;通過邊緣應用,完成工廠生產(chǎn)環(huán)境下生產(chǎn)作業(yè)系統(tǒng)數(shù)據(jù)接口的協(xié)議轉(zhuǎn)換,由此打通了AI系統(tǒng)與工廠生產(chǎn)環(huán)境舊系統(tǒng)之間的數(shù)據(jù)與指令交互;采取系統(tǒng)工程的可靠性設計方法,確保數(shù)據(jù)通道的安全性和穩(wěn)定性,保障企業(yè)的安全生產(chǎn)。鑒于工業(yè)生產(chǎn)工況的復雜多變,數(shù)據(jù)驅(qū)動的AI模型可能遇到從未“見過”的工況,需要以“邊云”協(xié)同的系統(tǒng)能力建立反饋回路,從而對AI應用的異常結(jié)果進行監(jiān)控和迭代。這種AI應用系統(tǒng)和企業(yè)業(yè)務系統(tǒng)的組合,可視為AI與核心生產(chǎn)系統(tǒng)融合的大型閉環(huán)。
圖3 AI應用開發(fā)全流程
注:MLOPS表示機器學習運維。
(三)為人工智能落地創(chuàng)造良好的協(xié)同發(fā)展環(huán)境
1. 切入明確的企業(yè)應用場景是成功應用的開端
發(fā)掘企業(yè)應用場景是AI落地應用的第一步。為了準確定位行業(yè)AI,需要深刻理解企業(yè)需求的場景業(yè)務狀況,清醒認識AI算法的能力及所能解決的問題。一個持續(xù)演進的良性循環(huán)反映在:多部門、多類型專業(yè)人員協(xié)作,針對具體的業(yè)務場景問題明確AI應用落地的邊界,以企業(yè)內(nèi) / 外部的數(shù)據(jù)治理及資產(chǎn)化水平來評估應用AI的可能性及潛在價值,以現(xiàn)有的企業(yè)知識來優(yōu)化數(shù)據(jù)驅(qū)動的AI模型,在社會價值和商業(yè)價值的實現(xiàn)過程中補充并完善更多的數(shù)據(jù)。
企業(yè)AI應用場景可分為海量重復場景、專家經(jīng)驗傳承場景、多域協(xié)同場景。通過場景化問題分析,可以找到問題邊界;通過行業(yè)知識引入,可以減少落地過程中的彎路,以此提高企業(yè)AI落地的質(zhì)量。以智能油氣勘探為例,地震資料的采集、處理和解釋流程涉及數(shù)十個工序,而作為基礎和關鍵業(yè)務環(huán)節(jié)的地震層位追蹤,目前主要采用人工解釋的方式完成;大的地震數(shù)據(jù)量導致人工解釋工作十分繁瑣,而利用AI進行層位自動追蹤可大幅減少重復性的專業(yè)勞動,縮短勘探周期并節(jié)省勘探成本。
2. 企業(yè)數(shù)字化是AI成功應用的基礎
企業(yè)的數(shù)字化水平?jīng)Q定了數(shù)據(jù)要素的準備程度,這對AI應用落地的效果至關重要。以深度學習為主的AI技術對數(shù)據(jù)的依賴性很強,特別是面向行業(yè)場景,因公開數(shù)據(jù)集有限而需企業(yè)自身積累大量的數(shù)據(jù),對信息化、數(shù)字化基礎能力提出了較高要求。在企業(yè)數(shù)字化轉(zhuǎn)型、智能化發(fā)展的過程中,及時構(gòu)建統(tǒng)一的行業(yè)數(shù)據(jù)標準,為企業(yè)建立數(shù)據(jù)管理模式及信任機制提供基礎依據(jù);逐步完善數(shù)據(jù)的知識產(chǎn)權(quán)保護和共享機制,避免強中心化帶來的“數(shù)據(jù)孤島”問題。
數(shù)據(jù)質(zhì)量也是重要方面。如果數(shù)據(jù)管理分散、規(guī)范性不足,則需先期進行數(shù)據(jù)治理以形成符合要求的數(shù)據(jù)平臺和數(shù)據(jù)資產(chǎn),隨后才能部署AI解決方案。以某供熱企業(yè)的智能化升級為例,AI上線至少有3個前置條件:
① 基礎數(shù)據(jù)的清理,從熱源、換熱站、機組、單元閥到室內(nèi)溫采等一系列設備的參數(shù),都要系統(tǒng)化地收集和建模;
② 至少1個供暖季的設備歷史運行數(shù)據(jù)、天氣數(shù)據(jù)等,作為AI訓練集和驗證集;
③ 針對歷史數(shù)據(jù)缺失的異常場景(如數(shù)據(jù)斷連、設備數(shù)據(jù)異常、閥門異常、極端天氣等)進行分析和進一步的仿真,獲得更豐富、更可靠的數(shù)據(jù)集。以高質(zhì)量行業(yè)數(shù)據(jù)為代表的前置條件只有足夠充分,才能訓練形成完整的AI調(diào)控方案。
3. 通過中樞化建設促成AI應用場景的互聯(lián)互通并實現(xiàn)價值
中樞化建設是AI系統(tǒng)工程需要采用的模式。提前策劃在不同部門之間共建AI算法和算力,才能避免“各行其是”以消除重復建設與資源浪費;AI能力需從單點的算法匯聚至水平互通的中樞引擎層,以實現(xiàn)不同AI算法的共性能力復用和高效積累。換言之,通過中樞的算力底座解決物理資源的零散問題(如云計算的本質(zhì),就是將大量的零散算力資源進行打包、匯聚,實現(xiàn)更高可靠性、更高性能、更低成本的算力),由中樞的引擎層來解決AI算法的局部性問題。將中樞化的思維和模式同時應用于場景問題定義、AI平臺建設等維度,才能將AI的應用價值從局部提升至整體。
以智慧城市建設為例,當前的多數(shù)問題都屬于由復雜關聯(lián)的局部問題造成的整體問題。AI在對應場景中的應用效果,很大程度上取決于應用場景的問題定義和建設模式。對于城市交通資源優(yōu)化,如果局限于解決單一路口的擁堵問題,即使通過AI算法將問題求解到最優(yōu),也很難對城市的整體交通狀況、車輛在途率形成根本性的改善。針對這類問題,需要采取中樞化的建設思維,將視野從局部拓展到整體,才能夠?qū)⒕植績?yōu)化輻射到全局層面,從而驅(qū)動整個系統(tǒng)產(chǎn)生更大的價值。具體而言,在設計AI算法之前,率先考慮數(shù)據(jù)、資源、場景能否互通互聯(lián);如果不能,需要優(yōu)先解決互通問題,才能再考慮如何將AI應用于優(yōu)化后的問題及系統(tǒng)。
城市運行“一網(wǎng)統(tǒng)管”是代表性的實踐案例。與單一管理部門應用場景不同,“一網(wǎng)統(tǒng)管”實質(zhì)上是中樞化的建設模式,實現(xiàn)了多個管理部門的互通互聯(lián);將原先只能局部閉環(huán)的城市問題,通過多部門協(xié)同尋求了更高效、更優(yōu)化的處置方案。針對重新設計后的全局化問題,AI應用就從原先局限于特定事件的感知和發(fā)現(xiàn),拓展到了通過知識圖譜挖掘跨管理部門事件的處置關聯(lián)性,從而精準推薦事件處置的措施和責任主體,達到處置效率、處置滿意度的全局優(yōu)化。
(四)用發(fā)展的思維解決發(fā)展過程中的挑戰(zhàn)
AI技術的發(fā)展和應用是一個循序漸進的過程。如果對AI算法缺乏寬容,實際應用時一旦出現(xiàn)問題就導致信任危機,容易遏制技術的迭代和提升,也就帶來AI應用落地的額外阻力。宜采用發(fā)展的思維來看待AI企業(yè)落地過程中的問題和挑戰(zhàn):既要給予發(fā)展機會和周期,也要在系統(tǒng)、流程、機制等方面提供支持,促成良性、可持續(xù)的能力演進。
列車運行故障動態(tài)檢測系統(tǒng)的應用場景具有代表性:采用列檢設備拍攝貨車底部和側(cè)部照片,通過審圖判斷貨車是否存在安全風險。列車速度極快、室外環(huán)境復雜,加之故障類型多達數(shù)百種,AI系統(tǒng)面臨在長尾數(shù)據(jù)上進行小樣本學習的困難。AI研發(fā)企業(yè)與鐵路科研單位合作開展了AI技術應用,經(jīng)過迭代式開發(fā)和測試,使得誤檢、漏檢樣本快速進入系統(tǒng),模型能力不斷提升,最終達到專家人工判讀的水平。在類似的發(fā)展過程中,更加開放地優(yōu)化組織流程,讓行業(yè)專家與AI專家高效配合,應用主動學習等技術提升人工輔助效率,將顯著加速AI應用落地。
在過去的10多年,AI是發(fā)展最快的科技領域之一,這得益于業(yè)界在技術研究和產(chǎn)業(yè)落地之間的良性循環(huán),即技術研究的成果為企業(yè)落地創(chuàng)造了可能性,而企業(yè)落地的收益反哺了AI技術研究。也要注意到,在深度學習爆發(fā)式增長10年后,AI技術研究逐漸進入深水區(qū),易于攻克或提升的技術點越來越少;為了維系良性循環(huán),應深入挖掘技術研究與產(chǎn)業(yè)落地的“結(jié)合點”。AI的應用旨在“減少重復勞動”“擴展人類知識邊界”,瞄準這一根本目標,保持技術研究和行業(yè)落地的緊密結(jié)合,才能兼顧技術實現(xiàn)與社會價值創(chuàng)造。
五、我國企業(yè)人工智能應用的發(fā)展建議
人類社會正在進入泛智能時代,在此關鍵時期,單項技術的重大突破、單一解決方案的深刻變化,都有可能改變各行業(yè)的競爭格局。種種跡象表明,當前正處于AI大規(guī)模落地應用的爆發(fā)前夕。世界范圍內(nèi)的企業(yè)尤其是領軍企業(yè),普遍重視AI,加大投入以緊跟潮流并獲得領先優(yōu)勢。如果在布局階段錯失機遇,一旦馬太效應形成,后發(fā)者可能處于更為弱勢的境地。相應地,我國應高度重視AI產(chǎn)業(yè)發(fā)展,積極發(fā)布AI企業(yè)落地配套政策,引導國產(chǎn)AI根技術、基礎平臺、關鍵行業(yè)應用等層面的協(xié)調(diào)發(fā)展,以更好推動AI技術的產(chǎn)業(yè)集聚、促進AI與實體經(jīng)濟的深度融合。
建議支持AI產(chǎn)業(yè)鏈發(fā)展,扶持全棧AI國產(chǎn)化,完善AI基礎平臺及工具體系,培育國產(chǎn)AI根技術,提高AI核心技術的自主可控能力。
① 加大底層根技術的研發(fā)投入,構(gòu)建算力、算法、數(shù)據(jù)三位一體的AI新生態(tài),鼓勵企業(yè)、高校、社會服務等加速應用AI根技術;以核心產(chǎn)業(yè)主體多方共建的方式,積極構(gòu)建具有國際有影響力、分布于若干行業(yè)的AI根技術應用體系,構(gòu)筑AI企業(yè)應用的技術縱深。
② 支持AI根技術持續(xù)創(chuàng)新,引導優(yōu)勢企業(yè)開展AI根技術研發(fā)攻關,支持行業(yè)示范應用,促進國產(chǎn)AI大模型、框架、芯片等核心技術突破及產(chǎn)業(yè)化落地。③ 鼓勵優(yōu)勢AI企業(yè)加速完善包括端到端的AI基礎平臺、工具鏈在內(nèi)的AI共性支撐技術體系,實質(zhì)性提高自主可控能力并形成一定的比較優(yōu)勢。
建議支持企業(yè)積極采用AI進行智能化升級,形成技術研發(fā)和產(chǎn)業(yè)智能創(chuàng)新的雙向大循環(huán)。企業(yè)智能化所需的生產(chǎn)要素,如數(shù)據(jù)、算法、算力等,通常很難依靠單一企業(yè)來構(gòu)建齊備。應建立科學合理的算力、數(shù)據(jù)、算法開放共享機制,持續(xù)開放并積累各行業(yè)的算法、模型、數(shù)據(jù),促進跨企業(yè)的智能化協(xié)作,以要素的規(guī)?;嵘髽I(yè)AI應用的水平。
① 地方政府可借助新型基礎設施建設的發(fā)展機遇,新建或擴建包括AI計算中心(公共算力)、一體化大數(shù)據(jù)中心(數(shù)據(jù)共享)、AI創(chuàng)新中心(模型共享)在內(nèi)的AI公共要素體系。
② 由企業(yè)、管理部門注入數(shù)據(jù)和應用需求,支持企業(yè)開展基于云計算、大數(shù)據(jù)的AI應用創(chuàng)新示范;鼓勵企業(yè)采用AI進行技術換代、流程再造、服務升級,形成自主技術研發(fā)和產(chǎn)業(yè)智能創(chuàng)新循環(huán)互促的發(fā)展格局。③ 制定相關標準,規(guī)范AI技術研究,以發(fā)展的思維積極應對AI落地過程中可能帶來的問題;完善與企業(yè)AI應用相關的法律法規(guī)和流程制度,促進產(chǎn)業(yè)智能化良性發(fā)展,防控潛在技術和社會風險。
劉合,能源與礦業(yè)工程管理專家,中國工程院院士。
主要從事采油工程技術及裝備研發(fā)、工程管理創(chuàng)新與實踐研究。
編輯:黃飛
?
評論
查看更多