釋放數據要素價值的路徑不止有一條。有一條路相對較短,但多數企業學不來;另一條路正在修,未來可期;還有一條路此前沒有形成閉環,影響了數據要素的價值釋放,但軟通動力現在就想走通這條路。
01
數據要素三部曲五步走
兩個概念需要再被明確。
初步測算,2023年中國數據生產總量預計超32ZB,數據要素市場規模或也已超過1200億元。但數據與數據要素有關系,可并不是一個概念,兩者的差別大概就如石油與汽油之間的不同。
另一個概念。
傳統數據治理與面向AI的數據治理也不是一個概念。過去十年,多數數字化服務商,其實就是在證明——“不是所有的牛奶都叫特侖蘇”。他們對原始數據進行整理、清洗、加工,將原始數據從無序變為有序。
但這也是傳統數據治理。
傳統數據治理所生產的“產品”,與大規模語言模型(LLM)所需要的語料數據集,其實還存在一定的差距。大模型需要投喂海量的、文本格式的、多樣化語言風格的數據,也需要高質量、多渠道、多語言的數據。
而“面向AI的數據治理”更需要解決四個挑戰:數據“擁”而難“用”、數據“匯”而難“慧”、數據“通”而不“統”、數據“治”而不“智”。也只有解決上述挑戰,數據才能成為產品化的數據集,才能稱之為“數據資源”。
但這還沒有完成業務閉環。
如前所述,自“數據要素”概念提出后,業內逐漸清晰了數據與數據要素之間的差別,以及傳統數據治理與面向AI的數據治理之間的差別。只不過,這也才厘清了從數據到數據要素脫變的前半段路徑。
后半段路徑,則需要有新的模式、新的技術介入。或者說,“數據資源”經過確權、登記、評估、定價、入表等一系列環節,才能成為了可流通的“數據資產”。更進一步,將“數據資產”融入社會生產經營活動,融入行業應用場景,并以大模型為載體進行價值釋放,才能最終成為可產生經濟效益的“數據資本”。
這就是數據要素蛻變的三部曲。
也正是厘清了其中的每個環節,軟通動力就形成了自己業務主線,他希望分五步走——以咨詢服務為牽引;以數據基礎設施為支撐;以數據標注和數據歸集等服務為輔助;以算法基礎設施,以及行業大模型訓練和微調為發力點;以大模型場景應用為驅動,喚醒數據要素的潛能,幫助用戶構建數據要素業務閉環。
02
咨詢服務可落地
“自從進入數智化轉型的深水區,就已經沒有什么‘最佳實踐’。”楊念農是軟通動力咨詢與數字化創新服務線聯席總裁。在此前接受的采訪中,楊念農就表示要跳出“最佳實踐”的套路,首先要對企業的“業務戰略”抽絲剝繭。
說得再直白些,“最佳實踐”是可以套用的模板,對“業務戰略”的抽絲剝繭,才是對數智化轉型的個性化設計。或者說。大到城市小到企業,構建數據戰略,都是牽一發而動全身的大事,不可能千篇一律——其需服從企業的“業務戰略”,即數據戰略向上要與企業業務戰略打通,向下要與數字基礎設施對齊。
正是遵從將“業務戰略”拆解為“數據戰略”的思路。目前,軟通咨詢已可提供主數據管理咨詢、數據治理咨詢、數據能力規劃、數據平臺咨詢與實施、數據安全規劃與實施等9大類解決方案,可提供從咨詢到落地的端到端服務能力。
03
“軟硬一體”的數字基礎設施
承接咨詢服務的落地,即是數據基礎設施建設。近年來,軟通動力布局了“四大業務增長戰略”,其中的兩項——計算產品與數字基礎設施,以及數字能源與智能算力,都與基礎設施有關。而且不同于多數數字化服務商,軟通動力不僅關注實施交付能力,更具備“軟硬一體”的全棧數字化產品方案。
隨著同方計算機的加入,軟通動力補強了PC、通用算力、智能算力、AI一體機產品,以及存儲服務器、分布式存儲系統、歸檔存儲系統、備份存儲系統等產品。協同軟通動力自研的天鶴操作系統、天鶴數據庫、鴻鵠SwanLinkOS、數字孿生與仿真平臺等,其從底層構建起了軟硬一體化的能力。
更重要的是,軟通動力借此能力,已有條件完成基礎設施的向下垂直打穿。其可針對芯片、計算、存儲、網絡、云平臺、數據庫等全棧技術產品,進行驗證、適配、定制和調優,所謂“多云、多芯”就再不是問題,而且還將最大限度地激發算力的能量。
04
數據治理是當務之急
更進一步,數字基礎設施之上即是數據治理。如前所說,軟通動力在此環節,提供的是“面向AI的數據治理”,而且其采用了“平臺+服務”模式,將自身的行業沉淀、場景理解融入其中。
此前,“云上中臺·重明”數據中臺已正式發布。據軟通動力副總裁唐平介紹,該平臺已可提供數據集成平臺、主數據管理平臺、數據工廠、數據資產管理平臺、數據開放平臺等13款獨立產品,能完整覆蓋企業數據應用與全生命周期數據治理兩大體系。
舉例說明,在能源革命和信息通信技術革命的驅動下,車企正在經歷一場智能化的變革。此過程中,知名合資車企選擇部署了“云上中臺·重明”主數據管理平臺(iMDM)。該方案搭建起了企業級的數據治理平臺,建立主數據標準體系,消除了企業內部數據“孤島”,顯著提升庫存流轉效率,從而實現了數據治理工具鏈端到端閉環。
不僅如此。
軟通動力還已建立起一支專業團隊,面向行業提供數據標注和數據歸集服務。或可如此比喻,未經標注的數據,就像是在說著各自家鄉的方言,而經過數據標注,所有的數據學會了說普通話,數據質量已大幅度提升,將這樣的數據語料,喂給大模型,更將極大地提升大模型訓練應用效率。
但這里需要澄清誤解——萬不要認為數據標注和數據歸集,是兩項既不起眼,又沒什么技術含量的工作。如標注安全帽等低端的數據標注,確實將被人工智能技術取代。但更多的數據標注如“尋寶”,服務團隊需從圖片、文字、地理信息等數據載體中,“尋寶”標注出有價值的信息。
而且高端的數據標注,必須由懂行業、懂場景的行業專家執行。例如,保險行業數據歸集,服務團隊就必須理解保險業務的導購、理賠、精算等場景。這也才是真正的“面向AI的數據治理”。
05
“大模型”釋放數據價值
正是憑借“平臺+服務”模式,軟通動力已在持續幫助用戶,完成“面向AI的數據治理”。
因為這工作,軟通動力也將支撐其業務閉環中的關鍵一環。而接下來的工作,即是將數據要素融入社會生產經營活動,完成數據變現,這也就是通常所說的“數據要素×”。
其實,數據要素價值釋放的路徑不止有一條。互聯網企業在此方面頗有心得,其數據可在生態內部流轉變現。例如,電商平臺數據可反哺入駐電商平臺的商戶,而且這條有一條路相對較短,閉環變現能力也較強。
還有一條路正在修——我國已成立超過50家數據交易機構,他們以數據API、數據集、數據報告等為主要交易標的,并注重在解決數據供給難、確權難、定價難、入場難、監管難、安全難等關鍵共性難題。但不得不說,這條路還處于持續探索之中。
另外,還有一條路是“圓的”。
此前這條路沒有形成閉環,現在大模型補上了斷點。正是因為具有“面向AI的數據治理”能力,軟通動力希望以算法基礎設施為支撐,以行業大模型訓練和微調為發力點,以大模型場景應用為驅動,幫助用戶形成數據要素價值釋放的業務閉環。
其實,自大模型出現之后,就捅破了應用的天花板。根據IDC預測,伴隨AIGC技術的發展,智能化應用將出現爆發式增長,2024年,全球將涌現超過5億個新應用,相當于過去40年的總和。
這就為數據要素價值釋放,創造了更多的窗口。只不過,有窗口還要有窗框——2023年,軟通動力正式推出軟通天璇2.0 MaaS平臺,其在大模型技術底座層,加入了升級的軟通訓推一體化平臺,并擴展接入了多個開源和閉源大模型接入以及深入研究的開源大模型。
同時,在軟通天璇2.0 MaaS平臺的行業大模型及管理層,軟通動力為客戶提供了大模型的數據處理、繼續訓練、調優、部署、推理和數字資產管理服務,并形成了軟通動力應用開發平臺。
在此之上即是行業應用。
這也是業務閉環的中的最后一環。例如,在保險領域,軟通天璇2.0 MaaS平臺接入盤古大模型,已經幫助企業極大地提升了能效。其在在核保、核賠等環節,可以回答保險理賠、方案定制、產品推薦、保單查詢等相關問題,甚至在部分場景能夠做到全自動化秒級處理。
06
數據要素聯接數字中國
當然,這也只是開始。未來,數據要素更將連接在數字經濟側與實體經濟側,聯接一家家企業,聯接一個個行業,并在智能制造、智慧農業、供應鏈金融等領域,創造全新的業務模型,激發新質生產力。
這也正是軟通動力的業務方向,而他現在唯一要做的事情就是,提供從“第一公里”到“最后一公里”的服務,提供從算力基礎設施,到算法基礎設施,再到場景應用的服務,喚醒企業沉睡的積累,釋放企業數據要素價值潛能,為客戶創造可量化的經濟效益。
審核編輯:劉清
-
一體機
+關注
關注
0文章
914瀏覽量
32749 -
軟通動力
+關注
關注
1文章
818瀏覽量
15171 -
大模型
+關注
關注
2文章
2489瀏覽量
2862 -
LLM
+關注
關注
0文章
294瀏覽量
354
原文標題:釋放“數據要素”價值,軟通動力喚醒企業沉睡的積累
文章出處:【微信號:isoftstone-group,微信公眾號:軟通動力】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論