在人類歷史的車輪中,始終充斥著以「科技」為名的碾壓和推動力。
遠至1萬年前的新石器時代,為適應農業(yè)及其他手工業(yè)需求的遠古人對石質工具進行打磨加工;近及18世紀60代開始席卷全球的工業(yè)革命,新能源動力機器的發(fā)明推動生產力飛躍式發(fā)展和生產關系大變革,這一點早已被一次又一次地論證過。
幾年前,AlphaGo團滅人類圍棋手,將人工智能推向臺前。所有人都在問一個問題,AI究竟是什么。
在我看來言,AI不僅是新一輪生產資料大發(fā)現(xiàn)的過程,更是新一輪生產力釋放和補充。因為在AI時代,數(shù)據(jù)成為新時代的石油工業(yè),規(guī)模甚至會更大,更特殊,更具有戰(zhàn)略性。
而對于一家企業(yè)來說,未來如何創(chuàng)造收入,隨之而來機會又要多大,這一切都要從更大的畫面上去考慮,而不是從過去的財務結果上去找預期。
有句話說得好,一個公司的命運,既要看自身的努力,更要看歷史的進程。
從這個角度上來說,依托于數(shù)字內容管理業(yè)務的開普云,無疑卡住了一個不錯的位置,也讓它有了更大的想象空間。
01 AI時代的“敲門磚”
數(shù)字內容管理業(yè)務,是開普云在AI時代的“敲門磚”。
什么是數(shù)字內容管理業(yè)務?簡單來說,是依托于互聯(lián)網(wǎng)內容服務云平臺及統(tǒng)一信息資源庫等相關產品,幫助政府完成互聯(lián)網(wǎng)數(shù)據(jù)中臺建設。
以開普云的一體化政務業(yè)務為例,過去政府有很多數(shù)據(jù),包括不同政府部門的數(shù)據(jù),也包括文本、圖片、音頻、視頻等多種結構的數(shù)據(jù)。
隨著政務信息化改革的深入,政府需要一個更強大的數(shù)據(jù)平臺,幫助他們打通各部門的業(yè)務系統(tǒng),實現(xiàn)不同部門數(shù)據(jù)的統(tǒng)一采集,不同結構數(shù)據(jù)的統(tǒng)一存儲,最終實現(xiàn)后端不同場景下數(shù)據(jù)的統(tǒng)一調度。
開普云的數(shù)字內容管理業(yè)務的應用場景主要有三個:智慧門戶、一體化政務以及融媒體。從目前來看,公司在三個場景中均有不俗的表現(xiàn)。
在智慧門戶領域,開普云的客戶覆蓋了全國20%左右的省級政府,國務院組成部門和直屬機構。在政府服務平臺方面,公司也承擔了多個政務服務平臺的項目建設。
回過頭看,內容管理業(yè)務對開普云的AI業(yè)務影響巨大。
一方面,AI技術的落地應用往往會優(yōu)先爆發(fā)在數(shù)據(jù)化程度較高的領域,比如醫(yī)療的數(shù)據(jù)比較少一些,AI滲透的難度會大一些。
原因在于,現(xiàn)在普遍的監(jiān)督算法必須依賴標記數(shù)據(jù)。無監(jiān)督算法對數(shù)據(jù)標記的要求會小一些,但是技術還不是很成熟,主要是做聚類和分析。
當開普云在不同場景下完成數(shù)據(jù)平臺建設,客戶對AI的需求也逐漸爆發(fā)。
另一方面,通過數(shù)據(jù)平臺產品,開普云能切入不同的場景,而場景則是海量數(shù)據(jù)的入口。
當這些數(shù)據(jù)通過AI技術成為結構化、可利用、可輸出的生產要素,便為開普云積累了一筆最大的財富。這也讓它們有了更大的想象空間。
02 開普云開辟AI新戰(zhàn)場
縱觀過去,每一次技術革命,都帶來全新的商業(yè)機會?;ヂ?lián)網(wǎng)本質上解決了效率和鏈接的問題,進而出現(xiàn)外賣、社交、打車等新業(yè)態(tài)。
而人工智能的價值主要在于兩點,生產工具的延伸和人工勞動力的替代。前者的例子是淘寶天貓的智能推薦,提高人們獲取商品的效率,而后者的典型則是海底撈的機器人。
對于人工智能企業(yè)來說,核心并不在技術,而在于場景的選擇。以開普云為例,由于積累的數(shù)據(jù)大多為政府稿件和圖片,因此他們選擇政府內容安全的場景切入。
從過去來看,人工智能的應用要經(jīng)歷從感知、認知到?jīng)Q策的三階段。感知智能只能實現(xiàn)對語音、圖像和人臉的識別,而認知智能可以更好地理解語言的含義,實現(xiàn)和人類的交互,以及各種洞察和決策分析。
開普云也正在經(jīng)歷這個過程。
早期,開普云的大數(shù)據(jù)服務主要以政府網(wǎng)站的內容安全為主。其中很重要的一個工作是,敏感詞的識別。
在當下信息爆炸時代,每天都在誕生新詞、新的敏感用語?;趯φZ義的正確理解,快速找到新詞和敏感用語,減少新詞、敏感用語漏報,是內容安全監(jiān)測的重要工作。
在提高內容安全監(jiān)測的效率上,開普云做了兩件事。
技術方面,開普云通過平衡語料庫自動構建技術,極大地降低了人工標注的成本,可以在較短的時間內覆蓋較大規(guī)模的文本素材。目前,基于無監(jiān)督方式為主訓練的NGram計算,已基本接近人工標注的精度,依存關系計算結果的可信度達到80%以上。
在深度學習的模型下,數(shù)據(jù)規(guī)模很大程度上會影響機器學習算法的精度。目前,公司平衡語料庫覆蓋了各行各業(yè)出版圖書、電子報紙、主流媒體新聞資訊,達千億字規(guī)模的文本素材,數(shù)據(jù)量遠遠超過國內其他中文語料庫。
大數(shù)據(jù)服務具有規(guī)模效應。即客戶越多,你收到數(shù)據(jù)反饋越多,大數(shù)據(jù)產品精準度就越高,繼而被更多客戶選擇,最終形成馬太效應。
在政務大數(shù)據(jù)監(jiān)測領域,這一趨勢已經(jīng)極為明顯。截至目前,開普云大數(shù)據(jù)服務的客戶覆蓋了65%的省政府以及40%的地級政府,在細分領域占據(jù)絕對優(yōu)勢。
作為大數(shù)據(jù)監(jiān)測領域頭部平臺,隨著客戶需求的復雜化,開普云的大數(shù)據(jù)服務也有計劃從感知領域向更深度的認知領域延伸,即從敏感詞識別過渡至輿情監(jiān)測。
眾所周知,在識別領域,文本的識別處理難度最高。原因是文字、語言涉及語義理解,主觀色彩更重,因此更為復雜。
開普云的做法是,通過人工智能深度學習的方式,強化文字識別的準確性。
技術能力的提升,進一步拓展了開普云的應用場景。比如,當用戶搜索內容時,開普云通過人工智能技術,極大加強搜索結果的準確性。
此外,大數(shù)據(jù)服務可以從網(wǎng)站內容的監(jiān)控擴大至全網(wǎng)的輿情監(jiān)控,比如當一個政策發(fā)布后,網(wǎng)上的正面評論有多少,負面評論有多少,評論中出現(xiàn)最多的關鍵詞又有哪些。
基于這些反饋數(shù)據(jù),可以為政府的決策提供參考,從而幫助其建立健全的輿情收集和回應機制。
這也代表了人工智能的一個重要發(fā)展趨勢,即隨著數(shù)據(jù)量的增長和業(yè)務場景復雜度的提升,AI應用勢必要從智能識別走向更高階的智能輔助決策。
03 AI再進化,大數(shù)據(jù)服務從智能識別到智能決策
這種趨勢的鋒芒正在開普云身上閃現(xiàn)。
國家知識產權局項目正是其從智能識別到智能決策的重要體現(xiàn)。
要知道,國家知識產權局是文獻內容很多的政府部門。原因是按規(guī)定在專利申請過程中,申請人需要提交一系列的申請文件,如請求書、說明書、摘要和權利要求書等,再由專利審查員去看申請的內容是否滿足要求。
但隨著專利申報數(shù)量的增加,國家知識產權局每年能收到幾百萬篇申請,如何更高效地完成篩選工作變成一個棘手的問題。開普云大數(shù)據(jù)服務的價值就凸顯出來了。
而開普云提供的解決方案是,搜集歷史上所有專利申報成功的稿件,通過人工智能識別網(wǎng)絡的算法把關鍵特征進行提取,再將新的文獻與關鍵特征進行匹配,最終得出一份創(chuàng)新性比例的參考數(shù)據(jù)。憑借這個算法,使得客戶的審查效率大大提高。
事實上,這種類似于智能決策的業(yè)務,在各個細分領域的應用日益頻繁。比如在醫(yī)學影像領域,利用人工智能系統(tǒng)輔助閱片。
而隨著人工智能從感知走向認知,要解決的業(yè)務問題從單個業(yè)務場景、單點問題,向業(yè)務全流程演進,行業(yè)know-how的復雜度和壁壘變得更高,給技術驅動的人工智能服務商帶來更大的商業(yè)機會。
一方面,深入場景服務需要極強的業(yè)務理解做支撐,行業(yè)準入門檻大大提高。另一方面,人工智能與行業(yè)深度融合后重塑業(yè)務流程和產業(yè)鏈,形成巨大的商業(yè)機會,比如基于計算機視覺的智能貨柜,相比傳統(tǒng)機械式無人售貨機成本下降50%以上。
在AI時代全面到來前,找到落地場景的開普云,無疑已經(jīng)占據(jù)了競爭優(yōu)勢的制高點。
責任編輯:Ct
評論
查看更多