工業大數據具有一般大數據的特征(海量性、多樣性等),此基礎上具有 價值性 、 實時性 、 準確性 、 閉環性 四個典型的特征。
工業大數據與互聯網大數據最大的區別在于工業大數據有非常強的目的性,而互聯網大數據更多的是一種關聯的挖掘,是更加發散的一種分析。除此之外,兩者在數據的特征和面臨的問題方面也有不同。有別于互聯網大數據,工業大數據的分析技術核心要解決 “3B” 問題:
1、Below Surface —— 隱匿性,即需要洞悉背后的意義
工業環境中的大數據與互聯網大數據相比,最重要的不同在于對數據特征的提取上面,工業大數據注重特征背后的物理意義以及特征之間關聯性的機理邏輯,而互聯網大數據則傾向于僅僅依賴統計學工具挖掘屬性之間的相關性。
2、Broken —— 碎片化,即需要避免斷續、注重時效性
相對于互聯網大數據的量,工業大數據更注重數據的全,即面向應用要求具有盡可能全面的使用樣本,以覆蓋工業過程中的各類變化條件、保障從數據中能夠提取以反映對象真實狀態的信息全面性。因此,工業大數據一方面需要在后端的分析方法上克服數據碎片化帶來的困難,利用特征提取等手段將這些數據轉化為有用的信息,另一方面,更是需要從數據獲取的前端設計中以價值需求為導向制定數據標準,進而在數據與信息流通的平臺中構建統一的數據環境。
3、Bad Quality —— 低質性,即需要提高數據質量、滿足低容錯性
數據碎片化缺陷來源的另一方面也顯示出對于數據質量的擔憂。即數據的數量并無法保障數據的質量,這就可能導致數據的低可用率,因為低質量的數據可能直接影響到分析過程而導致結果無法利用。
但互聯網大數據則不同,其可以只針對數據本身做挖掘、關聯而不考慮數據本身的意義,即挖掘到什么結果就是什么結果。最典型的就是經過超市購物習慣的數據挖掘后啤酒貨架就可以擺放在尿不濕貨架的對面,而不用考慮他們之間有什么機理性的邏輯關系 ;換句話說,相比于互聯網大數據通常并不要求有多么精準的結果推送,工業大數據對預測和分析結果的容錯率遠遠比互聯網大數據低的多。
互聯網大數據在進行預測和決策時,僅僅考慮的是兩個屬性之間的關聯是否具有統計顯著性,其中的噪聲和個體之間的差異在樣本量足夠大時都可以被忽略,這樣給出的預測結果的準確性就會大打折扣。
比如當我覺得有 70% 的顯著性應該給某個用戶推薦 A 類電影,即使用戶并非真正喜歡這類電影也不會造成太嚴重的后果。但是在工業環境中,如果僅僅通過統計的顯著性給出分析結果,哪怕僅僅一次的失誤都可能造成嚴重的后果。
-
工業大數據
+關注
關注
0文章
72瀏覽量
7867 -
互聯網大數據
+關注
關注
0文章
7瀏覽量
1414
發布評論請先 登錄
相關推薦
評論