隨著互聯網的高速發展,被收集并應用于分析的數據量呈現出爆發式增長,面對如此量級的數據,以及常見的實時利用該數據的需求,僅依靠人工處理難免力不從心,這就催生了所謂的大數據和機器學習系統。
機器學習是一門多領域的交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科,專門研究計算機如何模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
通俗地講,傳統計算機工作時需要接收指令,并按照指令逐步執行,最終得到計算結果;機器學習是通過某種算法,將歷史數據進行訓練得出某種模型,當有新的數據提供時,可以使用訓練產生的模型對未來進行預測。機器學習是一種能夠賦予機器進行自主學習,不依靠人工進行自主判斷的技術,它和人類對歷史經驗歸納的過程有著相似之處。
機器學習是一門能夠讓編程計算機從數據中學習的計算機科學(和藝術)。機器學習已經不僅僅只是一個未來幻想了,它已經存在了。事實上,在某些專門領域的應用中,例如光學字符識別(OCR),它甚至已經存在了幾十年。
舉例來說,垃圾郵件過濾器就是一個機器學習的程序,它通過垃圾郵件(比如用戶手動標記的垃圾郵件)以及常規郵件(非垃圾郵件)的示例,來學習標記垃圾郵件。系統用來學習的這些示例,我們稱之為訓練集。每一個訓練示例稱為訓練實例或者是訓練樣本。
本文整合自:語言中文網、傳智播客
審核編輯:符乾江
-
計算機
+關注
關注
19文章
7500瀏覽量
88018 -
機器學習
+關注
關注
66文章
8420瀏覽量
132680
發布評論請先 登錄
相關推薦
評論