-
關聯規則分析
關聯規則(Association Rules)是反映一個事物與其他事物之間的相互依存性和關聯性,是數據挖掘的一個重要技術,用于從大量數據中挖掘出有價值的數據項之間的相關關系。
關聯規則是形如X→Y的蘊涵式,其中, X和Y分別稱為關聯規則的先導(antecedent或left-hand-side, LHS)和后繼(consequent或right-hand-side, RHS) 。其中,關聯規則XY,存在支持度和信任度。
-
回歸分析
回歸分析是一種數學模型。當因變量和自變量為線性關系時,它是一種特殊的線性模型。
最簡單的情形是一元線性回歸,由大體上有線性關系的一個自變量和一個因變量組成;模型是Y=a+bX+ε(X是自變量,Y是因變量,ε是隨機誤差)。
通常假定隨機誤差的均值為0,方差為σ2(σ2﹥0,σ^2與X的值無關)。若進一步假定隨機誤差遵從正態分布,就叫做正態線性模型。一般的,若有k個自變量和1個因變量,則因變量的值分為兩部分:一部分由自變量影響,即表示為它的函數,函數形式已知且含有未知參數;另一部分由其他的未考慮因素和隨機性影響,即隨機誤差。
當函數為參數未知的線性函數時,稱為線性回歸分析模型;當函數為參數未知的非線性函數時,稱為非線性回歸分析模型。當自變量個數大于1時稱為多元回歸,當因變量個數大于1時稱為多重回歸。
- 分類分析
分類的主要用途和場景是“預測”,基于已有的樣本預測新樣本的所屬類別。例如信用評級、風險等級、欺詐預測等;同時,它也是模式識別的重要組成部分,廣泛應用到機器翻譯,人臉識別、醫學診斷、手寫字符識別、指紋識別的圖像識別、語音識別、視頻識別的領域;另外,分類算法也可以用于知識抽取,通過模型找到潛在的規律,幫助業務得到可執行的規則。
常見應用場景:
對沉默會員做會員重新激活,應該挑選具有何種特征會員
商品選取何種促銷活動清倉
那些廣告更適合VIP商家的投放需求
提煉特征規則利用的是在構建分類算法時產生的分類規則。
- 聚類分析
聚類是將物理或抽象對象的集合分成由類似的對象組成的多個類的過程。由聚類所生成的簇是一組數據對象的集合,這些對象與同一個簇中的對象彼此相似,與其他簇中的對象相異。“物以類聚,人以群分”,在自然科學和社會科學中,存在著大量的分類問題。聚類分析又稱群分析,它是研究(樣品或指標)分類問題的一種統計分析方法。聚類分析起源于分類學,但是聚類不等于分類。聚類與分類的不同在于,聚類所要求劃分的類是未知的。聚類分析內容非常豐富,有系統聚類法、有序樣品聚類法、動態聚類法、模糊聚類法、圖論聚類法、聚類預報法等。
- 集成學習
集成學習(ensemble learning)通過構建并結合多個學習器來完成學習任務,有時也被稱為多分類器系統(multi-classifier system)、基于委員會的學習(committee-based learning)。
集成學習通過將多個學習器進行結合,常可獲得比單一學習器更加顯著的泛化性能。這對“弱學習器”尤為明顯。因此集成學習的理論研究都是針對弱學習器進行的,而基學習器有時也被直接稱為弱學習器。但需注意的是,雖然從理論上說使用弱學習器集成足以獲得很好的性能,但在實踐中出于種種考慮,例如希望使用較少的個體學習器,或是重用一些常見學習器的一些經驗等,人們往往會使用比較強的學習器。
在一般經驗中,如果把好壞不等的東西摻到一起,那么通常結果會是比最壞的要好些,比最好的要壞一些。集成學習把多個學習器結合起來,如何能得到比最好的單一學習器更好的性能呢?
- 自然語言處理
自然語言處理( Natural Language Processing, NLP)是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學于一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯系,但又有重要的區別。自然語言處理并不是一般地研究自然語言,而在于研制能有效地實現自然語言通信的計算機系統,特別是其中的軟件系統。因而它是計算機科學的一部分
自然語言處理主要應用于機器翻譯、輿情監測、自動摘要、觀點提取、文本分類、問題回答、文本語義對比、語音識別、中文OCR等方面 。
- 圖像處理
圖像處理(image processing),用計算機對圖像進行分析,以達到所需結果的技術,又稱影像處理,圖像處理一般指數字圖像處理。數字圖像是指用工業相機、攝像機、掃描儀等設備經過拍攝得到的一個大的二維數組,該數組的元素稱為像素,其值稱為灰度值。圖像處理技術一般包括圖像壓縮,增強和復原,匹配、描述和識別3個部分。
深度學習(DL, Deep Learning)是機器學習(ML, Machine Learning)領域中一個新的研究方向,它被引入機器學習使其更接近于最初的目標——人工智能(AI, Artificial Intelligence)。
深度學習是學習樣本數據的內在規律和表示層次,這些學習過程中獲得的信息對諸如文字,圖像和聲音等數據的解釋有很大的幫助。它的最終目標是讓機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等數據。 深度學習是一個復雜的機器學習算法,在語音和圖像識別方面取得的效果,遠遠超過先前相關技術。
深度學習在搜索技術,數據挖掘,機器學習,機器翻譯,自然語言處理,多媒體學習,語音,推薦和個性化技術,以及其他相關領域都取得了很多成果。深度學習使機器模仿視聽和思考等人類的活動,解決了很多復雜的模式識別難題,使得人工智能相關技術取得了很大進步。
-
數據
+關注
關注
8文章
7134瀏覽量
89406 -
關聯規則
+關注
關注
0文章
29瀏覽量
8017 -
回歸分析
+關注
關注
0文章
7瀏覽量
5920
發布評論請先 登錄
相關推薦
評論