導讀:本文通過案例分門別類地深入探討人工智能的實際應用。案例甚多,此處所列舉的僅是九牛一毛。本該按行業或業務對這些案例進行分類,但相反我選擇按在行業或業務中最可能應用的順序來分類。
本文將使用“算法”一詞,以高度簡化的方式來描述單個算法、模型或者使用多種算法的軟件。在每個類別中,逐一討論數據輸入的類型、作為黑箱的算法以及輸出(為了簡便易行,即使真實算法不是黑箱也暫且把它當成黑箱)。
因為這是高層次的概述,所以我鼓勵你深入研究感興趣的具體應用,搞清楚它們究竟是如何應用于行業或者業務活動的。目前也有很多資源可供使用,以學習所涉及的技術細節和具體算法。
01 預測分析
預測是預測分析或者預測建模的同義詞,這是根據有標簽,以及有時甚至無標簽的輸入數據來判斷輸出數據的過程。在機器學習和人工智能中,預測分析可以進一步細分為回歸和分類。
下面將對使用有標簽數據(有監督)進行預測的兩個子類進行討論。
1. 回歸
圖1-1展示了在回歸方法中輸入有標簽數據,經預測模型處理,然后從連續數列中生成數值的過程(例如股市的閉市價)。
▲圖1-1:回歸
應用包括客戶全周期的股票價值和凈利潤、收入及其增長預測、價格變動、信貸違約風險以及股票交易計算。
2. 分類
分類指的是輸入有標簽數據,經過分類模型處理后,把輸入數據分成一類或多類的過程,如圖1-2所示。
▲圖1-2:分類
垃圾郵件過濾器是二元分類應用的標準案例。電子郵件是經分類模型處理后的輸入數據,輸出數據是確定了的垃圾郵件或者非垃圾郵件,非垃圾郵件專指那些不含垃圾內容的好郵件。垃圾郵件會被送入垃圾箱,而非垃圾郵件則被送入收件箱。
假如引入第三個類別“不確定”,那么分類器現在就可以把輸入的郵件分成三類。因為超過了兩個類別,所以這是多元分類的例子。在該例子中,電子郵件的客戶端可能有“疑似垃圾郵件”的文件夾供用戶審查每封郵件,并以此訓練分類器更好地區分垃圾與非垃圾郵件。
如果要把輸入數據分成三類或更多類,那么算法可以為輸入數據選擇單一類別或者計算輸入數據屬于每個類別的概率。在后一種情況下,可以采用概率最大的類別作為選擇的結果,或者采用所有類別的概率來按你自己定制的規則處理。
在這種情況下,假定一封剛收到的郵件被確定有85%的可能性是垃圾郵件,10%的可能性是非垃圾郵件,5%的可能性為不確定。因為是垃圾郵件的可能性最高,因此可以判定該郵件為垃圾郵件,或者以其他方式來使用計算出的概率。
最后,某些算法可以為同一輸入分配多個標簽。這里有一個與圖像識別相關的例子,假設輸入的數據是紅蘋果的圖像,那么算法可以為該圖像分配紅色、蘋果和水果等多個不同的標簽。該案例為圖像分配所有三個類別的做法是合適的。
應用包括信用風險、貸款審批和客戶流失。分類可以與本文后續討論的識別應用相結合。
02 個性化和推薦系統
推薦系統是依據現有信息進行推薦的一種個性化形式,其結果與各個用戶甚為相關。其可以用來提高客戶轉化率、銷售率、滿意度和留存率。事實上,亞馬遜就是通過增加這些引擎把營業收入提高了35%, 75%的Netflix觀賞節目也來自于這樣的推薦。
推薦系統是一種特別的信息過濾系統。也可以通過用戶搜索、排名和評分的辦法來完成個性化。推薦系統根據諸如商品或者用戶等的輸入數據,經過推薦模型或者引擎的處理來完成推薦(例如產品、文章、音樂、電影),如圖2所示。
▲圖2:推薦系統
值得一提的是與推薦系統相關的“冷啟動問題”。冷啟動是指智能應用尚未擁有足夠的信息來為特定用戶或者群體做出高度個性化和關聯度的推薦。例如,用戶尚未產生關于它們的偏好、興趣或購買歷史的信息。
另一個例子是當商品(例如衣服、產品、視頻、歌曲)剛剛面世的時候。有幾種技術有助于解決這個問題,但因篇幅所限就不深入討論了。
推薦系統應用包括推薦產品、視頻、音樂、歌曲、書籍和電視節目(例如亞馬遜、Netflix、Spotify)。除了推薦以外,也包括個性化的內容,包括新聞、報道、電郵和定向廣告(例如推特)。
其他的案例還包括個性化醫療計劃、個性化圖像和圖標(例如YouTube、Netflix、Yelp)、葡萄酒推薦、個性化購物(例如完美的夾克衫搭配)、時尚穿搭(例如StitchFix)以及全套的自動化推薦。
03 計算機視覺
計算機視覺是一個廣闊的領域,它包括涉及諸如圖像和視頻之類視覺信息的模式識別(下一節將討論另外一種技術)。計算機視覺以照片、靜止的視頻圖像和一系列圖像(視頻)作為輸入,經過模型的處理,產生輸出,如圖3所示。
▲圖3:計算機視覺
輸出可以是識別、檢測和發現某個目標、特征或者活動。視覺相關的應用隱含著一定程度的自動化,特別是自動化視覺,通常需要人在應用中參與(例如檢查)。機器視覺一詞用來描述在工業應用中的類似或者有一定重疊度的技術,諸如檢查、過程控制、測量和機器人。
計算機視覺有許多有趣而且強大的應用,同時應用場景也在快速增加。例如,可以在下述場景中使用計算機視覺:
視頻分析和內容篩選
唇讀
指揮自動化機器(例如汽車和無人機)
視頻識別和描述
視頻字幕
識別像擁抱和握手之類的人際交互動作
機器人及其控制系統
人群密度估算
清點人數(例如排隊、基礎設施規劃、零售)
檢查與質量控制
零售客戶步行路徑分析以及參與度分析
無人航空器(UAV)經常被稱為無人機。通過應用計算機視覺,無人機能夠執行檢查(例如石油管道、無線信號塔)、完成建筑和區域搜索、幫助制作地圖和送貨。計算機視覺現在正廣泛應用于公安、安保和監控。當然,這類應用也要注意符合倫理道德,保護人們的利益。
計算機視覺還有最后一件事值得一提。通過看、聞、聽、觸和味五大感覺,人類能夠感知環境和周圍的世界。感官捕獲信息,然后傳遞到神經系統進行轉換,同時也決定應該采取什么行動或者應該做出什么樣的反應。計算機視覺是對特定人工智能應用視覺的一種類比。
04 模式識別
模式識別涉及輸入非結構化數據,經過模型處理,繼而檢測是否存在某種特定的模式(檢測),然后為識別出的模式分配一個類別(分類),或者發現所識別模式的主題(識別),如圖4-1所示。
▲圖4-1:模式識別
這些應用的輸入可以包括圖像(包括視頻——一系列靜止的圖像)、音頻(例如講話、音樂和聲音)和文本。文本可以根據其特性進一步細分為電子、手寫或者打印(例如紙、支票、車牌號)。
以圖像為輸入的目的可能是檢測目標、識別目標、發現目標,或者三者皆有。人臉識別就是一個好例子。訓練模型來檢測圖像中的人臉,并對檢測到的目標進行分類,打上人的標簽,這就是目標檢測的例子,這里的目標是未經識別的人臉。
“檢測”用來指代所發現的不同于背景的目標。其也包括對目標位置的測量和圍繞被檢測目標邊際框的具體測量。識別是指為檢測到的目標分類或打標簽的過程(在本案例中是人臉),識別會更進一步,并為所識別的人臉分配一個身份。圖4-2呈現了一些圖像識別的案例。
▲圖4-2:圖像識別與檢測
諸如人臉識別這樣的生物特征識別技術可以用來為圖中的人自動打標簽。生物特征識別的另外一種形式是根據指紋來識別。
其他的應用包括:
讀出視頻和音頻中的文字
在圖像上打標簽和分類
汽車保險中基于圖像來評估汽車受損程度
從視頻和音頻中提取信息
基于面部和聲音的情感識別
面部表情識別
音頻識別的應用包括:
將語音轉換為文本
分離并識別出講話者
基于聲音、實時客服和銷售電話的情感智能分析
伐木和森林砍伐聲音檢測
缺陷檢測(例如制造過程中的缺陷或零配件失效)
最后,手寫或打印的文本可以通過光學字符識別(OCR)和手寫字符識別轉換為電子文檔。文檔也可以轉換為語音,但這被認為更可能是人工智能的生成性應用,而不是識別性應用。本文稍后會討論生成性應用。
05 聚類和異常檢測
圖5中所示的聚類和異常檢測是兩種最常見的無監督機器學習技術。它們也被認為是模式識別技術。
▲圖5:聚類和異常檢測
這兩個過程都以無標簽數據作為輸入,經過相應算法(聚類或異常檢測)的處理,在聚類的場景下完成分組,或者在異常檢測場景下確定是否屬于異常。我們首先討論聚類。
聚類把無標簽數據中相似的數據聚合成組。具體的組數由完成聚類任務的人(通常是數據科學家)決定。并沒有絕對正確或者錯誤的組數,但對某一特定的應用,通常可以通過試錯來確定理想的組數。
因為數據沒有標簽,所以聚類者必須為每組指定某種含義或標簽以便清楚地描述(例如運動狂)。然后用模型把新數據分配給某個組,從而假定該組的標簽或描述。可以把這個過程想象成某種形式的預測分類,也就是為每個新數據點分配一個類(通過分組標簽)。
把新數據點(例如客戶)分配給集群(細分市場),會為我們提供一種可以精準定位、個性化以及策略性定位產品的更好方法,并可以用合適的方式來對每個細分市場的客戶進行營銷。
聚類應用包括細分和聚焦市場與客戶、三維醫療影像分析、按照購物習慣分類產品以及社交媒體分析?。
異常檢測是用來檢測異常數據(高度不尋常、偏離常規或畸形)模式的一種技術。異常檢測應用包括基于音頻的缺陷和裂紋檢測、網絡安全、質量控制(例如制造缺陷檢測)以及計算機與網絡系統健康(例如NASA的缺陷和錯誤檢測)。
在網絡安全的異常檢測應用方面,常見的威脅包括惡意軟件、勒索軟件、計算機病毒、系統和內存攻擊、拒絕服務(DoS)攻擊、網絡釣魚、不需要的程序執行、憑據盜竊、數據傳輸和盜竊等。毋庸諱言,這方面的異常檢測場景層出不窮。
06 自然語言
自然語言是人工智能發展與應用中非常有趣且令人激動的領域,通常分成三個子領域:自然語言處理(NLP)、自然語言生成(NLG)和自然語言理解(NLU)。讓我們分別進行討論。
1. NLP
自然語言處理(NLP)輸入文本、語音或手寫形式的語言,經過NLP算法處理后,輸出結構化的數據,如圖6-1所示。現在有很多潛在的NLP場景和輸出。
▲圖6-1:NLP
值得一提的是,有時NLP也被認為是NLG和NLU的超集,因此人工智能自然語言應用在總體上可以被認為是NLP的一種形式。也有人認為它是自然語言應用的特定集合,我們正在討論的就是其中的一部分。
與NLP相關的具體任務和技術包括:
量化和目標文本分析
語音識別(語音轉換為文本)
話題模型(例如話題以及文檔中討論的主題)
文本分類(例如電視劇《權利的游戲》)
情感分析(例如正面、負面、中性)
主體檢測(例如人、地點)
命名識別(例如大峽谷、邁爾斯·戴維斯)
語義相似性分析(例如不同詞和文本之間在總體上意思的相似性)
為部分語音打標簽(例如名詞、動詞)
機器翻譯(例如英文到法文的翻譯)
一個具體的NLP應用涉及公司會議錄音、文本轉換,然后提供會議總結,其中包括圍繞不同話題的分析和會議表現(https://www.chorus.ai)。
另外一個應用采用NLP來對招聘面試進行分析,并根據性別中立性、語調、措辭等因素給出整體評分。它還為提高評分和整體工作描述提供優化建議。
其他的應用還包括:
基于情感的新聞聚合
情感驅動的社會媒體調查以及品牌監控
基于消息板的父母疫苗關注分析
電影評論和產品評論的情感分析
動物聲音轉換
現在有許多云服務提供商通過NLP服務和API接口來提供這方面的一些功能。
2. NLG
NLG以結構化數據的形式來輸入語言,經過NLG算法處理,產生對應語言作為輸出,如圖6-2所示。這種語言輸出可以是文本或者文本轉換為語音的形式。結構化輸入數據的案例可以是比賽中運動員情況的統計數據、廣告效果數據或者公司的財務數據。
▲圖6-2:NLG
應用包括:
根據句子和文檔自動產生文本概述
https://arxiv.org/abs/1602.06023
https://arxiv.org/abs/1603.07252
簡要回顧(例如新聞和體育)
關于圖片的故事
業務分析報告概要
招聘人員參與醫院研究
自然語言形式的患者醫院賬單
夢幻足球選秀總結和每周比賽回顧
房產描述和房地產市場報告
與公司收入報告相關的新聞發布
安德烈·卡帕西創建的模型可以自動產生維基百科文章、嬰兒姓名、數學論文、計算機代碼和莎士比亞的模型。其他的應用包括生成手寫文本甚至創作笑話。
3. NLU
最后,NLU以語言為輸入(文本、語音或手寫),經過NLU算法的處理,產生可以被理解的語言作為輸出,如圖6-3所示。所產生的可理解語言可以用來采取行動、生成響應、回答問題、進行對話等。
▲圖6-3:NLU
“理解”一詞可以非常深奧且具有哲學性質,并會涉及領悟的概念,注意到這一點非常重要。理解所指的能力,往往不僅是領悟信息(與死記硬背相反),而且是把理解的信息與現存知識整合,并以此作為不斷增長的知識基礎。
缺乏與人類相似的語言理解和領悟是今天基于自然語言的人工智能應用的一大缺憾,其根源在于讓機器獲取與人類相似的語言理解能力難于上青天。還記得前面關于人工智能現狀和人工智能難題的討論嗎?這就是一個明證。
在不進行全面哲學討論的情況下,讓我們僅用術語“理解”來表示算法(重申,大大簡化)能夠對輸入語言做更多的工作,而不僅是解析并執行簡單的任務,如文本分析。NLU要解決的問題顯然比NLP和NLG(普通人工智能問題)難得多,而且NLU是實現通用人工智能(AGI)的主要基本組成。
目前的NLU日臻完善,已經有了包括個人虛擬助理、聊天機器人、客戶成功(支持與服務)代理、銷售代理等在內的應用。這些應用通常包括某些形式的手寫內容或語音對話,經常圍繞著信息搜集、問題解答或者某些協助性工具。
個人助理的具體應用案例包括諸如亞馬遜的Alexa、蘋果的Siri、谷歌的Assistant以及Nuance的Nina。聊天機器人的應用案例包括潤滑油專家、工作面試、學生貸款顧問和商業保險專家。這是人工智能研究非常活躍和有潛在發展空間的領域,絕對值得關注。
07 時間序列和基于序列的數據
多數情況下,數據都是按照序列采集的,因此數據的序列極為重要而且由特定索引所確定。
最為常見的數據序列索引是時間,按時間排序的數據被稱為時間序列數據。每天交易時段股票的價格波動、DNA序列、物聯網傳感器數據,以及諸如風向等科學現象,都是時間序列的好例子。
時間序列分析和建模可用于學習、判斷和預測基于時間的事件,包括趨勢、季節變動、循環和噪聲。
對某些特定應用,字母和單詞的序列也是有效的序列數據,這些序列被打上不同的標簽,諸如n-grams、skip-grams、句子、段落,甚至語言本身,其中語言是以語音、文字或者電子的方式來表達的。另外,音頻和視頻也是序列數據。
應用包括:
預測(回歸與分類)
異常檢測
預測貨幣的未來兌換率
健康趨勢的實時追蹤
市場預測
天氣預報
基于序列的推薦
情感分析
DNA測序
文本生成
序列到序列的預測(如機器翻譯)
08 信息搜索、提取、排序和評分
許多強大的人工智能應用都圍繞著信息的搜索、提取和排序(評分)。這特別適用于非結構化和半結構化數據,例如文本文檔、網頁、圖像和視頻。
可以使用這類數據(有時候輔以結構化數據)來提取信息、提供搜索或優化處理推薦,以及按照相關性、重要性或優先級來對條目進行排序或評分。這組技術大多都與個性化有關,因為搜索結果和其他條目可以按照針對某個用戶或群體的相關性的大小排列或排序。
目前,有許多搜索任務都是通過鍵盤輸入或者語音提供給諸如谷歌這樣的搜索引擎,該引擎使用谷歌獨有的人工智能搜索算法。電子商務應用也使用他們自己的引擎來搜索產品,搜索過程可以由文本、聲音(語音)及視覺輸入驅動。
文本搜索包括谷歌搜索、微軟的Bing,以及分布式、透明和社區驅動的搜索。
基于聲音和圖像的搜索應用包括:
衣服和時裝搜索
歌曲和藝術家搜索
Pinterest鏡頭搜索
圖像和視頻搜索
字體搜索
視頻搜索基于圖像內容進行搜索。早就有購物應用采取這種方式。用戶把拍攝的照片提交給視頻搜索引擎。接著用照片產生相似性搜索結果,諸如衣服。有些圖像引擎也能以視覺方式展示相似的其他產品和推薦。
除了分類技術以外,還有排序和評分技術,包括下述這些應用:
銷售線索評分
信息與文檔檢索(例如網頁搜索)
機器翻譯
致病基因搜索與發現
測定蛋白質的順序結構
09 強化學習
強化學習(RL)與這里迄今描述過的人工智能技術迥然不同(簡單回想一下前面提到的人類學習的方法)。基本的想法是有一個代理在虛擬環境中行動以獲得積極的回報。每個動作都會引起環境狀態的變化,而且每個動作都由稱為策略的模型來決定。策略嘗試確定在給定狀態下要采取的最佳操作。
如果暫時不理解請別擔心;我會舉個例子,希望能解釋得更清楚。圖9很形象地展示了強化學習。
▲圖9:強化學習
你可以考慮以游戲《吃豆女士》(Ms. Pac-Man,為何不是Ms. Pac-Woman?)為例。吃豆女士的目標是吃掉屏幕上所有的點,但是更大的目標是從可能吃掉的點中獲得最多的分數。為什么得分最多才是真正的目標?或者說為什么要玩這個游戲?
首先,得分越多,能得到的自由生命就越長,自由生命越長就能玩得越久,就可以繼續積累更多的分數。其次,如果能完成比賽或者創造世界紀錄,就能獲得正式的“吹牛權”,誰不希望呢?
在這種情況下,得分是獎勵,吃豆女士是代理,環境是屏幕,參與其中的人(玩家)是通過操縱游戲控制桿決定采取行動的策略。
當然環境是有狀態的。有一個普通的不易察覺的情況,那就是在吃豆女士吃屏幕上的點和水果時,必須躲開追趕她的幽靈,還有一個不可戰勝的情況,那就是當吃豆女士吃了無敵藥丸(我不知道它到底叫什么)后,她就可以吃掉幽靈從而得到很多額外的分。
決定無敵與非無敵的是環境狀態的變化,也是代理人在環境中能力的變化。
值得一提的是,在人們玩《吃豆女士》游戲的過程中,有時會受完成屏幕目標的驅使,盡可能打通更多關卡而不是得最多分。在這種情況下,人們只會使用無敵狀態來加速,吃盡可能多的不受阻礙的點,可能不會通過吃幽靈來得到最多分。
假設你有強化學習應用,目標是得最多分。在這種情況下,應用將嘗試學習如何做到這一點,也就是吃盡可能多的幽靈和水果。
還有一件事要提,得分是一種積極的回報。碰到幽靈喪命是一種消極的回報。隨著時間的推移,強化應用應該嘗試最大化得分和最小化生命損失。盡管這個例子是在游戲場景中構建的,但是我們可以通過許多其他的方式來使用強化學習。
應用包括:
擊敗圍棋世界冠軍
找到神經網絡的最佳配置
機器人技術
優化藥物劑量
優化交通信號控制
優化化學反應
10 混合、自動化與其他
實際應用的最后一節指出了一些應用,因為涉及多種組合技術,或者不適合已經討論過的任何類別,所以將它們歸類為混合或雜項。
應用案例包括:
自動駕駛汽車和車隊以及自動駕駛航天飛機
實時飛行路線預測和空中交通優化
無人駕駛賽車
倉庫物流和揀配自動化
狗和類人機器人
機器人類人的巧手
珊瑚礁監測水母機器人
醫院病患護理工作自動化
疾病暴發預測
減少冷卻費用
天氣預報
自動化會議協調
預測維護
與物聯網相關的智能系統
人工智能開發的另一個真正有趣的領域是生成性應用,基本上指能從特定類型輸入為給定應用生成某些東西的人工智能。包括下面這些例子:
根據文本生成圖像
生成圖像和圖像區域描述
生成星系和火山的圖像
根據草圖生成圖像
根據歌曲的特點生成音樂
生成多樣化的聲音和語音
合成唱歌
根據設計模型生成軟件代碼
根據文本生成視頻
其他的應用包括風格轉換(例如普通圖像轉換,使梵高或畢加索風格的“藝術”再現)。還有一種被稱為超分辨率成像技術,通過生成缺失的三維圖像數據,將二維圖像轉換為三維圖像。最后,圖像自動著色是另一個有趣的人工智能應用。
責任編輯:YYX
-
人工智能
+關注
關注
1792文章
47425瀏覽量
238963 -
計算機視覺
+關注
關注
8文章
1698瀏覽量
46032 -
推薦系統
+關注
關注
1文章
43瀏覽量
10086
原文標題:盤點人工智能十大經典應用領域、圖解技術原理
文章出處:【微信號:IndustryIOT,微信公眾號:工業互聯網前線】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論