機(jī)器學(xué)習(xí)到底意味著什么?
伴隨著這幾年的炒作,機(jī)器學(xué)習(xí)已經(jīng)變得非?!捌胀ā薄5呛芏嗳嗽谡?wù)摶蛘咚伎紮C(jī)器學(xué)習(xí)或者人工智能對我們的經(jīng)濟(jì)體系或者社會帶來什么影響時(shí),還在不斷地重復(fù)著“正確或者不正確的廢話”,比如“數(shù)據(jù)是新的石油”、“人工智能將接管所有的工作”等等。日前,A16Z合伙人,著名分析師Benedict Evans發(fā)表了一篇文章,深入地討論了應(yīng)該怎樣去思考機(jī)器學(xué)習(xí),以及機(jī)器學(xué)習(xí)帶來的影響。文章員標(biāo)題為“Ways to think about machine learning”,由36氪編譯,希望能夠?yàn)槟銕韱l(fā)。
現(xiàn)在,我們進(jìn)入機(jī)器學(xué)習(xí)爆發(fā)階段已經(jīng)有四五年了,幾乎每個人都聽說過它。它的影響不僅僅體現(xiàn)在每天都會有新的創(chuàng)業(yè)公司出現(xiàn),也不僅僅體現(xiàn)在大型技術(shù)平臺公司正在圍繞它進(jìn)行自我改造,還在于《經(jīng)濟(jì)學(xué)人》或《商業(yè)周刊》等雜志都對其進(jìn)行了一系列封面報(bào)道,許多科技行業(yè)之外的大型公司也在推進(jìn)一些相關(guān)的項(xiàng)目。我們知道,這是下一個大事件(Next Big Thing)。
更進(jìn)一步說,我們基本上都在理論層面上對神經(jīng)網(wǎng)絡(luò)有所了解,我們知道,它可能與模式和數(shù)據(jù)有關(guān)。機(jī)器學(xué)習(xí)會讓我們在數(shù)據(jù)中找到某種模式或結(jié)構(gòu),這些模式或結(jié)構(gòu)是隱式和概率性的(因此是需要“推斷”的),并不是顯式的,以前只有人才能找到?,F(xiàn)在,機(jī)器學(xué)習(xí)解決了一些以前“電腦做起來很難,人做起來非常簡單”的問題,或者是說是“人很難向電腦描述”的事情。此外,我們還看到了一些很酷的(或令人擔(dān)憂的,取決于你怎么看)演講和視覺演示。
不過,我認(rèn)為我們對機(jī)器學(xué)習(xí)到底意味著什么還沒有一個明確的概念:即機(jī)器學(xué)習(xí)對科技公司或更廣泛的經(jīng)濟(jì)體系中的公司來說意味著什么?如何從結(jié)構(gòu)上思考它能夠帶來什么新事物?或者說,機(jī)器學(xué)習(xí)對我們所有人意味著什么?它實(shí)際上能夠解決什么重要的問題?
“人工智能”這個術(shù)語并沒有提供任何幫助,情況往往是一提起“人工智能”,相關(guān)的討論就會結(jié)束了。當(dāng)我們說“人工智能”的時(shí)候,就好像電影《2001太空漫游》(2001:A Space Odyssey)中的黑色巨石出現(xiàn)了一樣,我們都變成了猿類,尖叫著揮舞著拳頭。你不能對“人工智能”進(jìn)行分析。
事實(shí)上,我認(rèn)為,我們可以提出一堆對發(fā)展或更深入理解無益的方式來談?wù)摍C(jī)器學(xué)習(xí)當(dāng)前的發(fā)展。例如:
數(shù)據(jù)是新的石油
Google和中國(或者Facebook,或者亞馬遜,或者BAT )擁有所有的數(shù)據(jù)
人工智能將接管所有的工作
當(dāng)然,也有討論人工智能本身
或許,與此相比,更有用的話題可能是:
自動化
支持技術(shù)層
關(guān)系數(shù)據(jù)庫
為什么是關(guān)系數(shù)據(jù)庫?它們是一個新的基礎(chǔ)支持層,改變了計(jì)算的能力。在20世紀(jì)70年代末關(guān)系數(shù)據(jù)庫出現(xiàn)之前,如果你想讓數(shù)據(jù)庫顯示“所有購買這種產(chǎn)品并居住在這個城市的客戶”,通常需要一個定制的工程項(xiàng)目。數(shù)據(jù)庫的結(jié)構(gòu)不能夠使任何隨意的交叉引用查詢都是一件簡單、常規(guī)的事情。如果你想問一個問題,必須有人來去構(gòu)建它。數(shù)據(jù)庫是記錄保存的系統(tǒng);關(guān)系數(shù)據(jù)庫的出現(xiàn),將它們轉(zhuǎn)變?yōu)樯虡I(yè)智能系統(tǒng)。
這改變了數(shù)據(jù)庫在一些重要方面的用途,從而創(chuàng)造了新的用例和價(jià)值數(shù)十億美元的新公司。關(guān)系數(shù)據(jù)庫給我們帶來了Oracle,但也給我們帶來了SAP,SAP和它的同行給我們帶來了全球即時(shí)供應(yīng)鏈——它們給我們帶來了蘋果和星巴克。到20世紀(jì)90年代,幾乎所有的企業(yè)軟件都是一個關(guān)系數(shù)據(jù)庫——PeopleSoft和CRM以及SuccessFactors,還有數(shù)十個類似的軟件都運(yùn)行在關(guān)系數(shù)據(jù)庫上。沒有會說SuccessFactors或Salesforce“永遠(yuǎn)不會成功,因?yàn)镺racle擁有所有的數(shù)據(jù)庫”。相反的是,關(guān)系數(shù)據(jù)庫技術(shù)成為了一個支持層,成為了所有公司的一部分。
所以,這是今天思考機(jī)器學(xué)習(xí)的一個很好的基礎(chǔ)方式。機(jī)器學(xué)習(xí)會是一個步驟,改變我們可以用計(jì)算機(jī)做的事情。它將是不同的公司的不同產(chǎn)品的一部分。最終,幾乎所有的東西里面都會有機(jī)器學(xué)習(xí),也沒有人會去在意。
這里一個重要的相似之處是,盡管關(guān)系數(shù)據(jù)庫具有規(guī)模經(jīng)濟(jì)效應(yīng),但網(wǎng)絡(luò)效應(yīng)或“贏家通吃”效應(yīng)非常有限。如果B公司從同一個供應(yīng)商處購買相同的數(shù)據(jù)庫軟件,但同樣使用這家供應(yīng)商軟件的A公司使用的數(shù)據(jù)庫不會變得更好:如果Caterpillar購買相同的數(shù)據(jù)庫,則Safeway的數(shù)據(jù)庫不會變得更好。機(jī)器學(xué)習(xí)實(shí)際上也是如此:機(jī)器學(xué)習(xí)完全是基于數(shù)據(jù)的,但是數(shù)據(jù)對于特定的應(yīng)用來說,也是特定的。更多的手寫數(shù)據(jù)將會使手寫識別器更好,更多的燃?xì)廨啓C(jī)數(shù)據(jù)也將使預(yù)測燃?xì)廨啓C(jī)故障的系統(tǒng)更好,但一個應(yīng)用的數(shù)據(jù)對另一個應(yīng)用沒有幫助。數(shù)據(jù)是不可替代的。
這就是在談?wù)摍C(jī)器學(xué)習(xí)時(shí)最常見的誤解的核心——在某種程度上,機(jī)器學(xué)習(xí)是一種單一的、通用的東西,在通往HAL 9000(譯者注:《2001太空漫游》中號稱有完美記錄從不犯錯的人類最高科技的結(jié)晶)的道路上,谷歌或微軟各自建立了一個,或者說,谷歌“擁有所有的數(shù)據(jù)”;IBM有一個實(shí)際上被稱為“沃森”的東西。實(shí)際上,使用這種視角來看待自動化是錯誤的:在自動化的每一波浪潮中,我們都想象我們正在創(chuàng)造一些擬人化的東西或具有通用智能的東西。在上世紀(jì)20、30年代,我們想象鋼鐵俠拿著錘子在工廠里走來走去,在50年代,我們想象人形機(jī)器人在廚房里走來走去做家務(wù)。但我們沒有機(jī)器人仆人,我們有用來清洗的機(jī)器。
用來清洗的機(jī)器是機(jī)器人,但它們不是“智能的”。它們不知道什么是水,什么是衣服。而且,即使是在狹窄的清洗領(lǐng)域,它們也不是通用的——你不能把盤子放在洗衣機(jī)里洗,也不能把衣服放在洗碗機(jī)里(或者更確切地說,你可以,但是你不會得到你想要的結(jié)果)。它們是另一種自動化,在概念上與傳送帶或取放機(jī)沒有什么不同。同樣,機(jī)器學(xué)習(xí)可以讓我們解決計(jì)算機(jī)以前無法有效解決的各類問題,但每一個問題都需要不同的實(shí)現(xiàn)方式、不同的數(shù)據(jù)、不同的途徑,而且往往需要不同的公司。它們都是自動化的一部分。每個都是用來清洗的機(jī)器。
因此,談?wù)摍C(jī)器學(xué)習(xí)的挑戰(zhàn)之一,就是在數(shù)學(xué)的機(jī)械解釋和對通用人工智能的幻想之間找到中間地帶。機(jī)器學(xué)習(xí)不會創(chuàng)造HAL 9000 (至少,很少有業(yè)內(nèi)人士認(rèn)為它很快就會創(chuàng)造HAL 9000),但把它稱為“只是統(tǒng)計(jì)數(shù)字”也沒有用?;氐脚c關(guān)系數(shù)據(jù)庫的相似之處上,這可能相當(dāng)于談?wù)?980年的SQ。你可以做令人印象深刻的語音識別和圖像識別演示,但同樣,一家普通公司會怎么做呢?正如前不久美國一家媒體公司的一個團(tuán)隊(duì)對我說的那樣:“嗯,我們知道,我們可以用機(jī)器學(xué)習(xí)來索引十年來我們采訪運(yùn)動員的視頻——但是我們在尋找什么?”
那么,對于真正的公司來說,機(jī)器學(xué)習(xí)中用于清洗的機(jī)器是什么?我認(rèn)為有兩套工具可以用來思考這個問題。首先是從一系列數(shù)據(jù)類型和問題類型的角度來思考:
機(jī)器學(xué)習(xí)可以很好地為你提出的問題(而且你得有相關(guān)的數(shù)據(jù))提供更好的結(jié)果,僅僅作為分析或優(yōu)化技術(shù)。例如,我們的投資組合公司Instacart建立了一個系統(tǒng),來優(yōu)化個人購物者在超市中的路線,這個系統(tǒng)為相關(guān)的超市提供了50%的提升(這是由三名工程師利用谷歌的開源工具Keras和Tensorflow建立的)。
機(jī)器學(xué)習(xí)可以讓你對已有的數(shù)據(jù)提出新的問題。例如,正在找發(fā)現(xiàn)的律師可以用機(jī)器學(xué)習(xí)搜索有關(guān)“憤怒的”電子郵件,或者“焦慮的”或異常的線索或文檔集群,以及進(jìn)行關(guān)鍵字搜索。
第三,機(jī)器學(xué)習(xí)可以用來分析新的數(shù)據(jù)類型——計(jì)算機(jī)以前無法真正讀取音頻、圖像或視頻,但現(xiàn)在,有機(jī)器學(xué)習(xí)的出現(xiàn),這種可能性越來越大。
在這里面,我覺得分析影像是最令人興奮的。以前,只要我們有計(jì)算機(jī),就能處理文字和數(shù)字,但圖像(和視頻)大多是不透明的。現(xiàn)在,它們可以像“閱讀”一樣,去“看到”圖像和視頻。這意味著圖像傳感器(和麥克風(fēng))變成了一種全新的輸入機(jī)制——與其說是“攝像頭”,不如說是產(chǎn)生(潛在的)機(jī)器可讀數(shù)據(jù)流的新的、強(qiáng)大的和靈活的傳感器。今天看起來不像計(jì)算機(jī)視覺方面的問題都將變成計(jì)算機(jī)視覺方面的問題。
這不是關(guān)于識別貓咪圖片的問題。我最近遇到一家為汽車公司提供座椅的公司,它在一個便宜的DSP芯片上安裝了一個神經(jīng)網(wǎng)絡(luò),并配有一個便宜的智能手機(jī)圖像傳感器,用來檢測面料是否有褶皺(我們應(yīng)該期待在非常小的、便宜的小部件中使用各種類似的機(jī)器學(xué)習(xí)用途,只做一件事,就像這里所描述的一樣)。把它描述為“人工智能”是沒有用的:它只是將一項(xiàng)以前無法自動化的任務(wù)能夠自動化了。
這種自動化的感覺是思考機(jī)器學(xué)習(xí)的第二種工具。發(fā)現(xiàn)面料是否有褶皺不需要20年的經(jīng)驗(yàn),它只需要一個哺乳動物的大腦。的確,我的一位同事認(rèn)為,機(jī)器學(xué)習(xí)可以做任何你可以訓(xùn)練狗做的事情,這也是思考人工智能偏差的一個有用的方式(狗到底學(xué)到了什么?訓(xùn)練數(shù)據(jù)中有什么?你確定嗎?你怎么問?),但也是有限的,因?yàn)楣返拇_有通用的智力和常識,不像我們所知道的任何神經(jīng)網(wǎng)絡(luò)。吳恩達(dá)(Andrew Ng)表示,在不到一秒鐘的時(shí)間里,機(jī)器學(xué)習(xí)就可以做任何你能做的事情。談?wù)摍C(jī)器學(xué)習(xí)更像是在尋找一種比喻,但我更喜歡這樣的一種比喻:它給了你無限多的實(shí)習(xí)生,或者是無限多的10歲的孩子。
五年前,如果你給一臺計(jì)算機(jī)一堆照片,它只能按尺寸大小進(jìn)行排序。一個10歲的孩子可以把照片按照男人和女人進(jìn)行分類,一個15歲的孩子可以按照酷和不酷對照片進(jìn)行分類,一個實(shí)習(xí)生可以按照有趣與否來進(jìn)行分類。今天,用機(jī)器學(xué)習(xí),計(jì)算機(jī)可以做10歲和15歲孩子做的事情,它可能永遠(yuǎn)做不了實(shí)習(xí)生做的事情。但是如果你有100萬個15歲的孩子來看你的數(shù)據(jù),你會怎么做?
也就是說,機(jī)器學(xué)習(xí)不需要像有數(shù)十年經(jīng)驗(yàn)專家那樣進(jìn)行判斷。我們不是讓專家自動化。相反,我們會要求“聽所有的電話,找到有憤怒情緒的電話”。讀所有的郵件,找到有焦慮情緒的郵件。看10萬張照片,找到看起來很酷的人。
從某種意義上說,這是自動化一直在做的事情。Excel沒有給我們帶來人造會計(jì)師,Photoshop和Indesign沒有給我們?nèi)嗽靾D形設(shè)計(jì)師,蒸汽機(jī)也沒有給我們?nèi)嗽祚R。(在早期的‘人工智能’浪潮中,國際象棋計(jì)算機(jī)并沒有給我們一個在盒子里的脾氣暴躁的中年俄羅斯人。)相反,我們大規(guī)模地將獨(dú)立的任務(wù)自動化。
在某種意義上說,機(jī)器學(xué)習(xí)不僅能找到人類已經(jīng)能識別的東西,而且能找到人類無法識別的東西,或者找到10歲(或50歲)的人不能識別的模式、推論或暗示的層次。最好的例子是Deepmind 的 AlphaGo。AlphaGo并不像國際象棋計(jì)算機(jī)那樣下棋,而是通過依次分析每一個可能的動作。相反,它被賦予了規(guī)則和一塊棋盤,并讓它試圖自己制定策略,與自己進(jìn)行比人類一生所能做的更多的游戲。也就是說,與其說這是1000個實(shí)習(xí)生,不如說是一個速度非??斓膶?shí)習(xí)生,你給你的實(shí)習(xí)生1000萬張照片,他們回來說“這是一件有趣的事情,但是當(dāng)我看到第300萬張照片時(shí),這種模式就開始出現(xiàn)了”。那么,哪些領(lǐng)域足夠狹窄,我們可以告訴一個機(jī)器學(xué)習(xí)系統(tǒng)規(guī)則(或者給它打分),它能夠讓我們看到所有數(shù)據(jù),就像人類永遠(yuǎn)做不到的那樣,并帶來新的結(jié)果?
我花了相當(dāng)多的時(shí)間拜訪大公司,談?wù)撍鼈兊募夹g(shù)需求,它們通常有一些非常明顯的觸手可及的機(jī)器學(xué)習(xí)成果。有很多顯而易見的分析和優(yōu)化問題,還有很多明顯的圖像識別問題或音頻分析問題。同樣,我們談?wù)?a href="http://m.1cnz.cn/tags/自動駕駛/" target="_blank">自動駕駛汽車和混合現(xiàn)實(shí)的唯一原因是因?yàn)闄C(jī)器學(xué)習(xí)能使它們成為可能——機(jī)器學(xué)習(xí)為汽車提供了一條途徑,去了解周圍情況和人類駕駛員可能會做什么,如果我正在戴一副可以顯示任何東西的眼鏡,這就會為混合現(xiàn)實(shí)提供了一條了解我應(yīng)該看到什么的途徑。但在我們討論了面料是否有褶皺或情緒分析之后,這些公司的相關(guān)人員往往會停下來問,‘那么,還有什么呢?’機(jī)器學(xué)習(xí)還能實(shí)現(xiàn)哪些其他功能,以及它將發(fā)現(xiàn)哪些未知數(shù)?我們大概還有10到15年的時(shí)間,才會對這一切感到無聊。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132938
原文標(biāo)題:著名分析師 Benedict Evans:如何才能真正理解“機(jī)器學(xué)習(xí)”?
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論