在這篇長文里,我將梳理過去 9 年蘋果在人工智能領(lǐng)域的探索,包括以下幾個方面:
喬布斯為何要買下 Siri ?Siri 是如何被蘋果「毀掉」的?為什么 2016 年 WWDC 大會是蘋果 AI 實踐的轉(zhuǎn)折點?Core ML 帶來那三重意義?2018 年蘋果 AI 產(chǎn)品和團隊調(diào)整的意義如何?2019 年蘋果會如何將 iPhone 與 AI 結(jié)合起來?
1. AI 大拿加盟
本月初,CNBC 率先報道了 AI 領(lǐng)域知名學者、GANs(對抗式生成網(wǎng)絡(luò))提出者 Ian Goodfellow 離開 Google 并加入蘋果的消息。
CNBC 發(fā)現(xiàn),Ian Goodfellow 在周四更新了自己的 LinkedIn 個人資料,顯示這位 AI 領(lǐng)域炙手可熱的研究者已經(jīng)在今年 3 月加入蘋果,并成為蘋果「特殊項目小組」的機器學習負責人,該小組直接向蘋果 CEO 庫克匯報。
媒體對于 Ian Goodfellow 的關(guān)注較多,此君在 2013 年以實習生身份加入 Google,一年后,他完成了一篇題為《Generative Adversarial Nets》的論文,該論文提供了一個計算機如何生成圖片的思路——將兩個神經(jīng)網(wǎng)絡(luò)相互對抗。這個方法引發(fā)行業(yè)震動,包括 Facebook AI 首席科學家 Yann LeCun 以及參與 Google Brain 和百度大腦建設(shè)的吳恩達,都肯定了該方法對于機器學習發(fā)展的的重要意義。
值得一提的是,此前「AI 換臉」技術(shù) DeepFake,其核心技術(shù)也是來自 Ian Goodfellow 的發(fā)明。
目前尚不清楚 Ian Goodfellow 會給蘋果帶來哪些變化,考慮其 3 月份剛剛?cè)肼殻?Ian Goodfellow 主要關(guān)注在研究領(lǐng)域,因此可以斷定,短期內(nèi),Ian Goodfellow 的研究不會直接落地到蘋果的產(chǎn)品里。
但 AI 之于蘋果,已然變得越來越重要了。
2. 喬布斯為何收購 Siri
如果以當下的視角去看,蘋果的 AI 探索始于收購 Siri。
作為喬布斯生前收購的最后一家公司,Siri 肩負著喬布斯對于未來交互模式的遠見思考。
正如上圖所示,「互聯(lián)網(wǎng)女皇」 Mary Meeker 在人機交互歷史回顧中中指出,幾百萬年前,人類從聲音的交互開始,而文字的發(fā)明,則讓交互從聲音轉(zhuǎn)入文本階段,于是出現(xiàn)了各種與文本打交道的交互工具。即便如此,人類交流中的 90% 依然還是通過聲音來完成,這種更自然也更原始的交互模式在過去半個世紀里并未得到突破性的進展。
自動語音識別(Automatic Speech Recognition ,簡稱ASR)是一種機器可識別人類說話單詞的能力。很長一段時間里,ASR 在準確度上都無法與人類識別相媲美,而在 2010 年,ASR 在識別準確度上迎來一個拐點。
從上圖的變化可以看出,2010—2015的五年時間,ASR 準確度得到大幅提升,這種變化超過了過去 30 年到 40 年的變化。事實上,我們現(xiàn)在已經(jīng)接近一個時刻:機器對于語音的識別能力即將超過人類。
喬布斯看到了基于聲音的交互才是人類天性的體現(xiàn),而技術(shù)進步則幫助人類重新回到了最原始的聲音交互時代。
Siri 在這種情況下成為蘋果布局聲音交互的重要產(chǎn)品,當時,喬布斯曾被問到收購 Siri 是否想與Google 競爭搜索業(yè)務(wù),喬布斯給出的答案很明確:Siri 不是搜索產(chǎn)品,他們要做人工智能。(他原話是「 [Siri is] not a search company. They're an AI company. We have no plans to go into the search business. We don't care about it -- other people do it well.」)
只可惜,喬布斯并未看到搭載 Siri 的第一部 iPhone—— iPhone 4S 的發(fā)布儀式。彼時, Siri 給世界帶來的驚喜隨著一次次的惡作劇般的調(diào)侃趨于平淡,人們突然發(fā)現(xiàn),Siri 幾乎沒有任何用處。她(他/它)常常答非所問,又經(jīng)常無故跳出(不小心長按 home 健)…..
3. Siri 是如何被玩壞的
如喬布斯當年所言,語音交互正在成為人工智能最有可能爆發(fā)的領(lǐng)域。看看市面上的科技公司們,亞馬遜、微軟以及Google、Facebook,無一不在這個領(lǐng)域發(fā)力。
但蘋果顯然缺乏應(yīng)對之策。自喬布斯逝世后,原來的 Siri 團隊核心成員幾乎都離開了蘋果,包括Siri早期開發(fā)者的Dag Kittlaus 和Adam Cheyer 等人又創(chuàng)立了一家 Viv 的公司,其產(chǎn)品可以理解為新一代的 Siri。
2018 年 3月, 付費科技媒體 The Information 發(fā)表了一篇長文,詳細展示了過去幾年 Siri 是如何被蘋果玩壞的。
文章提到了兩個對立的原因,一方面是負責 Siri 的蘋果老員工 Richard Williamson 被指責沒有創(chuàng)新意識;另一方面 Richard Williamson 則不斷強調(diào) Siri 是一個不成熟的產(chǎn)品,自己作為維護者無法承擔其如此大的責任,或者換句話說,這個鍋應(yīng)該由 Siri 創(chuàng)始團隊來背。
文章同時還指出,蘋果在 2013、2015 年做了兩筆與 Siri 相關(guān)的收購,希望將兩家創(chuàng)業(yè)公司 Topsy 的搜索能力以及 VocallQ 的自然語言理解能力整合到 Siri 里,但結(jié)果并不盡如人意。Information 獲取的消息源稱,Topsy 團隊的成員表示不愿與 Siri 團隊合作,原因是 Siri 的技術(shù)陳舊且無法滿足當下的用戶需求。
隨后蘋果內(nèi)部做了一個「艱難」的決定:放棄對 Siri 的修修補補,重寫 Siri。這也是一個艱巨的任務(wù),此時的 Siri,已經(jīng)成為數(shù)以億計的蘋果設(shè)備里的重要產(chǎn)品,頗具諷刺的是,或許是因為 Siri 太傻,或許 Siri 的打開率太低,重寫 Siri 的過程并沒有在如此龐大的用戶群體掀起多大波瀾。
撇開這些無法確定的事實來看,Siri 無法變得聰明也是蘋果內(nèi)部的必然結(jié)果。
首先,缺乏人才。有媒體盤點過 2015 年蘋果的挖人名單:
2015年年初,前蘇黎世聯(lián)邦理工學院自動系統(tǒng)實驗室副主管Paul Furgale加入蘋果;7月,前意大利經(jīng)典汽車廠商菲亞特克萊斯勒集團質(zhì)檢總監(jiān)Doug Betts加入蘋果。8月,大眾前工程師 Megan McClain、特拉斯前工程經(jīng)理Hal Ockerse、前高級工程師Jamie Carlson加入蘋果。9月,芯片制造商Nvidia公司人工智能專家、深度學習軟件主管Jonathan Cohen 加入蘋果;10月,電動摩托廠商Mission Motors申請破產(chǎn),旗下一部分優(yōu)秀工程師投奔到了蘋果旗下;上述幾位除了Jonathan Cohen 之外都與蘋果汽車項目相關(guān)(當然這個項目如今已經(jīng)被大量裁員)。直到 2015 年 9 月,蘋果才罕見發(fā)布招聘廣告,大規(guī)模招募人工智能和機器學習方面的人才。
其次,蘋果公司文化強調(diào)的保密原則,根本不適用于機器學習領(lǐng)域。這也可以解釋,為何當 Google、Facebook 等公司的機器學習工程師發(fā)布論文,而難見蘋果公司的原因。
這不禁讓人發(fā)問:蘋果在 AI 領(lǐng)域到底是毫無作為還是隱藏實力?
4. iOS 10 開啟了蘋果的 AI 新征程
如果將時鐘撥回到三年前的 WWDC ,蘋果的 AI 探險之路也是從這個時候開始的。與歷年 WWDC 類似,這一次同樣發(fā)布了全新的 iOS——iOS 10。
iOS 10 里,蘋果官方的照片應(yīng)用可以自動識別人臉、物體,并能夠相冊里的人物自動分類,新加入的「回憶」,則可以通過對照片的位置信息、人臉照片信息、場景信息等聚集在一起,還支持插入音樂。
蘋果將上述功能加入到一臺運行 iOS 10 的iPhone中實屬不易,要知道類似的功能在 Google 與微軟那里,都是通過云端數(shù)據(jù)處理后的返回結(jié)果。
蘋果之所以采用這種方法既有歷史原因,也有諸多現(xiàn)實考量。
歷史上看,喬布斯時代的蘋果對人機交互有著異常的堅持,比如 iOS 曾經(jīng)異常的簡潔性——這也意味著毫無選擇性的交互方式。喬布斯也曾表示,如果他來做一款DVD,那么唯一的按鈕就是「燒錄」,其他都可以舍棄。正是這樣對于簡潔性的追求,使得蘋果的產(chǎn)品線長期以來在功能上的變化都極其克制。
喬幫主已仙逝多年,iOS 自 iOS 7 開始在交互上開始復(fù)雜,但將人工智能納入到蘋果產(chǎn)品的過程依然十分緩慢,擺在蘋果面前的現(xiàn)實問題有兩個,其一,蘋果的云服務(wù)不如 Google 和微軟,至今蘋果 iCloud 的服務(wù)還有一部分跑在亞馬遜 AWS 上,這也使得蘋果無法像Google 微軟那樣通過云端強大的處理性能來處理照片分類、語音識別等。
其二,蘋果長期以來的價值觀就是對用戶隱私的保護。以虛擬助理來說,Siri 早在 2011 年就已經(jīng)發(fā)布,但比起Google Now、微軟的 Cortana 來說,Siri 真的很不智能,原因就在于Siri對于用戶數(shù)據(jù)的收集非常少,而另外兩家公司的產(chǎn)品則有點「貪得無厭」,尤其是Google,默認的用戶協(xié)議里,Google 可以收集用戶幾乎所有的數(shù)據(jù)為其所用。
但現(xiàn)實則是,時下流行的深度學習,迫切需要海量數(shù)據(jù)的「喂養(yǎng)」。這一年的 WWDC 上,蘋果也重新定義了所謂「大數(shù)據(jù)」,正式啟動蘋果的「Differential Privacy」,這個概念由微軟的C. Dwork 提出,其基本含義就是基于統(tǒng)計學原理,在一個群體層面收集數(shù)據(jù),而非像FB、Google 那樣收集個體的數(shù)據(jù)。
由于蘋果的 iMessage、 FaceTime 早已部署了端到端的加密技術(shù),因此能夠讓用戶數(shù)據(jù)以加密的方式上傳到蘋果的服務(wù)器,然后蘋果在對于這些群體層的數(shù)據(jù)進行分析和優(yōu)化,從而改善用戶的體驗。
2016 年秋天,隨著新 iPhone 設(shè)備的發(fā)布,iOS、macOS 等系統(tǒng)里也開始集成「Differential Privacy」。而到了這年冬天,在一個行業(yè) AI 大會的非開放會場,新晉上任的蘋果公司機器學習負責人 Russ Salakhutdinov 介紹了蘋果在自動駕駛、神經(jīng)網(wǎng)絡(luò)、AI 芯片等領(lǐng)域的思考,這是幾乎是蘋果首次向外界(至少是學術(shù)界)透露自己的 AI 布局。
也是在 12 月,Russ Salakhutdinov 還代表蘋果宣布了另一項重大決定:蘋果將會允許自己的AI研發(fā)人員公布自己的論文研究成果!
緊接著,蘋果在 2017 年 7 月正式發(fā)布了機器學習博客,利用這個平臺發(fā)布一系列圍繞 AI 的研究進展,其第一篇博客談如何基于小規(guī)模數(shù)據(jù)訓(xùn)練,實現(xiàn)算法的提升,其中也提及使用 GANs 的思路。
5. 如何讓開發(fā)者加入蘋果 AI 生態(tài)?
2017 年可以說是蘋果正式向外界展示 AI 能力的開始。這一年的 WWDC 大會上,蘋果向世界展示了自己對于 AI 之于手機的新思考:幫助開發(fā)者將 AI 能力帶入到智能手機里,或者說,幫助開發(fā)者將 AI 帶入 iOS。
這年的 WWDC 發(fā)布的 Core ML 野心巨大。坦率來說,Core ML 并不是第一個將機器學習引入智能手機的開發(fā)平臺。2017 年的 5 月的 Google I/O 大會上,Google 發(fā)布了面向移動設(shè)備的機器學習框架 TensorFlow Lite,使得開發(fā)者可以方便地在移動端部署 AI 應(yīng)用。
但蘋果 CoreML 的出現(xiàn),對于行業(yè)以及蘋果而言有三重意義。
其一,相比于其他的機器學習框架,CoreML 堅持了蘋果一貫以來的「設(shè)備智能」的原則,從訓(xùn)練到部署,都在設(shè)備端展開,這充分展現(xiàn)了蘋果的「AI 價值觀」,也因為蘋果的巨大影響力,能夠引發(fā)整個機器學習行業(yè)對于數(shù)據(jù)、隱私的關(guān)注。
其二,對于開發(fā)者而言,蘋果的硬件生態(tài)依然擁有巨大的吸引力,基于 iOS 體系下的用戶基礎(chǔ)依然是一個金礦。上月的蘋果軟件服務(wù)發(fā)布會上,有一組數(shù)字足夠震撼,如下圖所示,iOS 上的游戲玩家已經(jīng)突破 10 億。
這樣的硬件生態(tài)和用戶基礎(chǔ),也將吸引更多開發(fā)者加入到蘋果對于未來的應(yīng)用體驗定義之中,從 AR 到 AI,App Store 上的應(yīng)用生態(tài)也在變得越來越多元化。
其三,對于蘋果來說,正是 App Store 以及上面的開發(fā)者成就了蘋果當下無可爭議的「第一生態(tài)」,在當下 iPhone 銷量下滑、iPad 無法接力的現(xiàn)實語境,Core ML 也成為提升 iOS 應(yīng)用體驗(討好消費者)、推動 iOS 應(yīng)用開發(fā)創(chuàng)新(討好開發(fā)者)的重要產(chǎn)品。
2018 年的 WWDC 上,Core ML 進入 2.0 時代,提供了更小、更快也給更容易定制的機器學習模型,同時也大幅提升了訓(xùn)練、部署速度。可以預(yù)見,兩個月之后的 WWDC 還會有更多的升級。
6. 蘋果開始認真做 AI 了嗎?
事實上,2018 年蘋果在 AI 領(lǐng)域最大突破則是將 John Giannandrea 招致麾下。這位在 Google 工作 8 年,先后負責機器智能、搜索團隊的大拿的到來,標志著蘋果開始認真做起了 AI。
根據(jù) TechCrunch 的報道,2018 年 7 月,蘋果內(nèi)部對于 AI 團隊做了調(diào)整。將 Core ML 和 Siri 團隊合并,由 John Giannandrea 統(tǒng)一領(lǐng)導(dǎo),并直接向庫克匯報。
這次人員調(diào)整也讓這一年 WWDC 上推出的 Siri Shortcuts 具有更令人看好的前景。基于 Siri Shortcuts,第三方應(yīng)用開發(fā)者可以將快速將自己應(yīng)用的某些功能「輸送」給 Siri,實現(xiàn)最快的語言喚醒。
而到了 2018 年 12 月,蘋果官方宣布 John Giannandrea 晉升為管理團隊成員,其職位名稱為「機器學習和 AI 戰(zhàn)略高級副總裁」。
在蘋果官方新聞稿里,對 John Giannandrea 的工作范圍做了這樣的介紹:
Giannandrea oversees the strategy for AI and Machine Learning across all Apple products and services, as well as the development of Core ML and Siri technologies. His team's focus on advancing and tightly integrating machine learning into Apple products is delivering more personal, intelligent and natural interactions for customers while protecting user privacy. ......
Giannandrea’s team is also helping to enhance the developer experience with tools including Core ML and Create ML, making it easier and faster to integrate machine learning into apps.
通過上面的架構(gòu)圖以及對 John Giannandrea 職位范圍的整理,可以清晰地看到蘋果對于 AI 的重視程度,至此,AI 也成為蘋果體系內(nèi)與零售、服務(wù)、軟件、設(shè)計并列的核心業(yè)務(wù)。而 John Giannandrea 在學術(shù)界以及工業(yè)屆的號召力,也將進一步帶動蘋果 AI 領(lǐng)域的人才積累和研究突破,如今,隨著 Ian Goodfellow 的到來,蘋果在 AI 領(lǐng)域的話語權(quán)也越來越大。
那么問題來了,蘋果會如何定義手機 AI?
7.2019 iPhone 的 AI 如何體現(xiàn)?
過去五年,正是人工智能再一次成為主流技術(shù)潮流的五年,同時也是智能手機由盛而衰的五年,而智能手機于人工智能的結(jié)合,也是近兩年來的新潮流。
包括蘋果在內(nèi)的智能手機行業(yè),必須面對一個殘酷的事實:盡管所有人都知道 AI 會給手機帶來變革,但沒有人知道到底從何處入手,以及如何去做。
如果結(jié)合蘋果以及其他公司的實踐,或許我可以提供幾個值得關(guān)注的線索。
第一,操作系統(tǒng)。Google 與蘋果,作為全球兩大移動 OS 提供商,肩負著如何將 AI 植入 Android 和 iOS的重任,好在 5 月、6 月的兩場開發(fā)者大會將讓我們見識這兩家公司的具體策略;
第二,語音。去年亮相的 Google Duplex 已經(jīng)擴大到更多設(shè)備,這是語音技術(shù)的一次巨大突破,相比于更漂亮的實驗室數(shù)據(jù),基于實際應(yīng)用場景的 Duplex 或許并不完美,但卻提供了語音技術(shù)應(yīng)用的新場景。
與此同時,蘋果的 Siri Shortcuts 的確在一定程度上提高了 iOS 的自動化能力,但還沒有完全激發(fā)出開發(fā)者、消費者的使用熱情,隨著蘋果在越來越多設(shè)備里加入可隨時喚醒的 Siri,Siri Shortcuts 可以提供更多應(yīng)用空間。
第三,圖像/攝像頭。2018 年,Google 和華為分別從軟件(計算機視覺)、硬件(面積更大的傳感器)定義了兩個不同的手機拍照路線(詳見這期會員通訊),盡管蘋果也在 2018 年用智能 HDR 予以還擊,但在夜景上還是完敗。
這也讓外界好奇 2019 年 iPhone 的拍照能力是否可以實現(xiàn)新的突破,不管是硬件還是軟件,蘋果的確需要拿出一個好相機,挽回正在丟失的用戶。
-
蘋果
+關(guān)注
關(guān)注
61文章
24465瀏覽量
199581 -
喬布斯
+關(guān)注
關(guān)注
0文章
81瀏覽量
15214 -
AI
+關(guān)注
關(guān)注
87文章
31490瀏覽量
269907
原文標題:從Siri閉門造車到開放機器學習,詳解蘋果 AI 實踐的三個階段
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論