從微軟亞洲研究院到金山,再到上周退休,張宏江博士可以說見證了中國企業服務市場發展,日前他也來到了36氪Wise2016企業服務年會現場,在現場獲得企業服務終身成就獎的同時,張宏江博士也為我們分享了他對企業服務未來的一些看法。
在大數據方面,張宏江拿AlphaGo舉例,它的訓練數據遠遠超過人類大師一輩子的數據,再加上它900多個CPU,2800個GPU的計算能力,它的段位已經非常接近人類的大師了。“這是在比賽之前,沒有考慮過其他的因素在里面,它的數據已經非常領先了?!倍趪逯猓驍祿?0%的增長速率增加,沃爾瑪每4小時會產生2.5PB的數據量,推特每天有5億條帖子更新。
關于AI是否會取代人類,張宏江博士也給出了跟李開復類似的觀點,人工智能的應用是有局限的,必須具備大數據、邊界清晰、外部反饋、頂尖數據科學家和計算資源五個條件。
張宏江認為AI+大數據的應用會成為企業的標配,“過去是分析、現在是預測、未來是認知?!倍贏I和數據方面,都離不開云計算,它已經成為IT主流技術,云也成為了成長最快的2B產業。
在給出AI+大數據+云=企業服務的未來的結論后,創業公司該怎么做?張宏江博士也給出了建議:
AI+大數據+云會跟所有新技術出現后,帶來的商業機會稍縱即逝,創業者需要前瞻性眼光
需要很快的積累起我們的技術能力、工程能力,產生技術壁壘
需要有工匠精神,能夠不斷的改善我們的算法和分析能力,為企業提供更好的服務
以下為張宏江博士演講實錄:
我今天講的題目企業服務的三個階段是緊扣的,可以把它叫做3.0+或者是企業服務4.0。如果我們回憶一下2016年有什么樣的主題始終貫穿著互聯網、整個企業服務軟件的市場、整個IT的市場,一定是三個主題:人工智能,大數據和云計算。
為什么這么說?
人工智能是我做過很多年的領域,那今天就從人工智能談起,2016年的一件大事是在3月份AlphaGOvs李世石,很多人不知道AI這個詞是什么,也不知道AI到底有多厲害,但AlphaGo贏了韓國的圍棋大師,這具有里程碑的意義。
差不多在20年前,AI贏過俄羅斯的國際象棋大師,這20年間,人工智能走了非常長的路,在這個事情發生以后,很多人都認為人工智能將會統治世界。我不知道在座大家在這比賽前有沒有人知道人工智能到底是怎么回事,有沒有人跟你的同事下過賭,到底是機器贏還是人能贏,我下了賭,而且贏了錢。
這塊有很重要的原因在里面,我為什么認為AlphaGo可以戰勝人類的圍棋大師,很重要的是背后的深層支撐,實際上今天終于有足夠的計算能力,今天終于有足夠多的數據,今天有人工智能算法(機器學習算法)。
我尤其要強調的是在數據和算法這塊,人類大師一輩子能下好幾千場真正的高質量的比賽,但是AlphaGo在它的有限的生命中間,和人類的6到9段的選手下過1.6萬次,同時3000萬次的機器對局,因為它本身沒有所謂的感性的因素,所以自己可以跟自己下,所以這兩個數據使得它的訓練數據遠遠超過人類大師一輩子的數據。
再加上它的非常強的計算資源,900多個CPU,2800個GPU這樣的資源,它的段位已經非常接近人類的大師了。這是在大師比賽之前,沒有考慮過其他的因素,也就是說它的數據量比人類大師領先很多了。
所以真正的在AlphaGo背后隱藏的動力,其實是我們所說的大數據和強計算加上新的算法。這是今年發生的最熱的一件事情背后真正的原因。
那么我們談到大數據,在過去的幾年中間談得非常多,也有人發出大數據時代是不是已經過去的疑問,其實不是,而是剛剛開始,而且隨著人工智能的發展,大數據的應用將會越來越廣泛。
過去的幾年間隨著移動互聯網的發展,人類的數據其實在爆炸性的增長,根據IDC的調查,整個人類所創造的數據大概是4.4Z,到了2020年這個數字會再增長10倍,如果你用一個標準的蘋果的Ipad,里面有128G的內存,你把這44個Z存進去的話,可以從地球到月亮來回走9次。
比如說沃爾瑪在2013年每4個小時產生的數據到了2.5PB,今天推特每天推的文字就5億條,微信一天在朋友圈分享的照片就是10億張,今天中國的存量照片是300億張,但是企業界的數據增長的速度同樣非???。
我還是用移動互聯網的例子,現在手機上非常普遍的應用就是照片,這種照片越來越多以后,你在手機上發現管理照片是個問題,所以兩年前大部分的手機都開始出現叫做照片自動分類的云服務,包括根據人臉進行分類,當你看到這些照片的時候,你以前只能根據地點和時間進行分類,今天就可以知道根據人的面孔,把你的朋友、家人進行分類。假如我的手機上有雷軍的照片,我就點一下他的照片,你發現所有他出現的照片全部都幫你找出來了,這背后用的技術是人工智能人臉識別的技術,這個技術今天在所有第一線的平臺上都已經出現了。
這件事情在AI的歷史上走了幾十年,以我的專利為證,這是我1997年在惠普實驗室申請的專利,這個專利基本的核心是:當照片進來以后我做一個人臉檢測、人臉特征的提取,從而進行比對,而且我20年前就已經預測到這個體系很難在一個體系上實現,而需要一個分布的體系,所以它是一個分布式的數據庫系統,今天看來這個東西就是手機。
這個專利是在2000年批準的。但是這件事兒至少在我看到走了20年,20年前這件事兒是非常難做的,除了算法沒有今天這么先進之外,更重要的是我們的數據不夠。所以以我來看過去20多年,計算機對人臉識別的發展就是一個數據庫和計算能力的擴張。90年代初的時候你用的訓練數據就是幾百張、幾十人,到了十年前,已經到了幾萬張或者是幾十萬張,我們能夠用的人數也是到了幾千個,真正到了過去的三五年,計算機或者是人工智能開始超過人的數量,一個典型的情況就是谷歌和Facebook在2015年年初的時候開始用大量的數據,包括著2億張照片,800萬人,因為有這么多數據所以能支撐起非常龐大的深度學習的網絡,從而能夠訓練出識別準確率超過99.63%的算法和人臉識別系統。
當我們訓練數據用了260萬張的時候,識別率大概在76%,用了2.6萬張的時候,識別率增長了10%,這是沒有經過仔細的調優的情況下你可以看到數據對于識別精度的影響,同樣當你用到算法的復雜度和計算能力之間也一樣,只有當計算能力不斷提高復雜度和精確度才能支撐起來。我的觀點還是說數據和計算能力是AI背后的主要推動力。
在過去的兩年中國企業在這方面異軍突起,領先了國際市場,也領先了國際的學術的領域,這些從微軟研究院衍生出來的這些公司,他們都做到了世界上最好的人臉識別系統,原因是他們都和微軟研究院也許,更重要的是今天他們都有大量的數據,中國人口最多,中國的攝象頭最多,攝象頭密度最高。這一系列的數據使得我們能夠做到最好的識別系統。
除了人臉之外,我們知道只要你做了壞事兒,只要在路上任何一個角落拍了你一張照以后,你基本上插翅難逃了,除了人臉識別以外,AI在什么領域會超過人類,這是我們今天講的核心內容,AI已經在一系列的領域會替代人工,除了在人臉識別、下棋以外,在翻譯、新聞記者的采編,尤其是財經記者的采編,在行政助理、警察、出租車、股票交易員、會計,包括保姆都會在今后的5到10年內很大的程度上被AI所取代。
為什么?你問自己幾個問題,你可不可以像AlphaGo一樣一天下幾百萬盤旗,人類能不能像特斯拉那樣每天從路上超過20萬輛跑的車上收取數據,能不能像所有遍布于各個機場、各個火車站的攝象頭那樣見到那么多人。正是因為這些無窮無盡的數據使得AI有越來越強的能力,從而他們不光是能夠識別出人,而且比人類聽懂更多的語言。
所以我們也同樣相信這一切也會改變我們今后的企業服務的形態。你會問一個問題,是不是AI能取代所有的行業、所有的工種,所有的任務,很重要的一點,一定是在有大數據的情況下才能做到很好的AI系統,一定要有一撥很好的頂尖的科學家才能把這些數據形成很好的體系,從而有很好的算法,也需要有大量的計算機的資源。
其實在這里面我們也知道,無論是計算機資源,還是科學家這些你都能找打到,對于創業企業來說,但是大數據對創業企業是個挑戰,你從哪能夠獲取這么多數據。
大家會問一個問題,到底多少數據足夠多?在大數據的分析里面,我們從來說沒有太多的數據,數據從來不夠,因為很重要的。用傳統AI的方式,性能也是隨著數據的增加而不斷的增加的,用最新的算法增加的數會更快,或者是飽和的速度會更慢。這是很重要的一點,當你沒有數據的時候,用的最新的算法你的性能也只會在這兒,不會在這兒,尤其是我們今天碰到的越來越復雜的場景,你所需要的數據會越來越多。重要的是說當你的覆蓋度、數據精度這兩點達到一定程度以后,對于傳統模型的依賴才會減少,缺少數據的時候才會做出一個模型來。
今天我們看大數據對于企業有什么影響,我想用美國一個調查的數據舉例,大數據的應用已經非常廣泛了,60%的IT公司里面,大數據已經成為日常中間開始使用,在商業和專業服務的公司里面也有將近一半的公司在用,金融47%的公司,最傳統的制造業和零售業這個數字也在逐漸的上升,所以我們知道今天在我們的企業服務行業里面,數據已經變成下一個新的宗教。
過去傳統對大數據的依賴使用它來做統計,我們知道過去發生了什么,我們很快用它來做分析,我們想知道這是為什么發生,今天更多大家在用到預測,未來會發生什么,未來我想我們會用到它,最大的會是認知,我們對于任何一個商業決策的反饋,從簡單的知識到智能的演化過程,這個是今天大數據開始在企業服務里面發揮作用的一個核心原因。
當你有了大數據,有了先進的算法,像一開始演示的,在手機上做人臉識別,你可能認為手機本身有如此強大的功能,但是我想告訴你所有的計算都是在云端進行的,你的照片拍完以后是把它送到云端去,在云端進行了人臉的檢測和識別,在云端搜索了聯系人的數據庫,從而返回到照片的人臉的信息,也就是說如果沒有后端,沒有云端的大規模的存儲、大規模的計算、大規模的數據分析一系列的計算的功能,今天做不到我們說的智能。
云計算已經成為主流技術,今天已經不像三年前,你談云計算別人會認為你談在云里霧里是在忽悠,今天云計算已經成為IT真正的主流,今天創辦一家公司,你需要大量的計算資源的時候,你想到的不是自己再去并購一個數據中心,再去買大量的服務器,而是利用今天已經有的大量的云服務的提供商他們所能提供的云計算。
中國的云計算能力這個市場是非常廣大的,潛力是無限的,因為我再分享一個數據,IDC在去年年底做了中國公有云市場的報告,中國公有云市場,包括SaaS、IaaS,所有的公有云的市場收入的總量只占美國同類收入總量的3%多。但
但中國的互聯網市場哪個領域我們只是美國的3%多?要么是跟美國同樣的檔次,要么比美國還要大。就算再小一點,我們至少是美國的一半,當你看到一個迅速成長的市場,今天市場的整個規模只有美國的3%的時候,你知道這個市場有多大,所以中國的云市場潛力無限。
最后我想總結一下,在我們談企業服務的時候,尤其在談新時代的企業服務,有三點我們要進行充分的考慮:
首先人工智能、大數據和云計算能力,會像以前所有的技術一樣,任何一個新的技術出現,它的機會稍縱即逝,對于AI、大數據、云這樣的現象級的技術的爆發,需要的是有非常前瞻的眼光,順勢而為的能力;需要很快的積累起我們的技術能力、工程能力;我們也需要有工匠精神,能夠不斷的改善我們的算法和分析能力,從而我們能夠真正的為企業提供最好的新時代的企業服務。謝謝大家!
張宏江:AI+大數據+云=企業服務的未來
?
?
首先是人工智能,張宏江博士分享了他在AlphaGoVS李世石期間贏錢的趣事,這場舉世矚目的比賽也讓大眾對AI的能力有了初步的認知,“差不多在20年前,人工智能的機器贏過俄羅斯的國際象棋,但是這20年,人工智能走了非常長的路?!睆埡杲┦勘硎具@背后其實是大數據、新算法和強計算的支撐。在大數據方面,張宏江拿AlphaGo舉例,它的訓練數據遠遠超過人類大師一輩子的數據,再加上它900多個CPU,2800個GPU的計算能力,它的段位已經非常接近人類的大師了。“這是在比賽之前,沒有考慮過其他的因素在里面,它的數據已經非常領先了?!倍趪逯猓驍祿?0%的增長速率增加,沃爾瑪每4小時會產生2.5PB的數據量,推特每天有5億條帖子更新。
關于AI是否會取代人類,張宏江博士也給出了跟李開復類似的觀點,人工智能的應用是有局限的,必須具備大數據、邊界清晰、外部反饋、頂尖數據科學家和計算資源五個條件。
張宏江認為AI+大數據的應用會成為企業的標配,“過去是分析、現在是預測、未來是認知?!倍贏I和數據方面,都離不開云計算,它已經成為IT主流技術,云也成為了成長最快的2B產業。
在給出AI+大數據+云=企業服務的未來的結論后,創業公司該怎么做?張宏江博士也給出了建議:
AI+大數據+云會跟所有新技術出現后,帶來的商業機會稍縱即逝,創業者需要前瞻性眼光
需要很快的積累起我們的技術能力、工程能力,產生技術壁壘
需要有工匠精神,能夠不斷的改善我們的算法和分析能力,為企業提供更好的服務
以下為張宏江博士演講實錄:
我今天講的題目企業服務的三個階段是緊扣的,可以把它叫做3.0+或者是企業服務4.0。如果我們回憶一下2016年有什么樣的主題始終貫穿著互聯網、整個企業服務軟件的市場、整個IT的市場,一定是三個主題:人工智能,大數據和云計算。
為什么這么說?
人工智能是我做過很多年的領域,那今天就從人工智能談起,2016年的一件大事是在3月份AlphaGOvs李世石,很多人不知道AI這個詞是什么,也不知道AI到底有多厲害,但AlphaGo贏了韓國的圍棋大師,這具有里程碑的意義。
差不多在20年前,AI贏過俄羅斯的國際象棋大師,這20年間,人工智能走了非常長的路,在這個事情發生以后,很多人都認為人工智能將會統治世界。我不知道在座大家在這比賽前有沒有人知道人工智能到底是怎么回事,有沒有人跟你的同事下過賭,到底是機器贏還是人能贏,我下了賭,而且贏了錢。
這塊有很重要的原因在里面,我為什么認為AlphaGo可以戰勝人類的圍棋大師,很重要的是背后的深層支撐,實際上今天終于有足夠的計算能力,今天終于有足夠多的數據,今天有人工智能算法(機器學習算法)。
我尤其要強調的是在數據和算法這塊,人類大師一輩子能下好幾千場真正的高質量的比賽,但是AlphaGo在它的有限的生命中間,和人類的6到9段的選手下過1.6萬次,同時3000萬次的機器對局,因為它本身沒有所謂的感性的因素,所以自己可以跟自己下,所以這兩個數據使得它的訓練數據遠遠超過人類大師一輩子的數據。
再加上它的非常強的計算資源,900多個CPU,2800個GPU這樣的資源,它的段位已經非常接近人類的大師了。這是在大師比賽之前,沒有考慮過其他的因素,也就是說它的數據量比人類大師領先很多了。
所以真正的在AlphaGo背后隱藏的動力,其實是我們所說的大數據和強計算加上新的算法。這是今年發生的最熱的一件事情背后真正的原因。
那么我們談到大數據,在過去的幾年中間談得非常多,也有人發出大數據時代是不是已經過去的疑問,其實不是,而是剛剛開始,而且隨著人工智能的發展,大數據的應用將會越來越廣泛。
過去的幾年間隨著移動互聯網的發展,人類的數據其實在爆炸性的增長,根據IDC的調查,整個人類所創造的數據大概是4.4Z,到了2020年這個數字會再增長10倍,如果你用一個標準的蘋果的Ipad,里面有128G的內存,你把這44個Z存進去的話,可以從地球到月亮來回走9次。
比如說沃爾瑪在2013年每4個小時產生的數據到了2.5PB,今天推特每天推的文字就5億條,微信一天在朋友圈分享的照片就是10億張,今天中國的存量照片是300億張,但是企業界的數據增長的速度同樣非???。
我還是用移動互聯網的例子,現在手機上非常普遍的應用就是照片,這種照片越來越多以后,你在手機上發現管理照片是個問題,所以兩年前大部分的手機都開始出現叫做照片自動分類的云服務,包括根據人臉進行分類,當你看到這些照片的時候,你以前只能根據地點和時間進行分類,今天就可以知道根據人的面孔,把你的朋友、家人進行分類。假如我的手機上有雷軍的照片,我就點一下他的照片,你發現所有他出現的照片全部都幫你找出來了,這背后用的技術是人工智能人臉識別的技術,這個技術今天在所有第一線的平臺上都已經出現了。
這件事情在AI的歷史上走了幾十年,以我的專利為證,這是我1997年在惠普實驗室申請的專利,這個專利基本的核心是:當照片進來以后我做一個人臉檢測、人臉特征的提取,從而進行比對,而且我20年前就已經預測到這個體系很難在一個體系上實現,而需要一個分布的體系,所以它是一個分布式的數據庫系統,今天看來這個東西就是手機。
這個專利是在2000年批準的。但是這件事兒至少在我看到走了20年,20年前這件事兒是非常難做的,除了算法沒有今天這么先進之外,更重要的是我們的數據不夠。所以以我來看過去20多年,計算機對人臉識別的發展就是一個數據庫和計算能力的擴張。90年代初的時候你用的訓練數據就是幾百張、幾十人,到了十年前,已經到了幾萬張或者是幾十萬張,我們能夠用的人數也是到了幾千個,真正到了過去的三五年,計算機或者是人工智能開始超過人的數量,一個典型的情況就是谷歌和Facebook在2015年年初的時候開始用大量的數據,包括著2億張照片,800萬人,因為有這么多數據所以能支撐起非常龐大的深度學習的網絡,從而能夠訓練出識別準確率超過99.63%的算法和人臉識別系統。
當我們訓練數據用了260萬張的時候,識別率大概在76%,用了2.6萬張的時候,識別率增長了10%,這是沒有經過仔細的調優的情況下你可以看到數據對于識別精度的影響,同樣當你用到算法的復雜度和計算能力之間也一樣,只有當計算能力不斷提高復雜度和精確度才能支撐起來。我的觀點還是說數據和計算能力是AI背后的主要推動力。
在過去的兩年中國企業在這方面異軍突起,領先了國際市場,也領先了國際的學術的領域,這些從微軟研究院衍生出來的這些公司,他們都做到了世界上最好的人臉識別系統,原因是他們都和微軟研究院也許,更重要的是今天他們都有大量的數據,中國人口最多,中國的攝象頭最多,攝象頭密度最高。這一系列的數據使得我們能夠做到最好的識別系統。
除了人臉之外,我們知道只要你做了壞事兒,只要在路上任何一個角落拍了你一張照以后,你基本上插翅難逃了,除了人臉識別以外,AI在什么領域會超過人類,這是我們今天講的核心內容,AI已經在一系列的領域會替代人工,除了在人臉識別、下棋以外,在翻譯、新聞記者的采編,尤其是財經記者的采編,在行政助理、警察、出租車、股票交易員、會計,包括保姆都會在今后的5到10年內很大的程度上被AI所取代。
為什么?你問自己幾個問題,你可不可以像AlphaGo一樣一天下幾百萬盤旗,人類能不能像特斯拉那樣每天從路上超過20萬輛跑的車上收取數據,能不能像所有遍布于各個機場、各個火車站的攝象頭那樣見到那么多人。正是因為這些無窮無盡的數據使得AI有越來越強的能力,從而他們不光是能夠識別出人,而且比人類聽懂更多的語言。
所以我們也同樣相信這一切也會改變我們今后的企業服務的形態。你會問一個問題,是不是AI能取代所有的行業、所有的工種,所有的任務,很重要的一點,一定是在有大數據的情況下才能做到很好的AI系統,一定要有一撥很好的頂尖的科學家才能把這些數據形成很好的體系,從而有很好的算法,也需要有大量的計算機的資源。
其實在這里面我們也知道,無論是計算機資源,還是科學家這些你都能找打到,對于創業企業來說,但是大數據對創業企業是個挑戰,你從哪能夠獲取這么多數據。
大家會問一個問題,到底多少數據足夠多?在大數據的分析里面,我們從來說沒有太多的數據,數據從來不夠,因為很重要的。用傳統AI的方式,性能也是隨著數據的增加而不斷的增加的,用最新的算法增加的數會更快,或者是飽和的速度會更慢。這是很重要的一點,當你沒有數據的時候,用的最新的算法你的性能也只會在這兒,不會在這兒,尤其是我們今天碰到的越來越復雜的場景,你所需要的數據會越來越多。重要的是說當你的覆蓋度、數據精度這兩點達到一定程度以后,對于傳統模型的依賴才會減少,缺少數據的時候才會做出一個模型來。
今天我們看大數據對于企業有什么影響,我想用美國一個調查的數據舉例,大數據的應用已經非常廣泛了,60%的IT公司里面,大數據已經成為日常中間開始使用,在商業和專業服務的公司里面也有將近一半的公司在用,金融47%的公司,最傳統的制造業和零售業這個數字也在逐漸的上升,所以我們知道今天在我們的企業服務行業里面,數據已經變成下一個新的宗教。
過去傳統對大數據的依賴使用它來做統計,我們知道過去發生了什么,我們很快用它來做分析,我們想知道這是為什么發生,今天更多大家在用到預測,未來會發生什么,未來我想我們會用到它,最大的會是認知,我們對于任何一個商業決策的反饋,從簡單的知識到智能的演化過程,這個是今天大數據開始在企業服務里面發揮作用的一個核心原因。
當你有了大數據,有了先進的算法,像一開始演示的,在手機上做人臉識別,你可能認為手機本身有如此強大的功能,但是我想告訴你所有的計算都是在云端進行的,你的照片拍完以后是把它送到云端去,在云端進行了人臉的檢測和識別,在云端搜索了聯系人的數據庫,從而返回到照片的人臉的信息,也就是說如果沒有后端,沒有云端的大規模的存儲、大規模的計算、大規模的數據分析一系列的計算的功能,今天做不到我們說的智能。
云計算已經成為主流技術,今天已經不像三年前,你談云計算別人會認為你談在云里霧里是在忽悠,今天云計算已經成為IT真正的主流,今天創辦一家公司,你需要大量的計算資源的時候,你想到的不是自己再去并購一個數據中心,再去買大量的服務器,而是利用今天已經有的大量的云服務的提供商他們所能提供的云計算。
中國的云計算能力這個市場是非常廣大的,潛力是無限的,因為我再分享一個數據,IDC在去年年底做了中國公有云市場的報告,中國公有云市場,包括SaaS、IaaS,所有的公有云的市場收入的總量只占美國同類收入總量的3%多。但
但中國的互聯網市場哪個領域我們只是美國的3%多?要么是跟美國同樣的檔次,要么比美國還要大。就算再小一點,我們至少是美國的一半,當你看到一個迅速成長的市場,今天市場的整個規模只有美國的3%的時候,你知道這個市場有多大,所以中國的云市場潛力無限。
最后我想總結一下,在我們談企業服務的時候,尤其在談新時代的企業服務,有三點我們要進行充分的考慮:
首先人工智能、大數據和云計算能力,會像以前所有的技術一樣,任何一個新的技術出現,它的機會稍縱即逝,對于AI、大數據、云這樣的現象級的技術的爆發,需要的是有非常前瞻的眼光,順勢而為的能力;需要很快的積累起我們的技術能力、工程能力;我們也需要有工匠精神,能夠不斷的改善我們的算法和分析能力,從而我們能夠真正的為企業提供最好的新時代的企業服務。謝謝大家!
?
評論
查看更多