7月5日一早,李彥宏乘坐一輛基于Apollo 技術開發的自動駕駛汽車從百度大廈前往國家會議中心,本次百度AI 開發者大會的進程也隨之徐徐展開。路上,李彥宏還和現場的陸奇進行了連線互動:
百度AI開發者大會(Baidu Create 2017)是全球首個專注于AI開發者的盛會,現場有近5000名開發者和生態合作伙伴出席。在此次大會上,百度宣布開放Apollo和DuerOS 兩大平臺和60項核心AI能力。李彥宏、陸奇在現場發表了演講。
Baidu Create是百度、也是中國工業界第一次大規模的AI 開發者大會。和歷史上的機械化時代、電氣化時代、信息化時代一樣,AI對社會的影響深度和廣度都是空前的,AI將和前三次工業革命一樣,讓人類進入全新的時代。
百度17年的搜索業務和早期的戰略投入,讓我們積累了大量的人才、技術和數據資源。技術方面,百度擁有全球領先的大規模神經網絡;人才方面,百度目前有超過2000個的AI研發人員,有一流的AI研發中心;數據方面,百度有超過百億級的定位數據和萬億級的搜索數據。這使百度成為最有能力、最有機會來推動AI的發展的一個公司。
AI的未來是屬于開發者,開發者是我們工業驅動力、主驅動力,百度的未來是建立在與開發者共贏基礎上。開發者的成功,才是百度真正的成功。這是我們承諾,這也是百度AI平臺的核心價值觀念。AI時代的機會非常多,但是壁壘還很高,百度要為每一位AI開發者解除障礙、創造機會,提供工具、數據、基礎設施,以及良好的開發環境。
“這是一個個人版的開發套件,這是輕量版的開發套件……”在百度AI開發者大會上,百度度秘事業部總經理景鯤接連掏出了三款DuerOS開發套件和一款硬件參考設計。只要接一個電源,接一個麥克風,就能“喚醒萬物”。
在景鯤看來:“喚醒萬物”的核心三要素是要做好“聽清、聽懂、滿足”。
1.“聽清”方面:百度的語音識別準確率達到了97%以上,但這些在AI時代還不夠。在AI時代,我們希望把語音放到真正的場景里面,麥克風陣列、回聲消除、波束成型、語音喚醒、人像識別等,都是我們逐漸推進的世界先進技術,將被放到各種場景中實現用戶聽清的需求。
2.“聽懂”方面:數據多、技術深是打造對話系統的必然條件,具備這兩點才能做好一個真正可以對話的“聽懂”系統。百度是具備數據量最大的公司,我們有十億級的數據和百億級的知識。在AI時代,要做到聽懂用戶,實時圖譜數據的力量將是一個非常重要的支撐。
3.聽懂并滿足“聽一首XX的歌”這樣的用戶需求還不夠,真正用戶想要的是更自然、更復雜的需求,比如“我要聽‘我手一杯品嘗你的美’這首歌”,比如“想聽哥哥的歌”,只有把用戶在真實場景中表達的復雜請求做好,才能真正做出一個真正聽懂用戶需求的產品。
景鯤說:“我們的目標就是要做FreeStyle,讓用戶最自然地跟設備進行交互。”
他還現場演示了與DuerOS的多輪交互對話:
“找一下本地人氣最火爆的家常菜”
“雍和宮附近有嗎”
“第二家有什么推薦菜”
“有wifi嗎”
“好停車嗎”
……
KITT.AI 聯合創始人、CTO陳果果
景鯤在百度開發者大會現場宣布:百度將全資收購KITT.AI,把KITT.AI的技術融入道百度平臺中,全面、免費、正式地向百度的合作伙伴賦能開放。
KITT.AI專注語音喚醒和自然語音交互技術,是唯一一家獲得亞馬遜Alexa和微軟聯合創始人Paul Allen投資的公司,并入選了CB Insights人工智能創業100強。
DuerOS將為開發者提供最容易上手的軟硬件一體化方案,包括多樣化的開發套件和完全開放的參考設計:
1.搭載樹莓派。利用科勝訊技術的個人版。即可申請就可以搭載一個個人可以對話的語音設備。
2.輕量版。把一元錢大小的芯片放在任何一個設備里面,設備就可以對話。
3.標準版。兩麥、四麥、六麥、八麥的標準版都可以即可申請。
4.完整一體化的參考設計。如開放電路板設計、開放結構設計、開放麥克風陣列等等。
從4月19日百度宣布Apollo計劃之后,在短短兩個多月內該計劃得到了工業界廣泛的正面反應。今天,陸奇正式公布了Apollo整體戰略和開放路線圖。
Apollo生態設計是基于一個強大理念和宗旨,即Apollo宣言。Apollo宣言有四個基本原則:
1.開放能力。今天的汽車工業正在走向自動駕駛的未來,但最大痛點是技術壁壘太高,任何一家企業都需要多年技術,人才和數據的累積。百度起步較早,有將近4年的相關積累,并且有強大的持續研發能力。百度將把這些能力開放給合作者,讓他們很快進入自動駕駛研發。
2.共享資源。任何一個Apollo的合作伙伴都可以使用Apollo技術,同時他們都有機會對Apollo生態做貢獻,尤其是貢獻有價值的數據資源。Apollo計劃的共享原則是:你從Apollo生態中獲得的,將遠遠多于你所貢獻的。貢獻的越多,獲得的更多。Apollo受益,合作伙伴更受益。
3.加速創新。這是Apollo的核心所在,因為AI的技術核心是數據+能力。數據的累積、能力的迭代、技術更新的速度是整個工業的關鍵。Apollo生態會將越來越多的數據資源匯總在一起,這樣Apollo每天開過的路就越多,測試的場景會越來越多,而且這個迭代、創新的速度將會不斷的加快。未來Apollo的創新速度和創新能力將超過任何一個封閉體系,Apollo自動駕駛能力一定會領先整個工業。
4.持續共贏。百度的商業模式將基于百度的算法、數據、大規模計算等核心能力,聚焦提供一系列高價值的商業化核心服務。百度所提供的能力,將是目前汽車工業所沒有、可互補的。每個合作伙伴都可以聚焦在自己的核心能力上,用Apollo來加速創新,獲取更多的商業價值。
Apollo的核心技術框架由四層組成:
一、中間是軟件平臺。Apollo開放了一系列重要模塊,重點是以下四大模塊。
1、自定位模塊:使用百度業內領先的高精地圖,加上多種傳感器融合,讓每一輛車都可以低成本、全天候地精準定位。
2、感知模塊:感知是當前自動駕駛工業創新的重點,運用頂尖的人工智能技術能看清和看懂路況,包括每一個障礙物、行人、車輛。
3、車輛規劃控制:Apollo模型運用AI和大數據,采取最安全的駕駛策略做到精確的車輛控制,也能適應不同國家的交通路況。
4、運行框架:它的核心是安全、可靠、實時控制,并能同時支持Intel和NVIDIA的芯片。
二、最上層是服務平臺。Apollo一系列重要的開放能力都匯聚于此。重點包括:
1、高精地圖服務,這是自動駕駛的千里眼。
2、仿真引擎。百度在快速累積海量的數據,能讓開發者日行百萬公里
3、安全服務。百度將為開發者持續提供高度的安全服務。
另外,DuerOS服務將為每一輛車提供智能化的車內用戶體驗。
三、參考硬件平臺和參考車輛平臺。
Apollo硬件平臺支持從CPU到GPU到FPGA各種計算硬件,也支持從GPS、IMU、攝像頭,到激光雷達等各種傳感器。同時,Apollo提供的黑盒子能夠記錄和保存所有的數據信號,使得合作伙伴可以更安全、有效地預防和處理車輛事故。
把所有的模塊加在一起,Apollo能讓每一個開發者從 0 到 1, 快速組裝一輛屬于自己的自動駕駛車。今天正式對外開放Apollo 1.0,它將有三種不同的開放形式:開放代碼、開放數據和開放能力。百度的合作伙伴AutonomouStuff的一位工程師,根據百度今天發布的軟件框架、結合推薦的硬件組合方案,只用了三天時間就改造完成了一輛自動駕駛汽車。
百度今天正式對外開放的是Apollo 1.0。百度開放了封閉場地循跡自動駕駛能力、自定位能力和端到端等非常有價值的數據。更為重要的是,Apollo會快速地開放越來越多的能力,每周都會更新,每兩個月左右都有新的版本和總體能力的提升。
點擊查看大圖
接下來百度的具體計劃是,到今年9月份,Apollo將會開放固定車道自動駕駛能力和開放部分的仿真引擎數據;到今年年底,Apollo將開放一系列新的能力,使車輛能夠在簡單城市路況下,完成自動駕駛任務,同時會開放更多的數據及數據上傳的接口;2018、2019、2020年,Apollo會加強開發能力,加速開放速度,直到最后實現完全自動無人駕駛。
陸奇宣布Apollo生態正式誕生,初始合作伙伴超過50個,陣容豪華,包括:
1.13家優秀的中國汽車制造商和兩家世界一流的汽車制造商——福特和戴姆勒。
2.世界一流的汽車零部件供應商和和芯片公司、傳感器公司、地圖公司、云服務公司、創業公司、研究機構。
3.中國眾多的城市合作伙伴。
陸奇說:今天的Apollo已經是世界上最強大自動駕駛生態。
Apollo的主戰場在中國,它將給中國汽車工業提供最好的創新生態。“我們有信心也有能力,在未來的3-5年內讓中國的自動駕駛站在世界前沿。”陸奇說。
Apollo也是世界的。百度今天宣布,已經成立Apollo美國子公司和新加坡子公司。“我們將在美國、新加坡和當地合作伙伴一起發展自動駕駛汽車業務。這將是中國近代史上,第一次用中國的技術來引領一個巨大工業的全球發展。
1.最完整:百度AI平臺是由百度大腦和百度智能云組成,這是中國最完整、最全面的AI平臺。百度大腦是百度AI平臺的核心,智能云是百度AI平臺的基礎。
2.最開放:百度為開發者提供60種強大的、可組合的AI能力,這個數量遠遠超過其他平臺。包括語音識別,圖像識別,人臉識別,視頻理解,自然語言處理等,不管是質量和數量都是業界領先的。百度語音識別API年增長 300%,圖像識別API月增長 200%。百度PaddlePaddle是國內第一個開源的深度學習計算平臺。
3.最前沿:百度將會開放一系列新的AI能力。在百度大腦,將提供遠場語音識別、視頻理解、增強現實、機器人視覺、自然語言處理平臺等;在百度智能云,將提供新的更簡單易用的云開發平臺。同時,百度為企業客戶提供AI-Stack,這是一個具備AI特性的混合云方案。
4.最有活力、最具生命力:百度自己是最大的AI開發者,也是百度AI平臺的最大使用者。百度絕大部分應用比如搜索、信息流等都在使用百度AI平臺;百度使用AI平臺與與合作伙伴開發了一系列的AI解決方案和智能云生態,比如智能客服、智能銷售、金融大腦、醫療大腦、教育大腦、出行大腦等等。另外,百度AI平臺也在不斷的激發有創意的、有深遠社會意義的新的場景和應用。例如使用AI尋人,幫助老人找回失落多年的親人,使用人臉就在機場馬上登機等。
這一切應用都會持續推進百度AI平臺的發展。最重要的是,百度AI平臺的核心技術經過了長期的積累,以及大量用戶實際應用的考驗,所以最有活力,最有生命力。
一、推出“AI Star計劃”。在3年內幫助培養10萬名AI工程師人才,通過資金、培訓、市場、政策等配套措施,為AI 開發者提供全方位的扶持。
二、舉行第13屆“百度之星”大賽。“百度之星”在中國科技行業極具影響力,歷屆大賽參賽學生數累計已超過20萬。今年大賽將以 “Create for more (豈止創造)”為主題,在傳統的“程序設計大賽”上新增“開發者大賽”,讓更多開發者能有機會參與進來,用最強、最好的AI能力來做創新。
三、攜手長江產業基金助力開發者成功,成立Apollo基金和DuerOS基金,推動中國AI的發展。
1.NVIDIA方面:百度與之達成的合作領域包括四個方面:在Apollo上合作開發自動駕駛技術,NVIDIA將提供Apollo的參考計算硬件;在PaddlePaddle 深度學習平臺上,NVIDIA將專門投入研發團隊使PaddlePaddle將來成為中國最強的深度學習平臺;在DuerOS 和百度智能云上,NVIDIA做深度的合作為開發者提供更好的GPU支持。
2.英特爾方面:英特爾AI產品集團CTO Amir Khosrowsashi介紹,百度和英特爾已經進行了十年的合作,主要有三個合作方面:百度大腦;百度智能云;DuerOS。雙方的合作將讓英特爾在中國有更大的發展空間,百度也將得到更好的結果。Amir表示,英特爾非常重視中國的開發者。今天大會的宗旨是為開發者創造,英特爾也是如此。
李彥宏今天乘坐了兩輛不同的無人車,從百度大廈到達國家會議中心會場。
第一輛是百度和博世共同打造的一輛SUV,這輛車能夠在高速封閉道路上實現自動駕駛。第二輛是在國家會議中心門口換乘的一輛黑色轎車,這輛車除了定位系統,并沒有其他的雷達和傳感器,可以根據人工駕駛的軌跡,實現在封閉園區規定線路上的自動駕駛。
而這輛黑色轎車,就是Apollo計劃第一階段開放的自動駕駛能力,是Apollo計劃的起點,為合作伙伴提供最系統、成熟、門檻最低的方案。這輛車就是前面提到AutonomouStuff的工程師用百度開放的技術花了三天時間改造完成的。
PC互聯網時代,開發者都是從頭開始做,創造了一個偉大的互聯網傳奇。
移動互聯網時代,技術領域沒有太多的創新,對于開發者來說,施展空間并不是很大。
AI時代的到來,讓技術創新重新煥發了生機,PC互聯網時代的個人英雄主義行不通了。AI時代的創新需要算法和數據的雙輪驅動,優秀的算法可以產生越來越多有價值的數據,有價值的數據又會反過來推進算法的進一步提升和改進。這樣無限的循環使得過去幾年的AI技術不斷超越人們的想象。
在古代,人和人之間的溝通是非常低效的,相隔萬里的人無法共享成果。今天是一個完全不一樣的時代,我們沒有必要每個人再“重新發明一遍輪子”。AI大潮到來的時候,我們可以把所有的東西放進“聚寶盆”,只要你去共享、參與,你就能獲得更多。AI是通往未來的必由之路,開放會讓我們所有人獲得更多。
四個開發者的故事,告訴我們世界應該變的更智能
為什么坐飛機,要記著帶身份證還要過排隊過安檢,要各種各樣的等待,不能直接刷一下臉就過去呢?我們已經在南陽實現了這一點。為什么機場都應該不能應該像家人一樣,認識你、歡迎你?每一次新的電器出現的時候,為什么要拿著長長的說明書研究?為什么家庭遙控器要有那么多的按鈕,難以記住它們的功能?這些用AI的力量都可以解決。因為AI,世界會變得更簡單。
這,是開發者的黃金歲月,我們堅信開放能創造最好的時代!
評論
查看更多