編者語:以下是我們在 2023 年 Google I/O 大會上公布的內容摘要。
Google 已經走過了七年“AI 為先” 的旅程,現在正處于一個激動人心的轉折點。我們有機會讓 AI 為人類、企業、社區,甚至我們每個人帶來更多幫助。
在過去的一段時間里,我們一直在利用 AI 讓我們的產品更加有用。伴隨生成式 AI 的出現,我們邁出了下一步,以一種大膽而負責任的方式,重新構想我們所有的核心產品,包括 Search。
將 AI 融入產品
Gmail 的 “Help me write” 功能
有一些很好的例子可以說明生成式 AI 如何幫助我們提升產品,首先談一談 Gmail。2017 年,我們推出了 Smart Reply 這一功能,只需輕擊鼠標,即可選擇簡短的回復。接下來是 Smart Compose 功能,可以在用戶輸入時提供寫作建議。Smart Compose 不斷完善,實現了由 AI 驅動的更先進的寫作功能,并且僅在過去一年中,在 Workspace 中就被使用了超過 1800 億次。現在,通過更強大的生成式模型,我們在 Gmail 中推出了更先進的功能 “Help me write”。
假設你收到一封電子郵件,提示你的航班被取消了。航空公司已經發送了一張代金券,但你真正想要的是全額退款。你可以使用“Help me write”來回復。
只需輸入你想要的提示信息:“一封要求全額退款的電子郵件”,然后點擊“創建”,一份完整的草稿就會出現。它直接從上一封電子郵件中提取到了航班詳情,看起來非常接近你想要發送的內容,或許你想再修改一下。在這種情況下,一封內容更詳細的電子郵件可能會增加獲得退款的幾率。“Help me write” 將作為我們 Workspace 更新的一部分推出。就像 Smart Compose 一樣,隨著時間的推移,它會變得越來越好。
Google Maps 中新沉浸式路線視圖
自推出 Street View 以來,AI 已經將數十億張全景圖片拼接在一起,讓人們可以在自己的設備上探索世界。在去年的 I/O 大會上,我們又推出了沉浸式視圖,即利用 AI 創建一個地方的高保真地圖,讓用戶可以在到達之前就先獲得身臨其境般的體驗。
現在,我們正在將同樣的技術擴展到 Maps 最擅長的領域:幫助用戶到達目的地。Google Maps 每天提供 200 億公里的路線指引——這是一個非常大的量。想象一下,如果你能提前看到整個旅程……現在,通過沉浸式路線視圖 (Immersive View for routes),無論你是步行、騎車還是駕車,都可以實現這一點。
假設你在紐約市,想騎自行車出去玩,Maps 給了你離你很近的地方作為選擇。海濱的那個看起來風景很優美,你想先感受一下。點擊“沉浸式路線視圖”,用一種全新的方式來感受你的旅行,放大地圖你可以獲得一個令人難以置信騎行路線的鳥瞰視圖。
它還可以提供更多的信息。你可以查看今天的空氣質量、交通和天氣情況,并了解它們未來可能的變化。
沉浸式路線視圖將在夏季推出,并在今年年底前在 15 個城市上線,包括倫敦、紐約、東京和舊金山等。
在新沉浸式路線視圖下騎行紐約
Photos 中全新的 Magic Editor 體驗
另一個通過 AI 得以提升的產品是 Google Photos。我們在 2015 年的 I/O 大會上介紹了該產品,它也是我們首批 AI 原生產品之一。得益于機器學習的突破,它可能在照片中搜索人物、日落或瀑布等元素。
當然,我們希望用戶做的不僅僅是搜索照片——還希望幫助用戶把照片變得更好。事實上,每個月有 17 億張圖片在 Google Photos 中被編輯。AI 的進步為我們提供了更多強大的方法來實現這一點。例如,率先在 Pixel 上推出的 Magic Eraser 可使用 AI 驅動的計算攝影來消除不必要的干擾。今年晚些時候,我們將推出結合語義理解和生成式 AI 的Magic Editor,用戶將會獲得更多新的體驗。
例如,這是一張很精彩的抓拍照片,但作為父母,你可能希望孩子的位置更居中一些,并且照片中,氣球看起來像是被切掉一部分,所以你可以去重新調整孩子的位置。Magic Editor 會自動重現原始照片中沒有捕捉到的長凳和氣球的部分。作為點睛之筆,你甚至可以把天空調高,同時照片其他部分的光線也會隨之改變,所有的編輯都是連貫一致的。這確實很神奇!我們很高興能在今年晚些時候在 Google Photos 中推出 Magic Editor。
一張使用 Magic Editor 編輯的照片
讓 AI 更好地助力每個人
從 Gmail 和 Photos 到 Maps,這些只是 AI 如何在重要時刻提供幫助的幾個例子。我們還可以做更多的事情,在你熟悉和喜愛的產品中充分挖掘 AI 的潛力。
今天,我們有 15 個為個人和企業提供幫助的產品用戶數都超過了 5 億,其中 6 個產品的用戶數已超過了 20 億。這給了我們很多機會來踐行我們的使命——整合全球信息,供大眾使用,使人人受益。
這是一個永恒的使命,隨著時間的推移,它變得越來越重要。展望未來,讓 AI 助力每一個人是我們推進這一使命最深入的方式。我們正通過四個重要方法來實現這一目標:
首先,通過提升用戶的知識和學識,加深他們對世界的理解。
第二,通過提高創造力和生產力,幫助用戶表達自己并把事情做好。
第三,通過賦能開發者和企業,幫助他們打造具有變革性的產品和服務。
最后,通過負責任地創建和部署 AI,使每個人都能平等受益。
PaLM 2 和 Gemini
我們對未來的機會感到非常興奮。讓 AI 助力每一個人的能力在于不斷推進我們的基礎模型。因此,我想用一點時間來分享我們是如何去實現的。
去年,你們都了解到了 PaLM,它給我們的產品帶來了許多改進。今天,我們已準備好宣布最新的 PaLM 模型并已投入使用:PaLM 2。
PaLM 2 建立在我們的基礎研究和最新的基礎設施之上, 在各種任務中都具有很強的能力,并且易于部署。我們今天將宣布超過 25 種由 PaLM 2 支持的產品和功能。
PaLM 2 模型在各種規模的情況下都能提供出色的基礎功能。我們親切地將它們命名為 Gecko、Otter、Bison 和 Unicorn。Gecko 非常輕巧,可以在移動設備上工作,其速度快到足以在設備上運行出色的交互式應用程序,即使在離線的狀態下。由于對科學和數學課題進行了廣泛的訓練,PaLM 2 模型的邏輯和推理能力更強。它還接受了逾百種的多語言文本訓練,因此它能夠理解并生成精確的結果。
結合強大的編碼能力,PaLM 2 還可以幫助世界各地的開發人員進行合作。假設你正在與首爾的一位同事一起工作,并且正在調試代碼。你可以要求它修復錯誤,并通過在代碼中添加韓文注釋來幫助你的同事。它首先識別代碼是遞歸的,然后建議修復。它會解釋修復背后的原因,并按照你的要求添加韓文注釋。
盡管 PaLM 2 的功能已經非常強大,但當用特定領域的知識對它進行微調后,它的表現會更加出色。我們最近發布了針對安全用例進行了微調的 Sec-PaLM。它通過 AI 來更好地檢測惡意腳本,并能夠幫助安全專家理解和解決威脅。
另一個例子是根據醫學知識進行了微調的 Med-PaLM 2。與基礎的模型相對比,這種微調使不準確的推理減少了 9 倍,接近于回答同一組問題的臨床醫生專家的表現。事實上,Med-PaLM 2 是第一個在醫學執照考試上展現出 "專家 "水平的語言模型,展現出目前的最高技術水平。
我們還在努力增加 Med-PaLM 2 的功能,使其能夠結合醫學影像信息,如平片和乳房 X 光檢查。你可以想像一個 AI 協作者幫助放射科醫生解釋圖像和交流結果。這些是 PaLM 2 被用于專業領域的一些例子。我們迫不及待地想看到它被用于更多的領域。我很高興地宣布 PaLM 2 現在已經有了預覽版。
PaLM 2 是我們十年以來,用負責任的方式將 AI 帶給數十億人的旅程中的最新進展。它建立在 Google Brain 和 DeepMind 兩個世界頂級研究團隊所取得的進展之上。
回顧過去十年 AI 的重大突破,上述團隊做出了相當數量的貢獻,包括 AlphaGo,Transformers 和序列對序列模型等。所有這些都為我們今天所處的轉折點奠定了基礎。
我們最近將這兩個團隊合并為 Google DeepMind,利用 Google 的計算資源,讓他們專注于創建安全和負責任的更強大系統。
這其中有我們在訓練中的下一代基礎模型 Gemini。它從一開始就被創建為多模態、高效的工具和 API 集成,以支持未來的創新,如內存和規劃。盡管它還處于早期階段,但我們已經看到在以往模型中沒有出現的多模態能力,這讓人印象深刻。
經過微調和嚴格的安全測試后,Gemini 將像 PaLM 2 一樣適應多重體量模式和功能。
AI 的責任:識別生成式內容的工具
隨著我們不斷投入能力越來越強大的模型,我們也在深入研究 AI 應當肩負的責任,這包括讓用戶擁有可識別出合成的生成式內容工具。
水印和元數據是兩個重要方式。水印將信息直接嵌入到內容中,即使經過適度編輯的圖像,水印也能保存其中。展望未來,我們正在建立自己的模型,讓水印從開始就融入其中。如果你看到一張合成圖片,發現它如此真實,令人印象深刻,這也是為什么這項責任如此重要。
元數據允許內容創作者將額外的背景信息與原始文件關聯,每當你看到一張圖片時,元數據就會提供其背景信息。我們將確保,每一張由 AI 生成的圖像都會綁定這種元數據。
Bard 和 Workspace 的更新
隨著模型變得更好、更強大,最令人興奮的機會之一是人們可以直接參與其中。
這就是 Bard 帶給我們的機會——對話式 AI 實驗。我們正在迅速提升 Bard, 目前它已支持廣泛的編程功能,并在推理和數學提示方面更加智能。并且,從今天起,它將完全運行在 PaLM 2之上。
我們還為 Google Workspace 帶來了新功能。除了在 Docs 和 Gmail 中的“Help me write”功能外,Google Workspace 的 Duet AI 提供了一些工具,可以在 Slides 和 Meet 中從文本描述中生成圖像,在 Sheet 中創建自定義計劃等等。
介紹 Labs 和 Search 的新生成式體驗
隨著 AI 不斷的快速升級,我們專注于為用戶帶來更有用的功能。從今天開始,我們為用戶提供了一種新的方式,來預覽 Workspace 和其他產品中的部分體驗。這就是 Labs。雖然我說這是一種新方式,但是 Google 使用 Labs 作為一種早期訪問和獲得反饋的方式已經有很長的歷史了,用戶可以在今天晚些時候開始注冊。
除了你們剛才看到的 Workspace 功能外,能夠在 Labs 測試的首批體驗之一是我們的創始產品——Google Search 。多年前,我們之所以開始深入投資 AI,就是因為我們看到了讓 Search 變得更好的機會。隨著每一次的突破,我們都讓它變得更加便利和直觀。
語言理解能力的提高讓我們可以更自然地提出問題,并在網絡上找到最相關的內容。計算機視覺的進步引入了新的視覺搜索方式。現在,即使用戶沒有用語言來描述要搜索的內容,也可以用 Google Lens 搜索任何看到的東西。事實上,Lens 每個月完成的視覺搜索超過 120 億次,短短兩年就增長了 4 倍。結合了多模式的 Lens 可以實現多模式搜索,即讓用戶使用圖像和文本同時進行搜索。
展望未來,Google對信息的深刻理解與生成式 AI 強大能力的結合,將會再次改變 Search 的工作方式,解鎖 Search 可以回答的全新問題,并帶來越來越多更有幫助的體驗,將用戶與網絡世界的豐富內容相連接。
當然,將生成式AI用于搜索仍處于早期階段。世界各地的人們在重要時刻都依賴于Search,我們知道,做好這一點并繼續贏得他們的信任是多么重要。這始終是我們一直不變的努力方向。
因此,我們一直以負責任的態度來推進創新,一如既往地為追求最高的信息質量而努力。這就是為什么我們在Labs最先為用戶帶來 Search 新生成式體驗(new Search Generative Experience)的原因。
幫助他人創新更加便捷
AI 不僅僅是一個強大的賦能工具,它也代表著平臺的大轉變。所有企業和組織都在思考如何推動轉型。因為,我們一直專注于幫助他人能更便捷地利用 AI 進行創新,并使其具有可拓展性。
這意味著我們要提供最先進的計算基礎設施,并擴大對 Google 最新基礎模型的訪問,包括最先進的 TPU 和 GPU。這些模型已經通過嚴格的測試,并已集成到我們自己的產品之中。我們還在努力提供世界一流的工具,以便客戶能夠訓練、調整和運行他們自己的模型,助力其具備企業級的安全、保密和隱私保護。
用 Android 推動進步
我們對 AI 大膽和負責任的做法可以釋放人們的創造力和潛力。我們也想確保這種幫助能夠盡可能助力更多人。通過像 Android 這樣的計算平臺,我們做到了這一點,今天我們將分享 AI 的進步如何讓手機更加個性化,包括 Magic Compose (魔法撰寫)、Cinematic Wallpapers(電影壁紙)和Generative AI Wallpapers (生成式 AI 壁紙)。
介紹適合您口袋和家庭的新Pixel設備
今天,我們還將推出 Pixel 7a、Pixel Fold 和 Pixel Tablet,打造了 Google 完整的 AI 設備生態系統。Pixel 7a 從今天起開始發售,Pixel Fold 和 Pixel Tablet 的預售也已開放。
共建未來
我一直在思考我們都曾經歷過的重大技術變革。AI 帶來的變革將與它們一樣劇烈,這就是為什么我們要讓 AI 能夠助力每一個人,這一點非常重要。我們用激情和勇氣大膽地去接近這一目標。同時,我們也非常負責任地進行探索,以保證我們的努力能夠取得方向正確的成果。
沒有任何一家公司能夠獨立完成這一切。我們的開發者社區將是解鎖未來巨大機遇的關鍵。我們期待與大家共同合作,一起構建未來。
審核編輯 :李倩
-
Google
+關注
關注
5文章
1772瀏覽量
57721 -
AI
+關注
關注
87文章
31490瀏覽量
269915 -
模型
+關注
關注
1文章
3298瀏覽量
49075
原文標題:在 I/O 看未來 | Google I/O 2023: 讓 AI 更好地助力每個人
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發者】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論