近日,谷歌邀請媒體在京舉行視頻電話會議,谷歌產(chǎn)品經(jīng)理Sagar Savla介紹了Live Transcribe軟件,這是一項免費的Android服務,通過將自動字幕技術(shù)融入日常會話,減少現(xiàn)實世界中的對話障礙。
據(jù)了解,通過自動語音識別技術(shù) (ASR),計算機能夠檢測有聲語言并將其現(xiàn)場轉(zhuǎn)錄為供閱讀的文本,由Google云提供技術(shù)支持,Live Transcribe可以進行實時的對話字幕轉(zhuǎn)錄,支持超過70種語言,覆蓋全球80%以上的人口。
Sagar Savla表示,雖然依靠云ASR能為我們提供更高的準確性,但Google希望可以減少Live Transcribe所需的網(wǎng)絡流量消耗。為此,Google在先前AudioSet的工作基礎上,實現(xiàn)了基于神經(jīng)網(wǎng)絡的設備語音檢測器。該網(wǎng)絡是一種圖像式模型,類似于我們之前發(fā)布的VGGish模型,它可以檢測語音并自動管理與云ASR引擎的網(wǎng)絡連接,將長時間使用過程中的數(shù)據(jù)流量消耗降至最低。
在技術(shù)呈現(xiàn)方面,Google曾考慮了幾種不同的模式:計算機、平板電腦、智能手機、小型投影儀,以迭代方式顯示聽覺信息和字幕。最后,Sagar Savla的團隊決定專注于智能手機模式,因為這類設備無處不在且功能日益強大。
資料顯示,世界衛(wèi)生組織預計,到2055年全球?qū)⒂芯艃|人聽力受損。谷歌的這項軟件可以為他們帶去便利。目前該軟件在亞洲已經(jīng)非常流行。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
原文標題:谷歌解讀免費實時轉(zhuǎn)錄軟件:面向聽障人士 支持70種語言
文章出處:【微信號:smartman163,微信公眾號:網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
近期推出的 Android XR SDK 開發(fā)者預覽版是一款適用于 Android XR 的綜合開發(fā)工具套件。它是 Android 系列中最新的平臺,專為擴展現(xiàn)實 (XR) 頭顯設備
發(fā)表于 01-10 10:13
?144次閱讀
Gitee 支持的常見編程語言: Python :一種廣泛使用的高級編程語言,以其清晰的語法和代碼可讀性而聞名。 Java :一種
發(fā)表于 01-06 09:50
?111次閱讀
“增強殘疾人領導力,共創(chuàng)包容且可持續(xù)的未來”是今年國際殘疾人日的主題。在中國,每16個人中便有一位殘障人士,占全國總?cè)丝诘?.34%。他們不光有被關(guān)愛的需求,也有權(quán)利享受人工智能時代的美好生活。
發(fā)表于 12-06 15:02
?653次閱讀
夠協(xié)助用戶完成諸如收集研究資料、購買產(chǎn)品或預訂航班等各種日常任務,從而極大地提升用戶的生活便捷性和效率。通過智能分析用戶的瀏覽行為和需求,該項目將為用戶提供個性化的建議和服務,使用戶能夠更加輕松地完成各種任務。 此外,知情人士還透露,谷
發(fā)表于 10-29 15:11
?379次閱讀
Orin是一款高度集成、高性能的車載計算平臺,由英偉達推出,并采用了英偉達自家的Volta架構(gòu)GPU和其他高級處理器技術(shù)。關(guān)于Orin芯片的編程語言支持,可以從以下幾個方面進行介紹: 一、主要編程
發(fā)表于 10-27 16:45
?372次閱讀
沃達豐近日宣布,其與全球科技巨頭谷歌的戰(zhàn)略合作伙伴關(guān)系得到了進一步深化。這一為期十年的協(xié)議,總價值超過10億美元,旨在將谷歌最新推出的生成式人工智能
發(fā)表于 10-09 16:22
?293次閱讀
倉頡編程語言是一種面向全場景應用開發(fā)的通用編程語言,可以兼顧開發(fā)效率和運行性能,并提供良好的編程體驗,主要具有如下特點:
語法簡明高效 :倉頡編程語
發(fā)表于 08-15 10:00
8月8日,谷歌宣布對其Android設備流媒體服務進行重大擴展,此舉旨在進一步賦能開發(fā)者,讓他們能夠遠程接入并測試更多品牌及型號的真實Android物理設備。自2014年該
發(fā)表于 08-08 16:30
?723次閱讀
倉頡編程語言是一種面向全場景應用開發(fā)的通用編程語言,可以兼顧開發(fā)效率和運行性能,并提供良好的編程體驗,主要具有如下特點:
語法簡明高效 :倉頡編程語
發(fā)表于 07-30 17:49
近日,谷歌面向全球科研界與開發(fā)者群體隆重推出了全新升級的Gemma 2大語言模型,標志著人工智能技術(shù)在語言處理領域的又一次重大進步。此次發(fā)布
發(fā)表于 07-02 10:20
?525次閱讀
在人工智能領域,大語言模型一直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大語言模型——Gemma 2。這款模型以其高效能和低成本的特點
發(fā)表于 06-29 09:48
?470次閱讀
自 2022 年起,谷歌加大了對 Android Health 平臺的投入力度,以期實現(xiàn)平臺統(tǒng)一性以及簡化開發(fā)流程。公告指出,谷歌正逐步將 Fit 開發(fā)服務納入
發(fā)表于 05-06 11:27
?540次閱讀
高通技術(shù)公司和谷歌今日宣布,即日起推出面向搭載驍龍的Windows PC的優(yōu)化版Chrome瀏覽器,先于2024年年中即將發(fā)布的搭載驍龍?X Elite計算平臺的PC面市。
發(fā)表于 03-27 14:05
?615次閱讀
谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌DeepMind團隊開發(fā)的一款大型
發(fā)表于 03-01 16:20
?717次閱讀
谷歌在Android Developer官網(wǎng)發(fā)表聲明,因發(fā)現(xiàn)“已知問題”,將暫時關(guān)閉Android 15 DP1的OTA更新訂閱服務。谷歌解
發(fā)表于 02-21 14:08
?724次閱讀
評論