色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

依圖強勢進軍智能語音,聯合微軟發布語音開放云平臺

DPVg_AI_era ? 來源:lq ? 2018-12-14 09:43 ? 次閱讀

依圖強勢進軍智能語音,聯合微軟發布語音開放云平臺,攜手華為發布軟硬件一體化的智能語音聯合解決方案。依圖語音識別算法在全球最大開源中文數據庫AISHELL-2上詞錯率僅3.71%,比原業內領先者提升約20%,大幅刷新現有紀錄。比對各家語音識別算法,當今智能語音戰場,英雄唯訊飛與依圖爾?

2018年底,智能語音市場意外殺入一匹黑馬。

素來被認為是“人臉識別獨角獸”——或者更寬泛一點說,“計算機視覺獨角獸”的依圖科技,公布了他們中文語音識別技術的最新突破,以及令人矚目的產業布局。

技術上,在全球最大的中文開源數據庫AISHELL-2中,依圖短語音聽寫的字錯率(CER)達到3.71%[1],相比原業內領先者提升約20%,大幅刷新現有紀錄。

產業上,依圖聯合微軟推出基于Azure云服務的語音開放平臺,并攜手華為發布軟硬件一體化的“智能語音聯合解決方案”,將依圖語音識別技術提供給第三方應用開發者

依圖首席創新官呂昊博士

“語音一直以來都是依圖關注的課題。作為對人工智能有著深入理解和推廣應用的公司,我們自然而然進入語音識別領域。”依圖首席創新官呂昊博士表示,依圖是一家“人工智能公司”。

“作為語音行業的‘新生’,我們還是有很多向‘老生’學習的地方,但我們立志推動行業創新與發展,做世界最好的中文普通話語音識別技術。”

智能語音競爭還未開始,依圖要做世界最好的中文語音識別

萬物互聯,語音為先。

語音識別是AI理解世界最重要的組成部分,也是AI能聽會說善理解的必要條件。

近年來,深度學習的爆發驅動了語音識別技術的高速發展,催生了一大批智能語音創業公司,其中不乏實力強勁的競爭者。

除了中國智能語音“一哥”科大訊飛,百度、阿里、騰訊、京東等企業紛紛推出了智能語音產品,再加上雄踞國際戰略高點的亞馬遜、谷歌、微軟……2017年底掀起的智能音箱“百箱大戰”硝煙還未褪去,依圖為何選擇這個時間點入局?

“我覺得競爭都還沒開始,不存在入場的問題。”依圖科技聯合創始人林晨曦在2018年1月接受新智元采訪時說。

智能語音市場看似巨頭林立,但林晨曦認為創業公司大有可為,依圖不僅要做語音和自然語言處理,還要做到像人臉識別那樣,超越人類水平。

依圖技術負責人表示,盡管一些機構宣傳其語音識別已經達到乃至超越了人類水平,但多數情況下,這些結果都來自安靜、近場等受限場景。

“機器在語音環境比較理想的情況下是可以識別某些生僻詞,或者在專有名詞等識別方面比人強。但人的魯棒性還是強于機器,人在熟人且熟悉領域上的語音識別還是明顯能夠做過算法。”

目前語音識別仍然存在很多瓶頸,例如在發音不清楚的情況下,如何結合更強的上下文語義信息給出準確的語音識別;如何在語音識別的全鏈路上,優化遠場識別的性能;特殊情況的處理,比如人稱代詞、語氣詞助詞;還有雞尾酒問題(多人同時說話下,能夠準確識別其中一人的語音)、電話場景的識別(低采樣率下的語音識別)。

此次依圖科技在語音識別技術方面的突破,不僅意味著依圖首次涉足語音識別領域便已經躋身中文語音識別第一陣營,同時也說明語音識別在技術層面還有足夠的進化空間,遠遠沒有達到“超越人類”。

依圖預計,在未來6個月到12個月,語音識別技術的算法性能將呈指數級增長,更多的場景將被解鎖,為行業應用帶來更大的價值。

科大訊飛和依圖屬于第一梯隊,BAT差得遠

作為進軍智能語音的第一步棋,依圖發布了“聽寫大會”微信小程序,它能將時長不超過60秒的語音轉寫成文字,支持普通話,并且兼容多種口音。

“聽寫大會”微信小程序:業界也屬于首次公開透明地比對各類算法的水平差異

不過,“我們希望大家不要僅僅是關注在API本身,”依圖首席創新管呂昊表示:“我們希望借助這個API,讓大家去關注到整個語音識別行業的發展情況。”

呂昊說,一直以來語音識別業界都沒有公開透明的語音識別比對,通過“聽寫大會”微信小程序,用戶可以直觀感受到各家語音識別技術的真實表現,在業界也屬于首次公開透明地比對各類算法的水平差異。

訊飛依圖BAT各家算法差異巨大,訊飛依圖位列第一陣營

“目前語音識別業界存在兩種認知誤區,”呂昊說:“一種是極端的好,也就是各家都好沒有差異;一種是極端的差,認為都不能解決問題。”

實際情況是,“科大訊飛的語音識別能力比BAT領先很多。在場景測試中,除了依圖和科大訊飛之外,大部分廠家的算法字錯率抖動大,意味著場景的通用性差。”

依圖此次推出的中文語音識別算法,與業內原有領先者相比,不僅大幅提升了識別準確率,而且在單個算法模型上,有極為出色的多場景適用性表現。

一般認為,中文語音識別的字錯率低于3%時不會影響可讀性,而超過15%則毫無可讀性。這是語音識別的兩條紅線,在不同場景下,不同算法的表現可能會有很大差異。

在全球最大中文開源數據庫AISHELL-2[2] 的三個測試子集,以及來自第三方的近場口音測試集(Accent)、近場安靜聊天測試集(Chat)、語音節目測試集、電話測試集、遠場測試集等測試場景中,依圖均處于業界領先水平,而且字錯率幾乎全部在15%以下。

其中,在AISHELL2的-2018A-EVAL數據集中,依圖的識別準確率高達96.29%,字錯率僅為3.71%,領先第二名約20%。

這意味著依圖在語音領域做到了第一梯隊 (甚至是領先) 的水平,在多場景的適用方面,也體現出顯著優勢。

左有微軟,右有華為,用技術想象力撬動語音市場

“依圖的語音API產品和語音開放平臺剛剛上線,我們歡迎越來越多的開發者和客戶使用依圖的產品,共同改進產品性能,并探討更具突破性的應用場景。”呂昊說。

關于未來預計推出的語音產品及其功能,呂昊表示,“實際上,我們認為技術和場景是比產品和功能更關鍵的要素,推動了技術發展進步,我們才可以領略到以前看不到的更多可能性,解決很多以前想象不到的問題。今天語音識別跟人類的能力還有巨大的差距,依圖希望能夠攜手業界共同推動行業進步。”

發布會上,依圖宣布與微軟Azure云服務聯合發布語音開放平臺,將行業領先的語音識別技術能力開放給第三方應用開發者。此外,依圖還將與微軟在智能語音領域展開更深層次的合作,共建AI生態。

2018年4月,微軟全球執行副總裁沈向洋(右)訪問依圖。依圖科技聯合創始人、CEO朱瓏(左)曾在微軟亞洲研究院(MSRA)研發人臉識別算法,導師就是沈向洋。依圖科技聯合創始人林晨曦,業務技術副總裁吳岷,研發總監周健等也都來自MSRA。圖片來源:依圖科技

與此同時,依圖也攜手華為聯合發布“智能語音聯合解決方案”,該方案基于依圖語音開放平臺,以及華為全棧全場景 Ascend(昇騰)系列芯片和面向數據中心側的 Atlas 300 AI加速卡,將雙方強大的技術研發能力與生態服務能力深度結合,形成軟硬件一體化的聯合解決方案,進一步幫助提升開發效率。

自2016年成為合作伙伴以來,依圖和華為已形成全方位聯動。今年3月,雙方共同發布“華為-依圖視頻云人像大數據”解決方案,布局全球城市級公共安全。10月,2018華為全聯接大會期間,依圖作為大會安保唯一AI合作伙伴,與華為聯合發布了分支視頻云聯合解決方案、智慧警務云解決方案和智慧園區解決方案,在平安城市、智慧警務、大數據應用等方面持續加深合作。

10月9日,華為輪值董事長徐直軍(左二)、華為安平系統部總裁岳坤、華為企業BG行業Marketing與解決方案總裁喻東(左三)等一行到訪依圖。來源:依圖科技

此前,有傳言微軟Azure云服務在中國的數據中心將使用華為的昇騰芯片,這一消息尚未得到證實。但本次由依圖串接起來的微軟、華為合作鏈,不禁讓人浮想聯翩。

根據2018中國語音產業聯盟年會上周發布的《2017-2018中國智能語音產業白皮書》,全球智能語音產業規模持續增長,2014年至2018年,中國智能語音產業規模由30億元增長至159.7億元。

左有微軟,右有華為,再加上自身的技術,依圖在智能語音開局便湊齊了一手好牌。

最后要說的是依圖科技的首席創新官呂昊。呂昊今年2月加入依圖,之前是谷歌的研究科學家。根據依圖科技官方介紹,呂昊在谷歌期間曾負責孵化安卓APP啟動推薦系統,這是全球首個移動端APP啟動推薦系統,也是全球首個基于機器學習的安卓產品。他會帶領依圖與華為孵化出怎樣的智能語音聯合解決方案?

林晨曦曾表示好的人才需要對未來充滿想象力,朱瓏也在文章里寫因為看見,所以相信——現在這句話基本成了依圖的Slogan。

“99%識別率的算法和99.99%的算法,區別在于可解鎖的應用場景,對技術商業價值的想象力將回答AI的場景在哪里以及多快到來。”

“我們認為,目前語音識別仍處于初步發展的階段,依圖將始終保持在技術層面的投入,通過技術的突破來解鎖更多的可能,也歡迎合作伙伴與我們共同探索語音技術的行業應用。”呂昊說。

注釋

[1] 一般在英文語音識別中用“詞錯率”(WER),因為最小單元是詞;中文語音識別一般使用“字錯率”(CER),因為最小單元是字.

[2] AISHELL-2是AISHELL Foundation和希爾貝殼創建的開源數據庫,含有1000小時中文語音數據,由1991名來自中國不同口音區域的說話者參與錄制,經過專業語音校對人員轉寫標注,通過了嚴格質量檢驗,數據庫文本正確率在96%以上,錄音文本涉及喚醒詞、語音控制詞、智能家居無人駕駛工業生產等12個領域.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6627

    瀏覽量

    104347
  • 數據庫
    +關注

    關注

    7

    文章

    3845

    瀏覽量

    64606
  • 智能語音
    +關注

    關注

    10

    文章

    789

    瀏覽量

    48858

原文標題:依圖做語音了!識別精度創中文語音識別新高點

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    HarmonyOS NEXT 應用開發練習:AI智能語音播報

    一、DEMO思路 在這個HarmonyOS NEXT原生應用DEMO中,我們將使用ArkTS開發語言創建一個簡單的AI智能語音播報應用。 該應用能夠接收用戶輸入的文本,并使用TTS
    發表于 01-06 15:33

    解鎖個性化語音交互新時代:九芯智能語音平臺,讓創意聲音觸手可及!

    九芯智能語音平臺提供全面高效安全的智能語音服務,支持自定義
    的頭像 發表于 01-02 16:51 ?151次閱讀
    解鎖個性化<b class='flag-5'>語音</b>交互新時代:九芯<b class='flag-5'>智能</b><b class='flag-5'>語音</b><b class='flag-5'>云</b><b class='flag-5'>平臺</b>,讓創意聲音觸手可及!

    NV512H語音芯片賦能加濕器方案,集語音播報+平臺自定義語音功能

    在秋冬季節,天氣逐漸轉涼,空氣變得干燥,加濕器成為了許多家庭和辦公場所不可或缺的電器設備。NV512H語音芯片賦能的加濕器方案,不僅提升了加濕器的智能化水平,更在用戶體驗上實現了質的飛躍
    的頭像 發表于 12-26 13:35 ?144次閱讀
    NV512H<b class='flag-5'>語音</b>芯片賦能加濕器方案,集<b class='flag-5'>語音</b>播報+<b class='flag-5'>平臺</b>自定義<b class='flag-5'>語音</b>功能

    基于語音識別的智能會議系統具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別和語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將
    的頭像 發表于 12-20 10:35 ?175次閱讀

    基于智能語音交互的智能呼叫中心工作機制

    作為實現智能呼叫中心的關鍵技術之一的智能語音交互技術,它通過集成自然語言處理(NLP)、語音識別(ASR)和語音合成(TTS)等先進技術,實
    的頭像 發表于 12-03 16:44 ?365次閱讀
    基于<b class='flag-5'>智能</b><b class='flag-5'>語音</b>交互的<b class='flag-5'>智能</b>呼叫中心工作機制

    智能語音的驅動力:揭秘8腳語音芯片在智能設備中的非凡角色

    語音技術滲透生活,8腳語音芯片以微縮體積、低功耗、卓越性能成智能設備語音功能核心,集成識別、合成、壓縮解碼等功能,實現精準語音交互,讓設備更
    的頭像 發表于 12-02 14:23 ?201次閱讀

    離線語音芯片讓家電變得智能

    目前智能語音有多種方式,常見的有在線語音與離線語音。因為智能語音處理需要用到算力,所以剛開始都是
    的頭像 發表于 11-27 01:00 ?210次閱讀
    離線<b class='flag-5'>語音</b>芯片讓家電變得<b class='flag-5'>智能</b>

    離線語音:實現智能家居的無縫互操作

    版,自然而然地成為了智能家居領域新的增長點,引領著行業邁向新的高度。智能語音,作為智能家居的啟明星,早已吸引了國內外眾多IT巨頭的目光。谷歌以NEST為跳板,
    的頭像 發表于 11-15 01:02 ?286次閱讀
    離線<b class='flag-5'>語音</b>:實現<b class='flag-5'>智能</b>家居的無縫互操作

    NVH-FLASH語音芯片支持平臺語音—打造音頻IC技術革新

    與靈活的支持平臺,正逐步引領著音頻設備向更高品質、更智能化方向發展。一、NVH-FLASH系列語音芯片概述NVH-FLASH系列語音芯片,以其內置的超大容量閃存技術
    的頭像 發表于 10-16 08:02 ?249次閱讀
    NVH-FLASH<b class='flag-5'>語音</b>芯片支持<b class='flag-5'>平臺</b>做<b class='flag-5'>語音</b>—打造音頻IC技術革新

    語音集成電路是指什么意思

    語音集成電路(Voice Integrated Circuit,簡稱VIC)是一種專門用于處理語音信號的集成電路。它通常包括了語音識別、語音合成、
    的頭像 發表于 09-30 15:44 ?418次閱讀

    智能密碼、指紋鎖語音芯片ic方案 可存放40s語音內容 NVD語音芯片

    隨著科技的飛速發展,智能家居安全領域迎來了前所未有的變革。智能密碼與指紋鎖作為現代家庭安全防護的重要一環,其背后的語音芯片IC開發更是這一變革中的關鍵技術突破。智能密碼、指紋鎖
    的頭像 發表于 09-25 08:01 ?321次閱讀
    <b class='flag-5'>智能</b>密碼、指紋鎖<b class='flag-5'>語音</b>芯片ic方案 可存放40s<b class='flag-5'>語音</b>內容 NVD<b class='flag-5'>語音</b>芯片

    微軟網頁版PPT新增語音識別及字幕生成功能

    據報道,微軟計劃于今年六月份推出網頁版PowerPoint全新語音識別功能。此項功能將能夠監控PowerPoint視頻中的聲音,進而自動生成字幕。
    的頭像 發表于 05-16 14:36 ?465次閱讀

    語音IC-智能語音芯片方案-您身邊的智選升級

    語音IC方案開發-智能語音升級OTP開發應用場景
    的頭像 發表于 04-12 17:00 ?528次閱讀

    語音數據集在智能駕駛中的關鍵作用與應用

    一、引言 隨著智能駕駛技術的快速發展,語音識別技術在其中扮演著越來越重要的角色。而語音數據集作為語音識別技術的基石,其質量和規模對整個系統的性能起著至關重要的作用。本文將深入探討
    的頭像 發表于 01-31 16:22 ?532次閱讀

    語音數據集:智能駕駛中車內語音識別技術的基石

    一、引言 在智能駕駛中,車內語音識別技術發揮著越來越重要的作用。語音數據集作為這一技術的基石,其質量和規模對語音識別的性能有著至關重要的影響。本文將深入探討
    的頭像 發表于 01-31 16:07 ?584次閱讀
    主站蜘蛛池模板: 日本久久中文字幕精品 | 日日操夜夜操狠狠操 | 男生J桶进女人P又色又爽又黄 | 国产欧美一区二区精品仙草咪 | 被男按摩师添的好爽在线直播 | 一区二区三区高清视频 | 网红主播 国产精品 开放90后 | 忘忧草在线影院WWW日本动漫 | 久久草福利自拍视频在线观看 | 麻豆人妻换人妻X99 麻豆区蜜芽区 | 51无码人妻精品1国产 | 果冻传媒我的女老板 | 亚洲视频中文字幕在线观看 | 日本高清无人区影院 | 视频一区精品自拍亚洲 | 四虎国产精品永久免费入口 | 亚洲欧美激情精品一区二区 | 亚洲精品成人无码区一在线观看 | 交换:年轻夫妇-HD中文字幕 | 这里只有精品在线视频 | 亚洲精品久久久无码一区二区 | 久久久久久久久久毛片精品美女 | 中文字幕1| 别插我B嗯啊视频免费 | 簧片高清在线观看 | 51久久成人国产精品麻豆 | 欧美成人中文字幕在线看 | 亚洲高清在线视频 | 久久久无码精品亚洲欧美 | 秋霞网站一级一片 | 欧美乱码伦视频免费66网 | 人妻天天爽夜夜爽三区麻豆A片 | 一个人在线观看免费视频 | 哒哒哒影院在线观看免费高清 | 亚洲精品午睡沙发系列 | 黄色片网站下载 | 18未满不能进的福利社 | 免费无码国产欧美久久18 | 国产精品一库二库三库 | 一品道门在线视频高清完整版 | 蜜柚视频在线观看全集免费观看 |