色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

探析智能語(yǔ)音交互應(yīng)用和技術(shù)

MEMS ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-11-23 09:54 ? 次閱讀

上個(gè)月,一年一度的中國(guó)聲學(xué)領(lǐng)域技術(shù)交流盛會(huì) “聲學(xué)樓13周年年會(huì)暨中國(guó)音響行業(yè)白皮書發(fā)布會(huì)”在深圳市南山區(qū)金百合大酒店隆重召開(kāi)。本次大會(huì)以“砥礪奮進(jìn),行穩(wěn)致遠(yuǎn)”為主題,邀請(qǐng)了中科院聲學(xué)所、萬(wàn)魔聲學(xué)、科大訊飛、小米科技、貓王收音機(jī)、樓氏電子等院所和企業(yè)的60余位行業(yè)大咖,與來(lái)自全國(guó)各地的知名專家學(xué)者、行業(yè)著名企業(yè)家、資深工程技術(shù)人員、年輕一線工程師等1500余人分享了31場(chǎng)深度技術(shù)垂直的議題報(bào)告。

座無(wú)虛席的大會(huì)現(xiàn)場(chǎng)其中,在10月27日下午的特邀專題報(bào)告里,北京聲加科技CEO邱鋒海受邀以《聲加萬(wàn)物、聆聽(tīng)未來(lái):智能語(yǔ)音交互應(yīng)用和技術(shù)》為題,分享了目前正在爆發(fā)的智能語(yǔ)音交互市場(chǎng)中的各項(xiàng)明星產(chǎn)品和其技術(shù)鏈條。并在演講中詳細(xì)分析了聲學(xué)前端技術(shù)所面臨的挑戰(zhàn)與機(jī)遇:如在百花齊放的新生市場(chǎng)里,智能音箱的“去插電化”、減少MEMS麥克風(fēng)組成的陣列、更靈活的喚醒詞訓(xùn)練及生成和智能耳機(jī)的尺寸更小、各類型傳感器數(shù)據(jù)融合以及更低功耗的喚醒等。

聲加科技CEO邱鋒海主題分享《聲加萬(wàn)物、聆聽(tīng)未來(lái):智能語(yǔ)音交互應(yīng)用和技術(shù)》

邱鋒海表示,10萬(wàn)年前,語(yǔ)言的出現(xiàn)大大加速了人類社會(huì)進(jìn)化和發(fā)展的進(jìn)程。時(shí)至今日,聽(tīng)和說(shuō)依然是人類最基本、最常用和最靈活的交流方式,同時(shí)也是最好的人機(jī)交互方式。在經(jīng)歷了計(jì)算機(jī)命令式交互到圖形界面觸摸交互,再到信息時(shí)代/高級(jí)信息時(shí)代的自然交互、和情感交互……毫無(wú)疑問(wèn),語(yǔ)音交互將會(huì)成為泛在的人機(jī)交互方式。

事實(shí)上,語(yǔ)音識(shí)別技術(shù)的研究可追溯到上世紀(jì)50年代,從單一模式匹配到70年代的模式和特征分析,再到90年的統(tǒng)計(jì)方法(HMM+GMM),直到2010年后,深度神經(jīng)網(wǎng)絡(luò)(DNN)取得了巨大的成功,基于DNN技術(shù)的應(yīng)用也呈爆炸式增長(zhǎng)。同時(shí),語(yǔ)音識(shí)別、自然語(yǔ)言理解、語(yǔ)音合成性能等技術(shù)大幅提升,互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)的高速發(fā)展也為算法引擎提供了大量的數(shù)據(jù)“糧食”。在海量的數(shù)據(jù)紅利下,云端計(jì)算軟硬件系統(tǒng)的算力增長(zhǎng)使其能夠快速處理海量數(shù)據(jù),再加上邊緣計(jì)算的能力增強(qiáng)、功耗降低等因素,語(yǔ)音交互的“基礎(chǔ)設(shè)施”已逐漸成熟。因此,智能語(yǔ)音交互應(yīng)用的興起也就順理成章。

然而,盡管語(yǔ)音識(shí)別在這幾年里得到迅速發(fā)展,但是目前業(yè)界聲稱的“語(yǔ)音識(shí)別準(zhǔn)確度達(dá)到了90%以上”(Google在2017年6月聲稱已達(dá)到95%的準(zhǔn)確率)其實(shí)是實(shí)驗(yàn)室數(shù)據(jù)。“非純凈條件下”的現(xiàn)實(shí)生活里,這個(gè)準(zhǔn)確率則降至50-70%,甚至更低。

智能語(yǔ)音產(chǎn)品從人到機(jī)器完成一次語(yǔ)音交互,需要經(jīng)過(guò)四個(gè)主要的技術(shù)環(huán)節(jié):語(yǔ)音前端處理、語(yǔ)音識(shí)別(ASR)、自然語(yǔ)言理解(NLP)以及語(yǔ)音合成(TTS),即從聲音的拾取到轉(zhuǎn)換成文字,到理解其含義并作出反饋,再到將反饋說(shuō)出。其中語(yǔ)音前端處理屬于客戶端,后三者則為云端。經(jīng)過(guò)多年的技術(shù)積累,語(yǔ)音識(shí)別和語(yǔ)音合成已經(jīng)獲得突破,基本可以滿足商用。而語(yǔ)音前端處理和自然語(yǔ)言理解依然是語(yǔ)音交互的核心瓶頸。

語(yǔ)音交互的技術(shù)鏈條

作為人機(jī)交互的最底層環(huán)節(jié),語(yǔ)音前端處理包括回聲消除、聲源定向、語(yǔ)音降噪、語(yǔ)音打斷、語(yǔ)音喚醒的MEMS麥克風(fēng)陣列,再通過(guò)MEMS麥克風(fēng)陣列實(shí)現(xiàn)復(fù)雜噪聲環(huán)境下的拾音。目前仍然處于商業(yè)初級(jí)應(yīng)用階段,距離比較理想的體驗(yàn)還有相當(dāng)大的距離。比如以Siri為代表的近場(chǎng)語(yǔ)音識(shí)別要求必須是低噪聲、無(wú)混響、距離聲源很近的場(chǎng)景,用戶一定要對(duì)著智能手機(jī)講話才能獲得符合近場(chǎng)語(yǔ)音識(shí)別要求的聲音信號(hào),環(huán)境稍微嘈雜一點(diǎn)語(yǔ)音識(shí)別引擎就失靈了; 而以智能音箱為代表的遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別場(chǎng)景下,依然存在誤喚醒,方言、童音識(shí)別不準(zhǔn)以及聲源移動(dòng)中的識(shí)別率低下等問(wèn)題。

邱鋒海認(rèn)為,目前智能音箱、智能耳機(jī)等產(chǎn)品的技術(shù)攻關(guān)主要還是在回聲消除、立體回聲消除、去混響、自適應(yīng)波束形成(抗干擾)、前端信號(hào)處理+KWS等;而語(yǔ)音前端信號(hào)處理的算法同樣面臨許多挑戰(zhàn),如單通道DNN語(yǔ)音增強(qiáng)、自噪聲抑制、多通道DNN語(yǔ)音增強(qiáng)等。同時(shí),他也在演講最后留下了幾個(gè)開(kāi)放性的問(wèn)題:關(guān)于智能音箱的更少的麥克風(fēng)組成的陣列(2個(gè)麥克風(fēng)仿生人耳),更低的計(jì)算功耗,更長(zhǎng)的不插電待機(jī)時(shí)間,更靈活的喚醒詞訓(xùn)練、生成等,藍(lán)牙音箱的智能化(需要本地命令識(shí)別),人機(jī)交互是以智能音箱為核心的星型網(wǎng)絡(luò)結(jié)構(gòu)還是各設(shè)備的分布式交互;關(guān)于智能耳機(jī)的尺寸更小,引入其他傳感器后各類型傳感器數(shù)據(jù)融合,更低功耗的喚醒、體驗(yàn)更好的語(yǔ)音交互功能等。

據(jù)悉,目前在智能語(yǔ)音交互市場(chǎng)中,國(guó)內(nèi)玩家主要分為傳統(tǒng)語(yǔ)音技術(shù)廠商、互聯(lián)網(wǎng)廠商,和新興的創(chuàng)業(yè)公司。其中大部分集中在語(yǔ)音識(shí)別(ASR)、自然語(yǔ)言理解(NLP)以及語(yǔ)音合成(TTS)等云端業(yè)務(wù),這也是歸結(jié)于語(yǔ)音前端處理技術(shù)的人才稀缺與實(shí)戰(zhàn)項(xiàng)目較少、缺乏經(jīng)驗(yàn)累積等。與這些玩家相比,聲加科技更多著力于解決全場(chǎng)景下的語(yǔ)音前端處理,其強(qiáng)大的研發(fā)實(shí)力依托于中科院聲學(xué)所雄厚的人才和科研資源,研發(fā)人員均來(lái)自于中科院聲學(xué)所、清華大學(xué)、南京大學(xué)和中國(guó)科學(xué)技術(shù)大學(xué)等國(guó)內(nèi)一流科研院所,核心團(tuán)隊(duì)成員亦大多師出于中科院聲學(xué)所,平均在業(yè)界擁有超過(guò)十五年工作經(jīng)驗(yàn)。團(tuán)隊(duì)此前已為國(guó)內(nèi)多個(gè)巨頭企業(yè)的智能音箱、智能耳機(jī)等明星產(chǎn)品提供遠(yuǎn)場(chǎng)麥陣模組設(shè)計(jì)方案、智能耳機(jī)麥陣算法、智能耳機(jī)模組等技術(shù)支持。

適用于多場(chǎng)景的多元化智能設(shè)備

“聲學(xué)樓”作為國(guó)內(nèi)最為專業(yè)和盛大的電聲技術(shù)研討會(huì)之一,本次大會(huì)不僅再一次掀起了中國(guó)音頻技術(shù)交流的高潮,還在開(kāi)幕當(dāng)天上午由中國(guó)電子音響行業(yè)協(xié)會(huì)秘書長(zhǎng)陳立新發(fā)布了《2018中國(guó)電子音響行業(yè)發(fā)展情況》(白皮書),并邀請(qǐng)中科院聲學(xué)所李曉東教授、魅族聲學(xué)總監(jiān)陳愛(ài)民、哈曼汽車電子全球研發(fā)中心揚(yáng)聲器系統(tǒng)工程總監(jiān)楊春洪、四川湖山電子高級(jí)工程師張康等業(yè)內(nèi)專家分別對(duì)智能音箱行業(yè)、耳機(jī)行業(yè)、汽車車載音響行業(yè)、專業(yè)音響行業(yè)的白皮書進(jìn)行介紹。值得一提的是,參與《中國(guó)智能音箱行業(yè)發(fā)展情況》主筆的李曉東教授不僅是邱鋒海和聲加科技數(shù)位成員在聲學(xué)所深造的導(dǎo)師,也是鼓勵(lì)其創(chuàng)業(yè)的前輩。

中科院聲學(xué)所李曉東教授、博導(dǎo)主題介紹《中國(guó)智能音箱行業(yè)發(fā)展情況》(2018版)編寫情況

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1760

    瀏覽量

    113296
  • 智能語(yǔ)音
    +關(guān)注

    關(guān)注

    10

    文章

    790

    瀏覽量

    49065

原文標(biāo)題:聲加萬(wàn)物、聆聽(tīng)未來(lái):智能語(yǔ)音交互應(yīng)用和技術(shù)

文章出處:【微信號(hào):MEMSensor,微信公眾號(hào):MEMS】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于WTV380-8S語(yǔ)音芯片的智能電子鎖語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

    ?一、方案背景與需求智能電子鎖作為現(xiàn)代家居安防的核心設(shè)備,用戶對(duì)交互友好性、功能多樣性和系統(tǒng)穩(wěn)定性的需求日益提升。WTV380-8S語(yǔ)音芯片憑借多模式控制、高集成度、低功耗設(shè)計(jì)及豐富的外設(shè)接口,為
    的頭像 發(fā)表于 03-06 08:56 ?98次閱讀
    基于WTV380-8S<b class='flag-5'>語(yǔ)音</b>芯片的<b class='flag-5'>智能</b>電子鎖<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)設(shè)計(jì)方案介紹

    基于WTVxxx語(yǔ)音芯片的智能清潔機(jī)器人語(yǔ)音交互系統(tǒng)設(shè)計(jì)方案介紹

    ?一、產(chǎn)品概述與設(shè)計(jì)需求隨著智能家居設(shè)備的普及,擦窗機(jī)器人和掃地機(jī)器人逐漸成為家庭清潔的重要工具。為提升用戶體驗(yàn),語(yǔ)音交互功能成為產(chǎn)品差異化的關(guān)鍵需求。廣州唯創(chuàng)電子WTVxxx系列語(yǔ)音
    的頭像 發(fā)表于 03-06 08:27 ?79次閱讀
    基于WTVxxx<b class='flag-5'>語(yǔ)音</b>芯片的<b class='flag-5'>智能</b>清潔機(jī)器人<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>系統(tǒng)設(shè)計(jì)方案介紹

    智能語(yǔ)音交互新標(biāo)桿】WTK6900HC語(yǔ)音識(shí)別芯片:重新定義離線語(yǔ)音控制體驗(yàn)

    在萬(wàn)物智聯(lián)時(shí)代,離線語(yǔ)音控制技術(shù)正以革命性姿態(tài)重塑智能設(shè)備交互方式。WTK6900HC語(yǔ)音識(shí)別芯片憑借其突破性的
    的頭像 發(fā)表于 03-05 09:26 ?82次閱讀
    【<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新標(biāo)桿】WTK6900HC<b class='flag-5'>語(yǔ)音</b>識(shí)別芯片:重新定義離線<b class='flag-5'>語(yǔ)音</b>控制體驗(yàn)

    奇瑞iCAR V23搭載思必馳全鏈路智能語(yǔ)音語(yǔ)言交互技術(shù)

    近日,奇瑞汽車旗下備受矚目的A級(jí)新能源風(fēng)格越野SUV——iCAR V23正式上市,新車搭載由思必馳提供的全鏈路智能語(yǔ)音語(yǔ)言交互技術(shù),帶來(lái)流暢絲滑的
    的頭像 發(fā)表于 01-14 14:55 ?546次閱讀

    【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊

    語(yǔ)音命令Q 識(shí)別,適用于智能家居控制、玩具、人機(jī)交互等多個(gè)領(lǐng)域。該模塊以其高識(shí)別率、低功耗和易于集成的特點(diǎn)受到廣大開(kāi)發(fā)者的青睞。 主要技術(shù)及功能有: 磁力攪拌、重量采集、
    發(fā)表于 01-02 18:15

    解鎖個(gè)性化語(yǔ)音交互新時(shí)代:九芯智能語(yǔ)音云平臺(tái),讓創(chuàng)意聲音觸手可及!

    九芯智能語(yǔ)音云平臺(tái)提供全面高效安全的智能語(yǔ)音服務(wù),支持自定義語(yǔ)音內(nèi)容,簡(jiǎn)化燒錄流程,依托AI技術(shù)
    的頭像 發(fā)表于 01-02 16:51 ?321次閱讀
    解鎖個(gè)性化<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>新時(shí)代:九芯<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>云平臺(tái),讓創(chuàng)意聲音觸手可及!

    基于W2605C語(yǔ)音識(shí)別合成芯片的智能語(yǔ)音交互鬧鐘方案-AI對(duì)話享受智能生活

    隨著科技的飛速發(fā)展,智能家居產(chǎn)品正逐步滲透到我們的日常生活中,其中智能鬧鐘作為時(shí)間管理的得力助手,也在不斷進(jìn)化。基于W2605C語(yǔ)音識(shí)別與語(yǔ)音合成芯片的
    的頭像 發(fā)表于 12-31 11:54 ?297次閱讀

    基于語(yǔ)音識(shí)別的智能會(huì)議系統(tǒng)具備哪些交互功能

    標(biāo)貝科技專注智能語(yǔ)音交互領(lǐng)域多年,在語(yǔ)音識(shí)別和語(yǔ)音合成領(lǐng)域有著多項(xiàng)大型企業(yè)合作案例,標(biāo)貝與多個(gè)智能
    的頭像 發(fā)表于 12-20 10:35 ?328次閱讀

    基于智能語(yǔ)音交互智能呼叫中心工作機(jī)制

    作為實(shí)現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語(yǔ)音交互技術(shù),它通過(guò)集成自然語(yǔ)言處理(NLP)、
    的頭像 發(fā)表于 12-03 16:44 ?467次閱讀
    基于<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的<b class='flag-5'>智能</b>呼叫中心工作機(jī)制

    智能語(yǔ)音的驅(qū)動(dòng)力:揭秘8腳語(yǔ)音芯片在智能設(shè)備中的非凡角色

    語(yǔ)音技術(shù)滲透生活,8腳語(yǔ)音芯片以微縮體積、低功耗、卓越性能成智能設(shè)備語(yǔ)音功能核心,集成識(shí)別、合成、壓縮解碼等功能,實(shí)現(xiàn)精準(zhǔn)
    的頭像 發(fā)表于 12-02 14:23 ?293次閱讀

    【實(shí)操文檔】在智能硬件的大模型語(yǔ)音交互流程中接入RAG知識(shí)庫(kù)

    本帖最后由 jf_40317719 于 2024-9-29 17:13 編輯 智能硬件的語(yǔ)音交互接入大模型后可以直接理解自然語(yǔ)言內(nèi)容,但大模型作為一個(gè)語(yǔ)言模型,對(duì)專業(yè)領(lǐng)域知識(shí)的訓(xùn)練缺乏也是
    發(fā)表于 09-29 17:12

    智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語(yǔ)音交互技術(shù)也越來(lái)越多的在日常工作、生活中應(yīng)用,智能
    的頭像 發(fā)表于 05-23 15:16 ?815次閱讀
    <b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b><b class='flag-5'>技術(shù)</b>如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話

    智能語(yǔ)音交互技術(shù)是指通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成和自然語(yǔ)言理解等
    的頭像 發(fā)表于 05-23 15:14 ?504次閱讀

    WTK6900G語(yǔ)音識(shí)別芯片在車載語(yǔ)音交互氛圍燈上的應(yīng)用案例解析

    隨著智能汽車的快速發(fā)展,車載語(yǔ)音交互技術(shù)逐漸成為提升駕駛體驗(yàn)的關(guān)鍵技術(shù)之一。傳統(tǒng)的車載燈光控制系統(tǒng)往往依賴于手動(dòng)操作,不僅操作繁瑣,而且在駕
    的頭像 發(fā)表于 05-17 13:57 ?549次閱讀

    **十萬(wàn)級(jí)口語(yǔ)識(shí)別,離線自然說(shuō)技術(shù),讓智能照明更懂你**

    自然說(shuō)技術(shù),用戶不用死記硬背,提供了更自然、更靈活、更智能語(yǔ)音交互方式。 方案框圖 在方案設(shè)計(jì)上,啟英泰倫充分考慮了產(chǎn)品功能、復(fù)雜程度和制造成本等因素。通過(guò)將
    發(fā)表于 04-29 17:09
    主站蜘蛛池模板: 久久精品观看 | 亚洲国产高清福利视频 | 无限资源在线看影院免费观看 | 亚洲日韩成人 | 国产精品色吧国产精品 | 免费观看视频成人国产 | 99国产精品综合AV无码 | 1234成人网| 英国video性精品高清最新 | 在线高清无码欧美久章草 | 强开少妇嫩苞又嫩又紧九色 | 国产精品久久精品 | 国产在线精品国自产拍影院午夜 | 在线 自拍 综合 亚洲 欧美 | 无码AV动漫精品一区二区免费 | 色欲AV色欲AV久久麻豆 | 国产精品伦一区二区三级视频 | S货SAO死你BL大点声叫BL | 91福利国产在线观看网站 | 亚洲 无码 制服 日韩 | 精品国产人妻国语 | 91九色麻豆 | 中文字幕视频免费在线观看 | caoporn 超碰免费视频 | 51久久成人国产精品麻豆 | 99er热精品视频国产免费 | 日韩精品一区二区中文 | 免费久久狼人香蕉网 | 99re6热这里在线精品视频 | 国产 亚洲 日韩 欧美 在线观看 | 国产 在线 亚洲 欧美 动漫 | 校花的奶好大好浪 | 全黄H全肉禁乱公 | 天堂岛www | 91系列在线观看免费 | 成人毛片免费播放 | caoporon超碰在线视频 | 亚洲中文字幕无码爆乳APP | 免费精品国偷自产在线 | 被吊起玩弄的女性奴 | 国产精品嫩草影院在线观看免费 |