色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

詳談機器學習的智能語音處理技術

如意 ? 來源:今日頭條 ? 作者:華章科技 ? 2021-01-27 16:08 ? 次閱讀

機器學習的快速發(fā)展,為智能語音處理奠定了堅實的理論和技術基礎。智能語音處理的主要特點是從大量的語音數(shù)據(jù)中學習和發(fā)現(xiàn)其中蘊含的規(guī)律,可以有效解決經典語音處理難以解決的非線性問題,從而顯著提升傳統(tǒng)語音應用的性能,也為語音新應用提供性能更好的解決方案。

01 智能語音處理的基本概念

為簡化處理,經典的語音處理方法一般都建立在線性平穩(wěn)系統(tǒng)的理論基礎之上,這是以短時語音具有相對平穩(wěn)性為前提條件的。但是,嚴格來講,語音信號是一種典型的非線性、非平穩(wěn)隨機過程,這就使得采用經典的處理方法難以進一步提升語音處理系統(tǒng)的性能,如語音識別系統(tǒng)的識別率等。

隨著機器人技術的不斷發(fā)展,以機器人智能語音交互為代表的語音新應用迫切要求發(fā)展新的語音處理技術與手段,以提高語音處理系統(tǒng)的性能水平。

近十年來,人工智能技術正以前所未有的速度向前發(fā)展,機器學習領域不斷涌現(xiàn)的新技術、新算法,特別是新型神經網絡深度學習技術等極大地推動了語音處理的發(fā)展,為語音處理的研究提供了新的方法和技術手段,智能語音處理應運而生。

至今為止,智能語音處理還沒有一個精確的定義。廣義上來說,在語音處理算法或系統(tǒng)實現(xiàn)中全部或部分采用智能化的處理技術或手段均可稱為智能語音處理。

02 智能語音處理的基本框架

“聲源-濾波器”模型雖然能夠有效地區(qū)分聲源激勵和聲道濾波器,對它們進行高效的估計,但語音產生時發(fā)聲器官存在著協(xié)同動作,存在緊耦合關系,采用簡單的線性模型無法準確描述語音的細節(jié)特征。

同時,語音是一種富含信息的信號載體,它承載了語義、說話人、情緒、語種、方言等諸多信息,分離、感知這些信息需要對語音進行十分精細的分析,對這些信息的判別也不再是簡單的規(guī)則描述,單純對發(fā)聲機理、信號的簡單特征采用人工手段去分析并不現(xiàn)實。

類似于人類語言學習的思路,采用機器學習手段,讓機器通過“聆聽”大量的語音數(shù)據(jù),并從語音數(shù)據(jù)中學習蘊含其中的規(guī)律,是有效提升語音信息處理性能的主要手段。與經典語音處理方法僅限于通過提取人為設定特征參數(shù)進行處理不同,智能語音處理最重要的特點就是在語音處理過程或算法中體現(xiàn)從數(shù)據(jù)中學習規(guī)律的思想。

圖1-5給出了智能語音處理的三種基本框架,圖中虛線框部分有別于經典語音處理方法,包含了從數(shù)據(jù)中學習的思想,是智能語音處理的核心模塊。

詳談機器學習的智能語音處理技術

▲圖1-5 智能語音處理的基本框架

其中,圖1-5a是在經典語音處理特征提取的基礎上,在特征映射部分融入了智能處理,是機器學習的經典形式,圖1-5b和圖1-5c是表示學習的基本框架,其中圖1-5c是深度學習的典型框架,“深度層次化的抽象特征”是通過分層的深度神經網絡結構來實現(xiàn)的。

03 智能語音處理的基本模型

智能語音處理是智能信息處理的一個重要研究領域,智能信息處理涉及的模型、方法、技術均可應用于智能語音處理。智能語音處理的基本模型和技術主要來源于人工智能,機器學習作為人工智能的重要領域,是目前智能語音處理中最常用的手段,而機器學習中的表示學習和深度學習則是智能語音處理中目前最為成功的智能處理技術。

詳談機器學習的智能語音處理技術

▲圖1-6 AI/ML/RL/DL的關系圖

圖1-6展示了人工智能(Artificial Intelligence,AI)、機器學習(Machine Learning,ML)、表示學習(Representation Learning,RL)及深度學習(Deep Learning,DL)的相互關系。

下面列出了近年來在智能語音處理中常見的模型和技術。

1. 稀疏與壓縮感知

一個事物的表示形式決定了認知該事物的難度。在信息處理中,具有稀疏特性的信號表示更易于被感知和辨別,反之則難以辨別。因此,尋找信號的稀疏表示是高效解決信息處理問題的一個重要手段。

利用冗余字典,可以學習信號自身的特點,構造信號的稀疏表示,并進一步降低采樣和處理的難度。這種字典學習方法為信息處理提供了新的視角。對語音信號采用字典學習,構造語音的稀疏表示,為語音編碼、語音分離等應用提供了新的研究思路。

2. 隱變量模型

語音的所有信息都包含在語音波形中,隱變量模型假設這些信息是隱含在觀測信號之后的隱變量。通過利用高斯建模、隱馬爾可夫建模等方法,隱變量模型建立了隱變量和觀測變量之間的數(shù)學描述,并給出了從觀測變量學習各模型參數(shù)的方法。

通過參數(shù)學習,可以將隱變量的變化規(guī)律挖掘出來,從而得到各種需要的隱含信息。隱變量模型大大提高了語音識別、說話人識別等應用的性能,在很長一段時間內都是智能語音處理的主流手段。

3. 組合模型

組合模型認為語音是多種信息的組合,這些信息可以采用線性疊加、相乘、卷積等不同方式組合在一起。具體的組合方式中需要采用一系列模型參數(shù),這些模型參數(shù)可以通過學習方式從大量語音數(shù)據(jù)中學得。這類模型的提出,有效改善了語音分離、語音增強等應用的性能。

4. 人工神經網絡與深度學習

人類面臨大量感知數(shù)據(jù)時,總能以一種靈巧的方式獲取值得注意的重要信息。模仿人腦高效、準確地表示信息一直是人工智能領域的核心挑戰(zhàn)。

人工神經網絡(Artificial Neural Network,ANN)通過神經元連接成網的方式,模擬了哺乳類動物大腦皮層的神經通路。和生物的神經系統(tǒng)一樣,ANN通過對環(huán)境輸入的感知和學習,可以不斷優(yōu)化性能。

隨著ANN的結構越來越復雜、層數(shù)越來越多,網絡的表示能力也越來越強,基于ANN進行深度學習成為ANN研究的主流,其性能相對于很多傳統(tǒng)的機器學習方法有較大幅度的提高。但同時,深度學習對輸入數(shù)據(jù)的要求也越來越高,通常需要有海量數(shù)據(jù)的支撐。

ANN很早就應用到了語音處理領域,但由于早期受到計算資源的限制,神經網絡層數(shù)較少,語音處理應用性能難以提升,直到近年來深層神經網絡的計算資源、學習方法有了突破之后,基于神經網絡的語音處理性能才有了顯著的提升。

深度神經網絡可以學到語音信號中各種信息間的非線性關系,解決了傳統(tǒng)語音處理方法難以解決的問題,已經成為當前智能語音處理的重要技術手段。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3248

    瀏覽量

    48860
  • 機器學習
    +關注

    關注

    66

    文章

    8420

    瀏覽量

    132680
  • 智能語音
    +關注

    關注

    10

    文章

    785

    瀏覽量

    48779
收藏 人收藏

    評論

    相關推薦

    機器學習技術在圖像處理中的應用

    在本章中,我們將討論機器學習技術在圖像處理中的應用。首先,定義機器學習,并
    的頭像 發(fā)表于 10-18 16:08 ?2327次閱讀

    【TL6748 DSP申請】基于DSP的語音識別技術研究及實現(xiàn)

    申請理由:在校大三學生,電子信息工程信號處理方向,特別想學習一下DSP信號處理技術學習過隨機信號分析、信號系統(tǒng)課程并且正在
    發(fā)表于 10-09 15:08

    智能語音機器

    ` 本帖最后由 星希望532 于 2015-12-2 20:06 編輯 作品名稱:基于微型操作系統(tǒng)的智能多平臺控制語音機器人http://v.youku.com/v_show
    發(fā)表于 12-02 19:08

    基于深度學習技術智能機器

    ——工業(yè)機器人的智能化程度要求也越來越高,采用深度學習技術為工業(yè)機器人賦能是目前各大廠商的統(tǒng)一認知。本文結合實際案例,簡要說明一下
    發(fā)表于 05-31 09:36

    請問電銷機器智能語音識別的原理是什么?

    一個人們最為關心的問題大概就是,電銷機器人如何做到語音識別,通俗來講,就是電銷機器人如何“聽懂”人們說話?其實語音識別技術是人工
    發(fā)表于 06-12 14:03

    人工智能機器學習的前世今生

    如何傳授給計算機的過程。任何機器使用算法以智能方式執(zhí)行任務,這就是展現(xiàn)的人工智能機器學習是人工智能
    發(fā)表于 08-27 10:16

    人工智能——MATLAB圖像處理機器學習

    視覺、通訊、計算金融學、控制設計、機器人學等等。 為了幫助大家更好的學習機器學習和圖像處理,我們上線了《人工智能—MATLAB圖像
    發(fā)表于 07-01 15:05

    【 平頭哥CB5654語音開發(fā)板試用連載】智能取貨機器人語音交互模組

    項目名稱:智能取貨機器人語音交互模組試用計劃:申請理由本人在機器人控制有七年多的學習和開發(fā)經驗,曾參與設計過類似巡檢機器人,參與語音交互硬件
    發(fā)表于 02-25 16:05

    AI智能語音機器人 揭秘讓企業(yè)電銷輕松拓客神器

    AI智能語音機器人是一款基于人工智能開發(fā)的,適用于產品業(yè)務或服務推廣需求的語音營銷服務平臺!通過精準語音
    發(fā)表于 07-21 22:54

    機器技術機器學習

    機器技術機器學習正成為嵌入式系統(tǒng)硬件和軟件供應商的下一個重大事件。嵌入式系統(tǒng)可以通過網絡連接和物聯(lián)網(IoT)來傳遞信息、共享資源。無論是智能
    發(fā)表于 12-20 06:03

    什么是人工智能機器學習、深度學習和自然語言處理

    垂直領域得到廣泛應用。根據(jù)2020年的一項估計,37% 的組織已經在使用這種或那種形式的人工智能。大多數(shù)人工智能的應用是特定的技術,如計算機視覺、自然語言處理
    發(fā)表于 03-22 11:19

    《移動終端人工智能技術與應用開發(fā)》人工智能的發(fā)展與AI技術的進步

    人工智能打發(fā)展是算法優(yōu)先于實際應用。近幾年隨著人工智能的不斷普及,許多深度學習算法涌現(xiàn),從最初的卷積神經網絡(CNN)到機器學習算法的時代。
    發(fā)表于 02-17 11:00

    智能語音機器人的使用誤區(qū)你知道嗎

    電銷機器人=AI人工智能+語音識別技術+語音知識庫+話術邏輯+智能
    發(fā)表于 07-04 14:29 ?1150次閱讀

    機器學習可以分為哪幾類?機器學習技術有哪些?

    機器學習可以分為哪幾類?機器學習技術有哪些 機器學習
    的頭像 發(fā)表于 08-17 16:11 ?5693次閱讀

    機器學習技術是什么?機器學習技術在新型電力系統(tǒng)安全穩(wěn)定中的應用

    一些能夠推斷未知數(shù)據(jù)的規(guī)則和模型。機器學習技術目前已經廣泛應用于許多領域,如圖像和語音識別、自然語言處理、金融風險管理等等。 在電力系統(tǒng)安全
    的頭像 發(fā)表于 08-17 16:30 ?1115次閱讀
    主站蜘蛛池模板: 人妻久久久精品99系列AV| 男gv纯肉免费视频| 1234成人网| 亚洲人视频在线观看| 日韩高清特级特黄毛片| 蜜芽最新域名解析网站| 国语对白老女人8av| 国产精品亚洲污污网站入口| 成人免费在线观看| 99久久精品免费精品国产| 伊人影院久久| 伊人久久大香网| 亚洲欧美国产综合在线| 亚洲成人99| 亚洲精品久久久992KVTV| 武汉美女洗澡| 午夜福利试看120秒体验区| 我就去色色| 亚洲 小说 欧美 激情 另类| 双性被疯狂灌满精NP| 偷柏自拍亚洲综合在线| 窝窝色资源站| 亚洲国产精品综合久久一线| 亚洲精品一二三区-久久| 亚洲精品一区三区三区在线观看| 亚洲欧美综合中文字幕| 亚洲一区免费香蕉在线| 重口味av| np高h肉文| 国产精品久久久久AV麻豆| 国产香蕉视频在线播放| 久久ZYZ资源站无码中文动漫| 久久免费看少妇高潮A片特爽| 蜜桃麻豆WWW久久囤产精品免费| 免费色片播放器| 三级黄色在线视频| 亚洲精品有码在线观看| 97草碰在线视频免费| yellow在线中文| 在线观看亚洲 日韩 国产| 天天操天天干天天爽|