色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook機(jī)器學(xué)習(xí)模仿真人聲音,安全性引人擔(dān)憂

hl5C_deeptechch ? 來源:YXQ ? 2019-06-13 09:46 ? 次閱讀

機(jī)器語音系統(tǒng)一直有點(diǎn)令人失望:即使是最好的文本語音轉(zhuǎn)換系統(tǒng)也擺脫不了機(jī)械的特性,缺乏人類說話時(shí)的基本語調(diào)變化。斯蒂芬·霍金使用的語音系統(tǒng)就是一個(gè)很好的例子。

但近年來,機(jī)器學(xué)習(xí)取得了巨大進(jìn)步,也改善了機(jī)器語音系統(tǒng)的一些缺點(diǎn)。

最近,F(xiàn)acebook 人工智能研究中心的 Sean Vasquez 和 Mike Lewis 發(fā)現(xiàn)了一種可以克服從文本到語音系統(tǒng)轉(zhuǎn)換限制,完全由機(jī)器生成而且音頻片段極其逼真的方法。這一系統(tǒng)被稱為 MelNet,它不僅可以復(fù)制人類的語調(diào),而且可以用與真人相同的聲音。于是,研究小組開始訓(xùn)練該系統(tǒng),讓它模仿出比爾·蓋茨等人的說話。這項(xiàng)工作讓人類和電腦之間更真實(shí)的互動(dòng)成為可能,不僅如此,它的逼真程度,很可能引發(fā)虛假音頻內(nèi)容騙術(shù)的新問題。

圖丨比爾·蓋茨(來源:麻省理工科技評論)

現(xiàn)實(shí)中的文本—語音轉(zhuǎn)換系統(tǒng)進(jìn)展緩慢并非是因?yàn)槿狈L試。許多團(tuán)隊(duì)一直在嘗試訓(xùn)練深度學(xué)習(xí)算法,利用大型音頻數(shù)據(jù)庫重現(xiàn)真實(shí)的語音模式。

Vasquez 和 Lewis 說,這種方法的問題在于使用的數(shù)據(jù)類型。到目前為止,大多數(shù)工作都集中在音頻波形記錄上。這些音頻波形顯示了聲音的振幅如何隨時(shí)間而變化,它每秒記錄的音頻包含數(shù)萬個(gè)時(shí)間步長。

這些波形能在許多不同的尺度上顯示出特定模式。例如,在幾秒鐘的講話中,波形反映了與單詞序列相關(guān)的特征模式。但是在微秒級的片段中,波形顯示了與聲音的音高和音色相關(guān)的特征。在其他尺度上,波形反映了說話人的語調(diào)、音素結(jié)構(gòu)等。

另一種方法是將波形在一個(gè)時(shí)間步長和下一個(gè)時(shí)間步長之間的關(guān)聯(lián)性考慮進(jìn)來。所以,在給定的時(shí)間范圍內(nèi),一個(gè)單詞開頭的聲音與后面的聲音是有關(guān)聯(lián)的。

深度學(xué)習(xí)系統(tǒng)理應(yīng)善于學(xué)習(xí)這些類型的關(guān)聯(lián)性,并對它們進(jìn)行復(fù)制。但問題出在不同時(shí)間尺度的關(guān)聯(lián)性上,深度學(xué)習(xí)系統(tǒng)只能在有限的時(shí)間尺度上研究這些關(guān)聯(lián)性。這是因?yàn)樯疃葘W(xué)習(xí)使用了一種叫做反向傳播的學(xué)習(xí)過程,這種學(xué)習(xí)過程不斷地重新連接網(wǎng)絡(luò),根據(jù)所看到的示例改進(jìn)其性能。

重復(fù)率限制了系統(tǒng)學(xué)習(xí)關(guān)聯(lián)性的時(shí)間尺度。因此,深度學(xué)習(xí)網(wǎng)絡(luò)可以學(xué)習(xí)長時(shí)間或短時(shí)間內(nèi)音頻波形的關(guān)聯(lián)性,但不能同時(shí)兼顧兩者。這就是為什么它們在復(fù)制語音方面表現(xiàn)如此糟糕的原因。

Vasquez 和 Lewis 則有不同的方法。他們使用聲譜圖而不是音頻波形來訓(xùn)練他們的深度學(xué)習(xí)網(wǎng)絡(luò)。聲譜圖記錄了整個(gè)音頻頻譜及其隨時(shí)間的變化。所以當(dāng)波形捕捉到隨時(shí)間變化的一個(gè)參數(shù),例如振幅時(shí),光譜圖則捕捉到了不同頻率范圍內(nèi)的振幅變化。

這意味著音頻信息被更密集地打包到了這種類型的數(shù)據(jù)中。研究者認(rèn)為:聲譜圖的時(shí)間軸比波形的時(shí)間軸緊湊幾個(gè)數(shù)量級,這意味著在波形中跨越數(shù)萬個(gè)時(shí)間步長的依賴關(guān)系只跨越聲譜圖中的數(shù)百個(gè)時(shí)間步長。

這使得深度學(xué)習(xí)系統(tǒng)更容易獲得關(guān)聯(lián)性。他們說:“這使得我們的聲譜模型能夠在數(shù)秒內(nèi)產(chǎn)生一致的無條件語音和音樂樣本。”

圖丨聲譜圖 VS 波形圖(來源:Facebook)

最后的結(jié)果令人印象深刻。通過使用 TED 演講中的普通語音訓(xùn)練系統(tǒng),MelNet 能夠在幾秒鐘內(nèi)復(fù)制 TED 演講者的聲音,或多或少地說出一些內(nèi)容。Facebook 的研究人員利用比爾·蓋茨的 TED 演講來訓(xùn)練 MelNet,然后用比爾·蓋茨的聲音說出一系列隨機(jī)的短語,以此展示了 MelNet 的靈活性。

當(dāng)然,該方法也有一些限制。普通言語包含了更長時(shí)間尺度上的相關(guān)性。例如,在幾十秒或幾分鐘的演講進(jìn)程中,人們會(huì)使用語調(diào)的變化來表示主題或情緒的變化。Facebook 的機(jī)器系統(tǒng)似乎還無法做到這一點(diǎn)。

因此,盡管 MelNet 可以創(chuàng)造出非常逼真的短語,但團(tuán)隊(duì)還不能讓機(jī)器完成較長的句子、段落或整個(gè)故事。這個(gè)目標(biāo)似乎不是很快就能實(shí)現(xiàn)。

然而,這項(xiàng)工作可能會(huì)對人機(jī)交互產(chǎn)生重大影響。人機(jī)交互中許多對話只包含簡短的短語。電話接線員和服務(wù)臺尤其可以使用一系列相對簡短的短語。因此,這項(xiàng)技術(shù)可以用一種比當(dāng)前系統(tǒng)更接近人類的方式來優(yōu)化這些交互。

不過,目前 Vasquez 和 Lewis 對潛在的應(yīng)用前景守口如瓶。

當(dāng)然,自然發(fā)聲的機(jī)器也存在潛在的問題,尤其是那些能夠逼真模仿人類的機(jī)器。很容易想象,這種技術(shù)可能被用于惡作劇的場景。正因?yàn)槿绱耍@是人工智能的又一進(jìn)步,它提出的倫理問題比它所能回答的問題要更多。它所能回答的問題要更多。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54895
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132954

原文標(biāo)題:Facebook 的 AI,已經(jīng)可以用比爾·蓋茨的聲音說話

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    物理仿真人機(jī)器人的統(tǒng)一全身控制策略

    創(chuàng)建動(dòng)作自然并對各種控制輸入做出智能響應(yīng)的交互式仿真人機(jī)器人仍是計(jì)算機(jī)動(dòng)畫和機(jī)器人技術(shù)領(lǐng)域最具挑戰(zhàn)的問題之一。NVIDIA Isaac Sim等高性能 GPU 加速
    的頭像 發(fā)表于 01-06 12:31 ?195次閱讀
    物理<b class='flag-5'>仿真人</b>形<b class='flag-5'>機(jī)器</b>人的統(tǒng)一全身控制策略

    如何實(shí)現(xiàn) HTTP 協(xié)議的安全性

    協(xié)議的安全性,可以采取以下幾種方法: 1. 使用HTTPS HTTPS(安全超文本傳輸協(xié)議)是HTTP的安全版本,它在HTTP的基礎(chǔ)上通過SSL/TLS協(xié)議提供了數(shù)據(jù)加密、數(shù)據(jù)完整驗(yàn)
    的頭像 發(fā)表于 12-30 09:22 ?299次閱讀

    集中告警管理如何提升設(shè)施安全性

    在工業(yè)或商業(yè)建筑中,集中告警管理已成為確保安全性或檢測故障的必備工具。它是如何提升設(shè)施安全性的?歡迎大家閱讀文章了解~
    的頭像 發(fā)表于 12-13 15:51 ?159次閱讀
    集中告警管理如何提升設(shè)施<b class='flag-5'>安全性</b>?

    電池的安全性測試項(xiàng)目有哪些?

    電池的安全性測試是保證電池在實(shí)際使用過程中穩(wěn)定、安全的重要手段。通過一系列嚴(yán)格的測試項(xiàng)目,能夠有效評估電池在不同條件下的表現(xiàn),并提前發(fā)現(xiàn)潛在的安全隱患。對于消費(fèi)者而言,了解這些測試項(xiàng)目不僅能幫助他們
    的頭像 發(fā)表于 12-06 09:55 ?610次閱讀
    電池的<b class='flag-5'>安全性</b>測試項(xiàng)目有哪些?

    在電氣安裝中通過負(fù)載箱實(shí)現(xiàn)最大效率和安全性

    在電氣安裝中,負(fù)載箱是一種常用的設(shè)備,主要用于模擬實(shí)際的電力負(fù)載,以便進(jìn)行各種電氣設(shè)備的測試和調(diào)試。通過負(fù)載箱,可以實(shí)現(xiàn)最大效率和安全性,從而提高電氣設(shè)備的運(yùn)行性能和使用壽命。 負(fù)載箱可以實(shí)現(xiàn)最大
    發(fā)表于 11-20 15:24

    socket編程的安全性考慮

    在Socket編程中,安全性是一個(gè)至關(guān)重要的考慮因素。以下是一些關(guān)鍵的安全性考慮和措施: 1. 數(shù)據(jù)加密 使用TLS/SSL協(xié)議 :TLS/SSL(傳輸層安全性/安全套接層)是網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-01 16:46 ?325次閱讀

    UWB模塊的安全性評估

    UWB(超寬帶)模塊的安全性評估是一個(gè)復(fù)雜而關(guān)鍵的過程,涉及多個(gè)方面,包括技術(shù)特性、加密機(jī)制、抗干擾能力、物理層安全等。以下是對UWB模塊安全性評估的分析: 一、技術(shù)特性帶來的安全性
    的頭像 發(fā)表于 10-31 14:17 ?353次閱讀

    智能系統(tǒng)的安全性分析

    智能系統(tǒng)的安全性分析是一個(gè)至關(guān)重要的過程,它涉及多個(gè)層面和維度,以確保系統(tǒng)在各種情況下都能保持安全、穩(wěn)定和可靠。以下是對智能系統(tǒng)安全性的分析: 一、數(shù)據(jù)安全性 數(shù)據(jù)加密 : 采用對稱加
    的頭像 發(fā)表于 10-29 09:56 ?303次閱讀

    云計(jì)算安全性如何保障

    云計(jì)算的安全性是一個(gè)復(fù)雜而多維的問題,涉及多個(gè)層面和多種技術(shù)手段。為了保障云計(jì)算的安全性,需要采取一系列綜合措施,以下是具體的保障方法: 一、數(shù)據(jù)加密 數(shù)據(jù)加密是保護(hù)云計(jì)算安全性的核心手段之一
    的頭像 發(fā)表于 10-24 09:14 ?349次閱讀

    三星一款無線耳機(jī)爆炸!電子產(chǎn)品安全性,近期尤其引人關(guān)注

    突發(fā)!三星一款無線耳機(jī)爆炸!電子產(chǎn)品安全性,近期尤其引人關(guān)注!
    的頭像 發(fā)表于 09-28 08:10 ?678次閱讀
    三星一款無線耳機(jī)爆炸!電子產(chǎn)品<b class='flag-5'>安全性</b>,近期尤其<b class='flag-5'>引人</b>關(guān)注

    固態(tài)電池安全性怎么樣

    固態(tài)電池在安全性方面表現(xiàn)出顯著的優(yōu)勢,這主要得益于其獨(dú)特的固態(tài)電解質(zhì)結(jié)構(gòu)。以下是對固態(tài)電池安全性的詳細(xì)分析:
    的頭像 發(fā)表于 09-15 11:47 ?871次閱讀

    請問DM平臺訪問安全性如何控制?

    DM平臺訪問安全性如何控制?
    發(fā)表于 07-25 06:10

    藍(lán)牙模塊的安全性與隱私保護(hù)

    藍(lán)牙模塊作為現(xiàn)代無線通信的重要組成部分,在智能家居、可穿戴設(shè)備、健康監(jiān)測等多個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,隨著藍(lán)牙技術(shù)的普及,其安全性和隱私保護(hù)問題也日益凸顯。本文將探討藍(lán)牙模塊在數(shù)
    的頭像 發(fā)表于 06-14 16:06 ?598次閱讀

    FMEA與機(jī)器人:如何確保機(jī)器人技術(shù)的可靠安全性

    安全性,F(xiàn)MEA(故障模式與影響分析)這一質(zhì)量管理工具的應(yīng)用顯得尤為重要。 一、FMEA在機(jī)器人技術(shù)中的重要 FMEA是一種預(yù)防的質(zhì)量分析工具,它通過對產(chǎn)品設(shè)計(jì)、制造、使用等過程
    的頭像 發(fā)表于 04-12 10:07 ?601次閱讀

    FMEA與智能機(jī)器人:提升機(jī)器人可靠安全性的關(guān)鍵

    智能機(jī)器人的安全性和可靠成為了亟待解決的問題。此時(shí),F(xiàn)MEA(故障模式與影響分析)作為一種預(yù)防的質(zhì)量工具,發(fā)揮著不可或缺的作用。 FMEA是一種系統(tǒng)化的分析方法,旨在識別產(chǎn)品設(shè)計(jì)或
    的頭像 發(fā)表于 03-22 11:07 ?682次閱讀
    主站蜘蛛池模板: 撅高 自己扒开 调教 | 成人毛片免费播放 | 色偷偷男人天堂 | 18日本人XXXXXX18 | 麻豆出品国产AV在线观看 | 老师的快感电影完整版 | FREE乌克兰嫩交HD | 奇米精品一区二区三区在线观看 | 国产精品人妻一区免费看8C0M | 男人的天堂黄色片 | 2019精品国产品在线不卡 | 挺进老师的紧窄小肉六电影完整版 | YELLOW高清视频免费观看 | 韩国三级久久精品 | 国产精品一区二区免费 | 亚洲精品综合在线影院 | 久久久久久88色偷偷 | 精品国产免费人成视频 | 97国产揄拍国产精品人妻 | 插骚妇好爽好骚 | 无码专区久久综合久综合字幕 | 美女扒开屁股让男人桶 | 97无码欧美熟妇人妻蜜桃天美 | 国语自产精品一区在线视频观看 | 久久成人伊人欧洲精品AV | 国产欧美精品一区二区色综合 | 正在播放国产尾随丝袜美女 | 最近的2019中文字幕国语版 | nu77亚洲综合日韩精品 | 日本国产成人精品无码区在线网站 | videossexotv极度另类 | 黄色片软件大全 | 日日射日日操 | 亚洲欧美无码2017在线 | 日韩精品一卡二卡三卡四卡2021 | 亚洲AV日韩AV欧美在线观看网 | 2022久久精品国产色蜜蜜麻豆 | HEYZO无码中文字幕人妻 | 2020亚洲色噜噜狠狠网站 | 成人AV无码一二二区视频免费看 | 国产成人精品系列在线观看 |