“蘇州街站到了,請帶好隨身物品準(zhǔn)備下車。”
“巴溝站到了,請帶好隨身物品準(zhǔn)備下車。”
——地鐵語音播報(bào)編輯站名
隨著人工智能技術(shù)的發(fā)展,智能語音已融入我們?nèi)粘I畹姆椒矫婷妗T谌藱C(jī)共生的智能時(shí)代,讓人機(jī)交互更自然、更流暢一直是人類不斷探索的目標(biāo)。
近期,思必馳TTS技術(shù)上線語音編輯功能。語音編輯,即在一段語音中間插入語音內(nèi)容,或根據(jù)之前的語音風(fēng)格續(xù)寫,使得插入或續(xù)寫的語音內(nèi)容與之前的語音風(fēng)格完美融合,帶給用戶更自然、流暢的語音服務(wù)體驗(yàn)。該技術(shù)可應(yīng)用于自媒體語音修正,軌交、電商、快遞、銀行等行業(yè)中的智能客服語音播報(bào)場景,目前,思必馳語音編輯支持中文語音編輯及英文語音編輯。
語音編輯,像文本一樣修改音頻
點(diǎn)擊下方音頻,感受思必馳優(yōu)化后的語音編輯效果
普通語音編輯,手機(jī)號部分能聽出明顯差異
思必馳語音編輯,手機(jī)號部分與原有音頻自然融合
日常生活中,如音頻中所展示的智能客服已被廣泛應(yīng)用于快遞、銀行、電商等行業(yè)場景中,為行業(yè)降本增效帶來顯著作用。廠商通過語音編輯技術(shù),僅需對固定話術(shù)中的人名、數(shù)字等變量進(jìn)行替換,便可獲得針對不同用戶的差異性播報(bào)語音,批量通知用戶,大大提高了生產(chǎn)效率。
在語音編輯過程中,最大的挑戰(zhàn)就是如何使得編輯后的語音接近原有音頻的自然和流暢。情感的細(xì)微差別、語調(diào)變化、節(jié)奏等稍有不連貫,聽眾便能從中聽出明顯的語音差異。因此,為了讓此類編輯后的語音播報(bào)更自然,人類不斷優(yōu)化語音合成技術(shù)水平。
點(diǎn)擊試聽思必馳語音編輯續(xù)寫后的文本
原有音頻風(fēng)格
后半句為根據(jù)原有音頻風(fēng)格進(jìn)行編輯續(xù)寫
思必馳對語音編輯技術(shù)優(yōu)化更新,應(yīng)用深度合成技術(shù),基于大模型實(shí)現(xiàn)零樣本高質(zhì)量語音編輯,可對中英文語音進(jìn)行插入文本、根據(jù)之前風(fēng)格續(xù)寫等操作。經(jīng)思必馳語音編輯后的語音更流暢、更自然,帶給用戶媲美原聲的聽覺體驗(yàn)。
適用各種場景,音頻創(chuàng)作更高效
目前,語音編輯已經(jīng)應(yīng)用于快遞、電商、銀行等場景的智能客服以及自媒體短視頻配音修正中,為各行各業(yè)帶來更自然的語音服務(wù)。
智能客服固定話術(shù)修改變量
在快遞、電商、銀行、軌交等場景的智能客服中,常常需要用到固定話術(shù),但與用戶通話時(shí),固定話術(shù)需要根據(jù)不同用戶、場景對其中的變量進(jìn)行修改。如:
應(yīng)用場景
·張先生您好,請到樓下憑取件碼123取件;
·王女士您好,您近日在我店鋪購買的商品,如果滿意請給5分好評;
·劉先生您好,您的信用卡還款日為8月15日,請記得及時(shí)還款;
·蘇州街站到了,請帶好隨身物品準(zhǔn)備下車;
·北京,天氣晴轉(zhuǎn)多云,氣溫25-30℃。
在此類語音播報(bào)中,應(yīng)用思必馳語音編輯技術(shù),可對固定話術(shù)中的人名、地名、數(shù)字、日期等變量進(jìn)行編輯,從而快速獲得接近原聲的語音,滿足不同用戶、場景需求。
短視頻修正錄音口誤
修正前音頻
修正內(nèi)容后音頻
短視頻博主在視頻創(chuàng)作過程中,視頻素材往往有口誤、詞不達(dá)意或冗余的內(nèi)容,此時(shí),重新對某一句話進(jìn)行配音,則很難還原當(dāng)時(shí)的環(huán)境音,出現(xiàn)該句配音與其他音頻存在些許差異的情況。如果對視頻一幀一幀進(jìn)行修改,則需要花費(fèi)大量時(shí)間。在修改音頻時(shí),使用思必馳語音編輯技術(shù),可對個(gè)別字詞及冗余內(nèi)容進(jìn)行替換,替換后的字詞可完美融入之前的語音環(huán)境,降低語音編輯前后的差異性,獲得更自然、流暢的語音。
為了保證語音編輯技術(shù)合法使用,思必馳可通過聲紋識(shí)別對用戶上傳的公眾人物、敏感話題等音頻進(jìn)行屏蔽,拒絕編輯合成,保證技術(shù)安全。
除語音編輯外,思必馳聲音復(fù)刻、本地合成、情感音色合成等多項(xiàng)語音合成技術(shù)都迎來更新,敬請期待!
未來,思必馳將基于DFM-2大模型,結(jié)合語音合成技術(shù)進(jìn)行技術(shù)聯(lián)動(dòng),為智能汽車、智能家居、消費(fèi)電子,以及金融、軌交、政務(wù)等數(shù)字政企行業(yè)場景客戶帶來更加自然、流暢的語音交互服務(wù)。
審核編輯:彭菁
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1210瀏覽量
55435 -
TTS
+關(guān)注
關(guān)注
0文章
42瀏覽量
10801 -
思必馳
+關(guān)注
關(guān)注
4文章
286瀏覽量
14293 -
短視頻
+關(guān)注
關(guān)注
1文章
124瀏覽量
8953
原文標(biāo)題:語音編輯,讓智能播報(bào)更自然,思必馳TTS技術(shù)上新第一更!
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論