前言
什么是語(yǔ)音合成芯片:語(yǔ)音合成芯片也稱為TTS芯片,即文字轉(zhuǎn)語(yǔ)音芯片,是一種能夠?qū)⑤斎氲奈淖?a target="_blank">信息轉(zhuǎn)換為語(yǔ)音輸出的芯片。通過(guò)TTS芯片,我們可以將文字信息轉(zhuǎn)化為自然語(yǔ)音,實(shí)現(xiàn)人機(jī)語(yǔ)音交互。
語(yǔ)音合成芯片的應(yīng)用非常廣泛。例如,在智能家居領(lǐng)域,它可以用于語(yǔ)音控制家電設(shè)備;在車載設(shè)備中,它可以實(shí)時(shí)播報(bào)導(dǎo)航信息或交通提醒;在醫(yī)療設(shè)備中,它可以幫助醫(yī)生或患者獲取語(yǔ)音形式的醫(yī)療信息;在機(jī)器人領(lǐng)域,它使得機(jī)器人能夠與人類進(jìn)行語(yǔ)音交互,提高人機(jī)交互的便捷性和自然性。
一、芯片介紹
我們以市場(chǎng)中主流的TTS芯片SYN8086為例,它是一款性/價(jià)比更高,效果更自然的一款高端語(yǔ)音合成芯片。本芯片通過(guò)UART接口,接收待合成的文本數(shù)據(jù),實(shí)現(xiàn)文本到語(yǔ)音(或TTS語(yǔ)音)的轉(zhuǎn)換。
二、功能介紹
①、支持清晰、自然、準(zhǔn)確的任意中文文本的合成,文本編碼可采用GB2312、GBK、Unicode和UTF8四種編碼方式。
②、芯片支持文本智能分析處理功能,對(duì)常見(jiàn)的數(shù)值、電話號(hào)碼、時(shí)間日期、度量衡符號(hào)等格式的文本,芯片能夠根據(jù)內(nèi)置的文本匹配規(guī)則進(jìn)行正確的識(shí)別和處理。
③、支持多音字和姓氏處理、多個(gè)發(fā)音人、音量、語(yǔ)速、語(yǔ)調(diào)調(diào)整、提示音等
④、支持低功耗模式、UART通訊方式。支持多種控制命令等
三、應(yīng)用場(chǎng)景
- 車載終端 智慧停車 智能家居 智能鬧鐘
- 考勤終端 公交報(bào)站 智能手表 智能家電
- 排隊(duì)叫號(hào) 預(yù)警終端 智能門鈴 智能藥盒
- 儀器儀表 智能玩具 智能門鎖 智能穿戴
- 語(yǔ)音對(duì)講 自助終端 血壓計(jì) 充電樁
四、最小系統(tǒng)
- 最小系統(tǒng)包括:控制器模塊、語(yǔ)音合成芯片、功放模塊和喇叭。
- 主控制器和語(yǔ)音合成芯片之間通過(guò)UART接口連接,主控芯片UART接口向語(yǔ)音合成芯片發(fā)送控制命令和文本,語(yǔ)音合成芯片把接收到的文本合成為語(yǔ)音信號(hào)輸出,輸出的信號(hào)經(jīng)功率放大器進(jìn)行放大后連接到喇叭進(jìn)行播放。
五、軟件設(shè)計(jì)
1、串口命令
說(shuō)明:上位機(jī)通過(guò)串口發(fā)送給語(yǔ)音合成芯片的所有命令和數(shù)據(jù)都需要用“幀”的方式進(jìn)行封裝后傳輸。
- 公共命令匯總
- 語(yǔ)音合成命令匯總
舉例:播放文本編碼格式為 “GBK” 的文本“宇音天下”
命令幀:0xFD 0x00 0x0A 0x01 0x01 0xD3 0xEE 0xD2 0xF4 0xCC 0xEC 0xCF 0xC2
2、控制標(biāo)記
說(shuō)明:漢字博大精深的文化底蘊(yùn),和當(dāng)前技術(shù)發(fā)展的限制,語(yǔ)音合成還不能做到百分之百的準(zhǔn)確。為滿足客戶在各種復(fù)雜環(huán)境的個(gè)性化需求,特推出以下文本控制標(biāo)記,用于靈活控制漢字發(fā)音的變化。
- 部分控制標(biāo)記
- 控制標(biāo)記舉例:
舉例:設(shè)置TTS音量為10級(jí)
命令幀:0xFD 0x00 0x07 0x06 0x01 0x5B 0x76 0x31 0x30 0x5D
舉例:設(shè)置TTS語(yǔ)速為10級(jí)
命令幀:0xFD 0x00 0x07 0x06 0x01 0x5B 0x73 0x31 0x30 0x5D
3、提示音
SYN8086語(yǔ)音合成芯片內(nèi)集成了多首聲音提示音,可用于不同行業(yè)不同場(chǎng)合的信息提醒、報(bào)警等功能。例如:刷卡音,門鈴音,警報(bào)音等。
- 部分提示音舉例
舉例:播放名稱為“sound901”的提示音
命令幀:FD 00 0A 01 01 73 6F 75 6E 64 39 30 31
4、C語(yǔ)言范例
#include ?reg51.h??> #include ?string.h??> void main(void) { /需要發(fā)送的文本******************/ char code text[ ] = {"歡迎使用宇音天下研發(fā)的語(yǔ)音合成芯片"}; unsigned char headOfFrame[5]; unsigned char length ; unsigned int i = 0; length = strlen(text); //需要發(fā)送文本的長(zhǎng)度 /串口的初始化********************/ TL1 = 0xFA; // 在11.0592MHz 下,設(shè)置波特率9600bps,工作方式2 TH1 = 0xFA; TMOD = 0x20; SCON = 0x50; // 串口工作方式1,允許接收 PCON = 0x80; EA = 0; REN = 1; TI = 0; //發(fā)送中斷標(biāo)志位置零 RI = 0; //接收中斷標(biāo)志位置零 TR1 = 1; //定時(shí)器1 用作波特率發(fā)生 /發(fā)送過(guò)程*********************/ headOfFrame[0] = 0xFD ; //構(gòu)造幀頭FD headOfFrame[1] = 0x00 ; //構(gòu)造數(shù)據(jù)區(qū)長(zhǎng)度的高字節(jié) headOfFrame[2] = length + 2; //構(gòu)造數(shù)據(jù)區(qū)長(zhǎng)度的低字節(jié) headOfFrame[3] = 0x01 ; //構(gòu)造命令字:合成播放命令 headOfFrame[4] = 0x01 ; //構(gòu)造命令參數(shù):編碼格式為GBK for(i = 0; i?5; i++) //依次發(fā)送構(gòu)造好的5個(gè)幀頭字節(jié) { SBUF = headOfFrame[i]; while (TI== 0) {;} //等待發(fā)送中斷標(biāo)志位置位 TI = 0; //發(fā)送中斷標(biāo)志位清零 } for(i = 0; i?length; i++) //依次發(fā)送待合成的文本數(shù)據(jù) { SBUF = text[i]; while (TI== 0) {;} TI = 0; } // while(1); }
六、硬件設(shè)計(jì)
1、通訊方式
語(yǔ)音合成芯片支持UART接口通訊方式,可通過(guò)UART 接口接收上位機(jī)發(fā)送的命令和數(shù)據(jù)。
2、引腳定義
3、參考電路
4、電源電路設(shè)計(jì)
3.1V-4.2V單獨(dú)供電,接VCC口。POPEN、BAUD0、BAUD1、WAKEUP默認(rèn)均有上拉電阻,如果IO需要上拉請(qǐng)上拉到VDDIO,而不是VCC。
- 功放參考電路
以CS8126T為參考
5、芯片參數(shù)
- 特性極限值
- 電壓工作范圍
6、模塊說(shuō)明
- 模塊實(shí)物圖
- 模塊尺寸
- 模塊引腳圖
- 模塊引腳定義
結(jié)語(yǔ)
智能語(yǔ)音技術(shù)正在引領(lǐng)人機(jī)交互進(jìn)入全新的時(shí)代。其卓越的語(yǔ)音處理能力、高度集成化和小型化設(shè)計(jì),以及不斷優(yōu)化的低功耗特性,使得語(yǔ)音合成芯片在智能家居、智能車載、可穿戴設(shè)備等多個(gè)領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。
在此,我們期待語(yǔ)音合成芯片技術(shù)的不斷創(chuàng)新與發(fā)展,為人與人、人與機(jī)器之間的溝通搭建起更加便捷、高效的橋梁,共同開啟智能語(yǔ)音交互的新篇章。
審核編輯 黃宇
-
TTS
+關(guān)注
關(guān)注
0文章
42瀏覽量
10817 -
語(yǔ)音合成芯片
+關(guān)注
關(guān)注
0文章
18瀏覽量
7513
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論