語音識別簡介
與機器進行語音交流,讓機器明白你說什么,這是人們長期以來夢寐以求的事情。中國物聯(lián)網(wǎng)校企聯(lián)盟形象得把語音識別比做為“機器的聽覺系統(tǒng)”。語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個方面。語音識別技術(shù)車聯(lián)網(wǎng)也得到了充分的引用,例如在翼卡車聯(lián)網(wǎng)中,只需按一鍵通客服人員口述即可設(shè)置目的地直接導(dǎo)航,安全、便捷。
語音識別是一門交叉學(xué)科。近二十年來,語音識別技術(shù)取得顯著進步,開始從實驗室走向市場。人們預(yù)計,未來10年內(nèi),語音識別技術(shù)將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費電子產(chǎn)品等各個領(lǐng)域。 語音識別聽寫機在一些領(lǐng)域的應(yīng)用被美國新聞界評為1997年計算機發(fā)展十件大事之一。很多專家都認(rèn)為語音識別技術(shù)是2000年至2010年間信息技術(shù)領(lǐng)域十大重要的科技發(fā)展技術(shù)之一。 語音識別技術(shù)所涉及的領(lǐng)域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
語音分類應(yīng)用
根據(jù)識別的對象不同,語音識別任務(wù)大體可分為3類,即孤立詞識別(isolated word recognition),關(guān)鍵詞識別(或稱關(guān)鍵詞檢出,keyword spotting)和連續(xù)語音識別。其中,孤立詞識別 的任務(wù)是識別事先已知的孤立的詞,如“開機”、“關(guān)機”等;連續(xù)語音識別的任務(wù)則是識別任意的連續(xù)語音,如一個句子或一段話;連續(xù)語音流中的關(guān)鍵詞檢測針對的是連續(xù)語音,但它并不識別全部文字,而只是檢測已知的若干關(guān)鍵詞在何處出現(xiàn),如在一段話中檢測“計算機”、“世界”這兩個詞。
根據(jù)針對的發(fā)音人,可以把語音識別技術(shù)分為特定人語音識別和非特定人語音識別,前者只能識別一個或幾個人的語音,而后者則可以被任何人使用。顯然,非特定人語音識別系統(tǒng)更符合實際需要,但它要比針對特定人的識別困難得多。
另外,根據(jù)語音設(shè)備和通道,可以分為桌面(PC)語音識別、電話語音識別和嵌入式設(shè)備(手機、PDA等)語音識別。不同的采集通道會使人的發(fā)音的聲學(xué)特性發(fā)生變形,因此需要構(gòu)造各自的識別系統(tǒng)。
語音識別的應(yīng)用領(lǐng)域非常廣泛,常見的應(yīng)用系統(tǒng)有:語音輸入系統(tǒng),相對于鍵盤輸入方法,它更符合人的日常習(xí)慣,也更自然、更高效;語音控制系統(tǒng),即用語音來控制設(shè)備的運行,相對于手動控制來說更加快捷、方便,可以用在諸如工業(yè)控制、語音撥號系統(tǒng)、智能家電、聲控智能玩具等許多領(lǐng)域;智能對話查詢系統(tǒng),根據(jù)客戶的語音進行操作,為用戶提供自然、友好的數(shù)據(jù)庫檢索服務(wù),例如家庭服務(wù)、賓館服務(wù)、旅行社服務(wù)系統(tǒng)、訂票系統(tǒng)、醫(yī)療服務(wù)、銀行服務(wù)、股票查詢服務(wù)等等。
語音識別原理
系統(tǒng)本質(zhì)上是一種模式識別系統(tǒng),包括特征提取、模式匹配、參考模式庫等三個基本單元,它的基本結(jié)構(gòu)如下圖所示:
未知語音經(jīng)過話筒變換成電信號后加在識別系統(tǒng)的輸入端,首先經(jīng)過預(yù)處理,再根據(jù)人的語音特點建立語音模型,對輸入的語音信號進行分析,并抽取所需的特征,在此基礎(chǔ)上建立語音識別所需的模板。而計算機在識別過程中要根據(jù)語音識別的模型,將計算機中存放的語音模板與輸入的語音信號的特征進行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入語音匹配的模板。然后根據(jù)此模板的定義,通過查表就可以給出計算機的識別結(jié)果。顯然,這種最優(yōu)的結(jié)果與特征的選擇、語音模型的好壞、模板是否準(zhǔn)確都有直接的關(guān)系。
國內(nèi)語音識別公司有哪些
科大訊飛股份有限公司
科大訊飛股份有限公司成立于1999年,是一家專業(yè)從事智能語音及語言技術(shù)、人工智能技術(shù)研究,軟件及芯片產(chǎn)品開發(fā),語音信息服務(wù)及電子政務(wù)系統(tǒng)集成的國家級骨干軟件企業(yè)。2008年,科大訊飛在深圳證券交易所掛牌上市,股票代碼:002230。
科大訊飛在智能語音核心技術(shù)研究領(lǐng)域,一直秉承“從市場中來、到市場中去”,“用正確的方法、做有用的研究”等核心理念,致力于建立智能語音及語言核心技術(shù)和核心技術(shù)應(yīng)用產(chǎn)業(yè)化兩大方面的競爭力。科大訊飛的核心技術(shù)主要包括:語音識別技術(shù)、語音合成技術(shù)、自然語言理解技術(shù)、語音評測技術(shù)、聲紋語種技術(shù)、手寫識別技術(shù)等。科大訊飛始終堅持提供國際領(lǐng)先的語音及語言整體解決方案,不斷推出符合國家和社會需求的智能語音及語言技術(shù)產(chǎn)品及應(yīng)用服務(wù)。
匯頂科技
匯頂科技成立于2002年,作為全球人機交互及生物識別技術(shù)領(lǐng)導(dǎo)者,目前已在包括手機、平板電腦和可穿戴產(chǎn)品等在內(nèi)的智能移動終端領(lǐng)域構(gòu)筑了領(lǐng)先優(yōu)勢,先后推出全球領(lǐng)先的單層多點觸控芯片、全球首創(chuàng)的觸摸屏近場通信技術(shù)Goodix LinkTM、全球首家應(yīng)用于Android手機正面的按壓式指紋識別芯片、全球首創(chuàng)的Invisible Fingerprint Sensor(IFSTM)、全球首創(chuàng)支持玻璃蓋板的指紋識別芯片、全球首創(chuàng)應(yīng)用于移動終端的活體指紋檢測技術(shù)Live Finger DetectionTM、全球首創(chuàng)的顯示屏內(nèi)指紋識別技術(shù)等。
其中,Live Finger DetectionTM憑借其卓越的創(chuàng)新應(yīng)用價值斬獲了2017國際消費電子展(CES)全球創(chuàng)新金獎,這是匯頂科技繼2016年憑借IFSTM(觸控與指紋識別一體化技術(shù))和Goodix LinkTM(觸摸屏近場通信技術(shù))兩項技術(shù)獲得CES創(chuàng)新大獎后再次得到CES創(chuàng)新獎項,匯頂科技也由此成為首家榮獲CES全球創(chuàng)新金獎的中國IC設(shè)計公司。目前,產(chǎn)品和解決方案主要應(yīng)用于華為、OPPO、vivo、小米、中興、魅族、聯(lián)想、金立、錘子、TCL、Nokia、Dell、HP、LG、ASUS、acer、 TOSHIBA、Panasonic等國際國內(nèi)知名品牌,服務(wù)全球數(shù)億人群。
漢王科技股份有限公司
漢王科技股份有限公司成立于1998年,是全球文字識別技術(shù)與智能交互產(chǎn)品引領(lǐng)者,多年來,通過不斷自主創(chuàng)新,在手寫識別、光學(xué)字符識別(OCR)、筆跡輸入等領(lǐng)域擁有多項具有自主知識產(chǎn)權(quán)的核心技術(shù),綜合技術(shù)水平在國內(nèi)外均處于領(lǐng)先地位,手寫漢字識別獲得國家科技進步一等獎,OCR獲得國家科技進步二等獎。
漢王科技以核心技術(shù)為基礎(chǔ),面向市場需求,已形成了以識別技術(shù)為核心的、針對不同細(xì)分市場的軟硬件產(chǎn)品系列,既有通用產(chǎn)品,如e典筆、漢王電紙書、漢王筆、文本王、名片通、繪圖板等,也有針對教育、金融等行業(yè)應(yīng)用的文表識別解決方案;既有手寫手機、OCR等多種技術(shù)授權(quán)方案,也有輔助方案實施的硬件產(chǎn)品,如證照識別等。
山東共達電聲股份有限公司
山東共達電聲股份有限公司是專業(yè)的電聲元器件及電聲組件制造商、服務(wù)商和電聲技術(shù)整體解決方案提供商,是國家級高新技術(shù)企業(yè)、中國電子元件百強企業(yè)。
公司始創(chuàng)于2001年,自設(shè)立以來,堅持“共融、共創(chuàng)、共享、共達”的企業(yè)核心價值觀,秉承“和諧、超越、高效、求是”的企業(yè)精神,專注于電聲元器件產(chǎn)品的研發(fā)和制造,致力于成為世界一流的電聲技術(shù)整體解決方案提供商,主要產(chǎn)品包括微型麥克風(fēng)、微型揚聲器/受話器及其陣列模組,廣泛應(yīng)用于移動通訊設(shè)備及其周邊產(chǎn)品、筆記本電腦、平板電視、個人數(shù)碼產(chǎn)品、汽車電子等消費類電子產(chǎn)品領(lǐng)域。
拓爾思
拓爾思是一家技術(shù)驅(qū)動型企業(yè),歷經(jīng)二十余年的深耕和積累,在中文檢索、自然語言處理等領(lǐng)域始終處于行業(yè)前沿,公司2011年在深交所創(chuàng)業(yè)板上市,股票代碼300229,是第一家在A股上市的大數(shù)據(jù)技術(shù)企業(yè)。拓爾思以大數(shù)據(jù)+人工智能為發(fā)展戰(zhàn)略,旨在幫助客戶實現(xiàn)從數(shù)據(jù)洞察到智慧決策的飛躍。
拓爾思的核心業(yè)務(wù)包括軟件產(chǎn)品研發(fā),行業(yè)應(yīng)用解決方案和數(shù)據(jù)分析挖掘云服務(wù)三大板塊,涉及大數(shù)據(jù)管理、信息安全、互聯(lián)網(wǎng)營銷和人工智能等應(yīng)用方向。
拓爾思是自主可靠軟件產(chǎn)品領(lǐng)域的領(lǐng)軍企業(yè),TRS中文全文檢索系統(tǒng)、WCM內(nèi)容管理平臺、CKM中文文本挖掘等軟件均代表了國內(nèi)相關(guān)領(lǐng)域自主創(chuàng)新的最高水平。同時拓爾思不斷拓寬產(chǎn)品線和綜合服務(wù)能力,為政府、媒體、安全、金融等多個行業(yè)提供領(lǐng)先的產(chǎn)品、技術(shù)和解決方案。為了迎接云計算時代的來臨,公司近年來加快了基于云服務(wù)的數(shù)據(jù)分析和知識服務(wù)的發(fā)展步伐,旨在實現(xiàn)軟件企業(yè)的戰(zhàn)略轉(zhuǎn)型和升級。
精倫電子股份有限公司
精倫電子股份有限公司是“武漢·中國光谷”國家級高新技術(shù)企業(yè),成立于1994年,于2002年上市,是中國首家以全自然人作為發(fā)起人的上市公司,注冊資本24,604.46萬元,股票代碼:600355。現(xiàn)有精倫工業(yè)園位于武漢總部,占地310畝。
精倫電子致力于各類電子智能終端的研發(fā)、設(shè)計與生產(chǎn)。目前公司主營產(chǎn)品包括:電子廣告媒體終端;電子伺服系統(tǒng)終端;二代身份證閱讀終端;電子交易終端;電力終端;家庭媒體娛樂終端;導(dǎo)航定位終端等。涵蓋了:通訊、電力、傳媒、三網(wǎng)融合、工業(yè)縫紉制造、公共安全等多個領(lǐng)域。并提供各類產(chǎn)品的服務(wù)平臺、系統(tǒng)及整體設(shè)計、運營方案。
精倫電子一直秉承自主知識產(chǎn)權(quán)和核心技術(shù)為基礎(chǔ)的理念,每年投入銷售利潤的較大部分作為研發(fā)投入,與華中科技大學(xué)、上海浦東等地建立合作研發(fā)基地。擁有國家人事部批準(zhǔn)的博士后科研工作站,在嵌入式操作系統(tǒng)、嵌入式硬件設(shè)計、嵌入式軟件設(shè)計、音頻視頻信號處理、智能卡應(yīng)用技術(shù)、大型數(shù)據(jù)庫應(yīng)用設(shè)計、網(wǎng)絡(luò)信息安全設(shè)計技術(shù)等方面形成了自主核心技術(shù)體系。承建了多項國家高技術(shù)實施項目。公司正在逐步成為業(yè)界領(lǐng)先的智能終端研發(fā)與設(shè)計基地。
上海益深電子有限公司
上海益深電子有限公司,為專業(yè)從事語音芯片和家電控制芯片開發(fā)、生產(chǎn)、銷售的高科技企業(yè)。主營單片機和DSP芯片以及相關(guān)電子產(chǎn)品和模組,承接各種專業(yè)控制方案開發(fā)。公司秉承“顧客至上,銳意進取”的經(jīng)營理念,堅持的原則,為廣大客戶提供最優(yōu)質(zhì)的服務(wù)。業(yè)務(wù)范圍:涉及汽車電子、多媒體、安全防盜、通信器材、家電控制、醫(yī)療器械、工業(yè)自動化控制、益智玩具及互動消費類產(chǎn)品等領(lǐng)域。
南京子佩軟件科技有限公司
南京子佩軟件科技有限公司是是從事通訊類產(chǎn)品研發(fā)、生產(chǎn)、銷售及提供相關(guān)通訊運營服務(wù)的高科技企業(yè),公司擁有一批經(jīng)驗豐富、技術(shù)過硬,致力于語音通訊和數(shù)據(jù)通訊產(chǎn)品開發(fā)與應(yīng)用的技術(shù)隊伍,公司是目前國內(nèi)最有影響的電話語音卡/電話語音盒/電話錄音盒系列話務(wù)信息產(chǎn)品提供商之一,公司采用ISO9001質(zhì)量保證體系和當(dāng)前全球先進的語音通訊前沿技術(shù),致力于為中國及全球企業(yè)提供高品質(zhì)系列話務(wù)信息產(chǎn)品。
廣州科靈電子有限公司
廣州科靈電子有限公司是智能一卡通設(shè)備制造企業(yè),主營:停車場收費管理系統(tǒng)、停車場設(shè)備、高清車牌識別一體機、遠(yuǎn)距離藍牙系統(tǒng)、道閘/擋車器、人行通道閘(三輥閘、擺閘、翼閘)、電子巡更系統(tǒng)、車位/區(qū)位引導(dǎo)系統(tǒng)、電動伸縮門、崗?fù)ぁ㈤T禁考勤系統(tǒng)、梯控管理系統(tǒng)、交通輔助設(shè)施等系列產(chǎn)品,公司擁有完整、科學(xué)的質(zhì)量管理體系。
深圳伊蘭度科技有限公司
是專業(yè)從事停車場門禁設(shè)備研發(fā),生產(chǎn)為一體的高科技公司。公司研發(fā)中心分為硬件、軟件、機電三個研發(fā)部門,座落于深圳硅谷動力產(chǎn)業(yè)園內(nèi),主要從事停車場一卡通軟件硬件產(chǎn)品的研發(fā)設(shè)計,并為客戶提供軟件,硬件個性化的定制服務(wù)。 產(chǎn)品有:道閘機、停車場系統(tǒng)、藍牙遠(yuǎn)距離、車牌自動識別系統(tǒng)、地感控制器、票箱、售飯機、售飯系統(tǒng)、消費機、食堂售飯機、食堂刷卡機、巡更機、巡更棒、巡更器、巡更系統(tǒng)、巡檢器等產(chǎn)品。
評論
查看更多