2024年4月15日-4月26日,國際電信聯(lián)盟標準化局(ITU-T)第16研究組(SG16)在法國雷恩召開了全體會議。由思必馳主導(dǎo),聯(lián)合中國信息通信研究院、中國電信提出的車載多音區(qū)語音交互國際標準(Framework and requirement for in-vehicle multi-region intelligent speech interaction system/車載多音區(qū)語音交互系統(tǒng)的框架與要求),在本次會議中進行了討論,并正式獲批立項。這也是在該領(lǐng)域中,首個由中國公司牽頭制定的新一代汽車語音交互國際標準。
關(guān)于ITU-T SG16
ITU(國際電信聯(lián)盟)為三大國際標準化組織之一,ITU-T即國際電信聯(lián)盟電信標準分局 (ITU-T for ITU Telecommunication Standardization Sector), 是ITU管理下的專門制定電信標準的分支機構(gòu)。ITU-T SG16是國際電信聯(lián)盟標準化局非?;钴S的研究組,主要研究領(lǐng)域為多媒體與e-Services。目前,SG16的研究范圍覆蓋了視頻與音頻處理與壓縮編碼、視頻監(jiān)控、內(nèi)容分發(fā)、大數(shù)據(jù)、區(qū)塊鏈、人工智能等眾多熱點標準化研究方向。
蓋世汽車研究院數(shù)據(jù)顯示,2023年車載語音交互滲透率達78.8%,相較于2022年提升5個百分點,其中免喚醒、連續(xù)識別、分區(qū)喚醒、可見即可說、聲紋識別等新一代語音交互相關(guān)功能的搭載率均有明顯提升。不同于以往單純的語音識別,新一代的高階語音交互逐漸成為新時代汽車的標配。
來源:蓋世汽車研究院《智能汽車HMI產(chǎn)業(yè)發(fā)展趨勢》
然而語音交互技術(shù)的實現(xiàn)鏈路較長,在智能座艙環(huán)境下更甚,不僅包括語音交互技術(shù)的全鏈路銜接、硬件選型,還涉及到與車機系統(tǒng)、應(yīng)用層、云端處理等環(huán)節(jié)的適配。當前汽車產(chǎn)業(yè)鏈國際化趨勢越來越高,跨國企業(yè)的不同部門、汽車企業(yè)與科技企業(yè)的研發(fā)團隊往往分屬于不同的國家和地區(qū)。車載語音交互系統(tǒng)的國際標準不統(tǒng)一,可能會在跨地域合作的過程中造成系統(tǒng)集成和技術(shù)升級的適配問題,從而影響項目實施的效率與效果。
本次《車載多音區(qū)語音交互系統(tǒng)的框架與要求》國際標準將圍繞車載多音區(qū)語音交互系統(tǒng)的語音輸入、語音識別、語義理解、語音合成、語音輸出、智能決策及系統(tǒng)對接等功能提出技術(shù)能力要求。通過規(guī)范智能座艙中高階語音交互鏈路中各個環(huán)節(jié)的輸出質(zhì)量與標準,以提高技術(shù)團隊對接效率,從而推進產(chǎn)品體驗的提升以及全球技術(shù)的無障礙交流。
作為本次國際標準的牽頭單位之一,思必馳在對話式人工智能全鏈路方面具有完整的技術(shù)創(chuàng)新體系和工程系統(tǒng)研發(fā)能力,擁有近100項全球獨創(chuàng)技術(shù),已授權(quán)知識產(chǎn)權(quán)近1500件,在多個國際性賽事上屢次奪冠,并率先攻克了車載座艙條件下的“雞尾酒會難題”(語音處理領(lǐng)域公認的最具挑戰(zhàn)性的技術(shù)難題,系指:多人同時說話時的語音分離和識別理解),實現(xiàn)了車內(nèi)不同座位的乘客可以同時與車載助理對話交互,而互相之間毫無影響,該項技術(shù)引領(lǐng)了車載智能座艙技術(shù)的變革。截止到目前,思必馳已累計牽頭/參與制定了近70項國家級/行業(yè)級/團體級標準,推動人工智能語音語言技術(shù)的規(guī)范化發(fā)展和應(yīng)用。
2019年,思必馳正式開啟汽車前裝業(yè)務(wù)。截至目前,思必馳已合作近60家汽車品牌,其中包括比亞迪、上汽通用五菱、長城汽車、北汽新能源、極氪汽車、哪吒汽車等中國前十大自主品牌,量產(chǎn)車型已超過160款,累計“上車”量超過1000萬。
2022年,思必馳汽車語音交互方案(天琴助手)通過中國信通院可信AI評測,并獲得L9級智能認證,是國內(nèi)目前已知的最高車載語音交互產(chǎn)品的智能等級認證。
2023年,蓋世汽車研究院《智能汽車HMI產(chǎn)業(yè)發(fā)展趨勢》數(shù)據(jù)顯示,根據(jù)上險量統(tǒng)計,思必馳語音上車增速第一,高達38%。
來源:蓋世汽車研究院《智能汽車HMI產(chǎn)業(yè)發(fā)展趨勢》
2024年,思必馳升級大模型技術(shù)全場景方案應(yīng)用,并開啟出海戰(zhàn)略,在汽車領(lǐng)域,一方面加大與海外車企的本土化合作,一方面伴隨中國新能源車企“走出去”。最近,思必馳參與編制的國內(nèi)首個汽車大模型標準也正式發(fā)布(《面向行業(yè)的大規(guī)模預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評估方法 第4部分:汽車》標準),聚焦汽車行業(yè)高質(zhì)量發(fā)展,助推汽車大模型產(chǎn)品升級優(yōu)化。
“一帶一路”倡議下,中國汽車工業(yè)走出去的戰(zhàn)略步伐越來越快,中國車企、技術(shù)企業(yè)與海外伙伴之間的合作越來越緊密。思必馳期待,通過車載多音區(qū)語音交互國際標準的制定及推行,一方面以自身技術(shù)儲備推動國際標準的建設(shè)與完善,填補此領(lǐng)域的空白;另一方面可以對車載語音交互的技術(shù)能力及軟硬件接口提出標準化的要求,促進國際間的技術(shù)交流與合作,助力汽車產(chǎn)業(yè)全球化發(fā)展!
審核編輯:劉清
-
語音交互
+關(guān)注
關(guān)注
3文章
286瀏覽量
28037 -
思必馳
+關(guān)注
關(guān)注
4文章
286瀏覽量
14293
原文標題:全球首個汽車語音交互ITU國際標準,由思必馳牽頭制定
文章出處:【微信號:思必馳,微信公眾號:思必馳】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論