色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談 聲音人機交互技術(shù)

電子工程師 ? 來源:搜狐 ? 作者:搜狐 ? 2021-03-23 10:09 ? 次閱讀

如果你同時保留著看電視和聽廣播這兩個習慣——或者,看視頻網(wǎng)站的同時會去找些播客節(jié)目聽聽,那么你一定會注意到一個顯著的區(qū)別:視頻節(jié)目的豐富程度和制作上的復雜度遠高于音頻節(jié)目。例如,《新聞聯(lián)播》的片頭20多年換了四五次,體現(xiàn)了電視技術(shù)的最新進步,但片頭音樂一直不變,人們也能接受。電視節(jié)目的攝影棚幾年就得來一次大翻新,但現(xiàn)在的廣播電臺依然可以使用十幾年前的音頻制作系統(tǒng)來播出節(jié)目,直播間里的時光仿佛停滯一般。

人類在同一時刻用眼睛可以接收的信息量遠高于用耳朵能接收到的,視覺可以判別空間位置、形狀和顏色疊加起來的豐富信息,比聽覺高了不止一個維度。在看到人說話的時候,我們接收到的不只是話語內(nèi)容,還包括人的面部特征和表情的細微變動,這都對氛圍和情緒有著潛移默化的影響。相應的,聽覺接收到的話語內(nèi)容可以用手語或者字幕替代,但視覺附加的更多信息卻難以轉(zhuǎn)化回音頻。

歷史上,圖書和報紙已經(jīng)給了人們在視覺信息接收方面的訓練,人們將排版經(jīng)驗延伸到電影和電視上。盡管留聲機和電影技術(shù)幾乎處于同一時代,但人們卻寧愿忍受很多年沒有同期聲的無聲電影時代,寧愿用隨便什么音樂放一下做背景了事。可見,人們習慣上對圖像比對聲音重視得多。

同樣,信息時代的到來也毫不例外的優(yōu)先偏愛圖像。90年代電腦同時具備獨立的顯卡和聲卡,技術(shù)進步之后,人們對聲卡抱著無所謂的態(tài)度,卻追求獨立顯卡和屏幕的畫質(zhì),以至于追求手機攝像頭的精度。在交互方面,大家非常注重GUI(圖形用戶界面),而對于聲音的設計處理一般比較馬虎,還停留在很多年前的水平。

隨著智能手機帶來的趨勢,一塊巨大的觸屏成為人們交互的全部載體,跑在上面的應用也隨著一股奇怪的扁平化風潮而變得越來越樣式單一,設計師為了與眾不同又好用的界面而絞盡腦汁。對于音頻而言,它終于迎來了走出冷宮的機會。人機交互的下一波趨勢,將很可能在聲音——而不是圖像——方面迎來突破。

聲音不重要,還是人們沒發(fā)現(xiàn)它的重要?

“在汽車出現(xiàn)之前,人們都以為自己想要一臺更快的馬車。”這句話大家也許都很熟悉。在iOS 7和微軟Metro界面出現(xiàn)之后,一夜之間各種UI設計都趨向于扁平,而流行多年的擬物化設計很快就退潮了。這表明,人們的審美態(tài)度是可以因為外界的強力驅(qū)動而受到很大的改變的,并不是一成不變。所以對音頻交互也是如此:并不是說聲音相對于圖像而言不重要,而是需求沒有得到很好的引導。

聲音有什么好處?它是否有足夠潛力成為不可替代的載體呢(為什么我們獲得的是相反的信號,比如交通廣播電臺即將被打車軟件的搶單聲埋葬)?

首先,習慣聲音交互可以讓我們的感覺器官均衡利用,換句話說就是保護眼睛。長期使用手機,比如在地鐵盯著屏幕或者睡覺之前刷屏,會出現(xiàn)很多健康問題,其實不僅限于眼睛,手持閱讀介質(zhì)的姿勢不同,全身都可能受影響。

而且,作為必須全神貫注進行的活動,閱讀(包括觀看視頻)需要完全沉浸進去,和外界隔離,引發(fā)的心理問題也不容忽視。不管是閱讀長文還是碎片化消息,眼睛接受的信息量通常過大,人們接受了過量的信息,以至于形成信息過載而不自覺。

使用聲音可以讓人們強制減少信息攝入量,并更自如的利用碎片時間。對孩子而言,聲音(不使用耳機)也是一種親切自然的交互方式,有助于讓孩子早期就接觸電腦,而不用擔心用眼,孤獨等副作用。

此外,隨著我們使用智能設備的“戶外場景”增多,就像這個年頭智能手表終于迎來了春天一樣,為短信息和免提式交互量身定制的聲音也會派上更大用場。戶外場景其實主要就是開車或者是提著東西走路。在這種情況下,顯然眼睛就只是拿來看路才更合適。

一個例子是,交通電臺提交路況信息,從原來的短信平臺改為用微信公眾號發(fā)送語音,電臺會直接播出上傳的語音。這樣,司機可以不停車,用藍牙耳機播報路況,讓整個交流過程更像是真正的無線電臺一樣。

最后,聲音可以極大的幫助視障人士走入信息化。如果不是親身接觸,你根本無法想象視覺在如今的交互中占有如何舉足輕重的地位。完全不用眼睛的網(wǎng)頁瀏覽,必須忍受讀屏軟件以飛快到基本聽不清的速度給你播報每一個文字和圖片信息,而很多圖片都沒有妥當?shù)奈谋?a target="_blank">標簽,在沒有充分無障礙化的頁面,比如淘寶店鋪,使用者就會完全陷入迷茫。

在幫助文本信息轉(zhuǎn)語音,方便視障人士方面,騰訊可能是國內(nèi)公司中嘗試時間最長的公司,QQ2010正式支持讀屏軟件并延續(xù)至今,其他應用如QQ音樂也增加了支持。隨著語音命令可用范圍進一步擴大,電腦之門將會更廣闊地對盲人朋友敞開。

讓基于聲音的人機交互變得更自然

擬人的聲音交互現(xiàn)在來到一個艱難的瓶頸期。著名的“恐怖谷理論”認為,當機器人與人類相像超過一定程度的時候,哪怕與人類有一點點的差別,都會顯得非常顯眼刺目,讓整個機器人顯得非常僵硬恐怖,讓人有面對行尸走肉的感覺。

廠商跟風推進語音助手成為所有手機、手表的標準配置之后,它正逐步降低人們的心理障礙,培養(yǎng)使用習慣。如上所述,對待機器我們很自然的操作方式是“動手不動口”,對著機器說話會感覺很奇怪。但是調(diào)戲Siri或者小娜,已經(jīng)一定程度上在幫我們克服這種障礙。

這就給語音助手進一步提升智能程度贏得了寶貴的時間。等到一個真正如人類一般智能的聲音出現(xiàn)時,人們對于對著電腦傾訴,侃侃而談,就不會太排斥,電影《Her》當中出現(xiàn)的戀上機器聲音的情節(jié),也會獲得更多用戶的共鳴。

如果一個虛擬的人類聲音始終會讓人心生抗拒,那最理想的辦法是機器直接執(zhí)行人類短促簡單的語音命令。比如說你走到家門說開門,那么就只是把門打開,不會有什么多余的回應說“好的,我這就把門打開”。

另一種可行的辦法是讓機器用“顯然不是普通人類”的聲音與人交互,比如現(xiàn)在還有點“單字蹦”的Siri和谷歌娘,或者故意用萌化的聲音說“主人回家了喵”,類似這樣的方法其實就是在智能不到位的時候用裝傻賣萌來補充。既然不像真人,也就沒有必要感到不舒服了。

技術(shù)進步和概念創(chuàng)新可以互相驅(qū)動

當我們站在現(xiàn)在回顧iPhone出現(xiàn)之前的手機市場,我們會發(fā)現(xiàn),現(xiàn)在的應用形態(tài)有很多是當年不可想象的。這當中很多更新都基于硬件交互方式的改進,比如多點觸摸,GPS、NFC/RFID和各種感應器的協(xié)同作用。所以我們有同樣的信心認為,只要用心去開發(fā)語音的交互功能,就會出現(xiàn)更多我們現(xiàn)在無法想象的新的交互方式。

有時候,當新的交互到來的時候,我們才會驚奇的發(fā)現(xiàn)為其鋪墊的技術(shù)因素已經(jīng)成熟;而只要出現(xiàn)一個合理的產(chǎn)品,它起到的標志性作用就會引導業(yè)界進行自主革新,提升性能和降低成本。

在聲音交互方面,Siri就是一個很好的例子。它需要輸入和輸出技術(shù)——語音識別和文字轉(zhuǎn)語音共同配合。而Siri出現(xiàn)的時候,這兩種技術(shù)都已經(jīng)到了接近能用的程度——就中文而言,語音播報不再那么“單字蹦”了,而多種第三方語音引擎的識別率更可以在安靜環(huán)境下達到90%以上,并順理成章成為眾多山寨Siri的選擇。它的結(jié)果就是廠商跟風推進語音助手成為所有手機、手表的標準配置。

不管是可穿戴設備,還是普通的電腦,是家庭游戲機或客廳的機頂盒,以至于智能家居和汽車,聲音交互都是非常有用的。但是截至目前,人們對于它的探索還是非常被動。比如說,只有當智能手表在輸入上出現(xiàn)障礙的時候才想到用語音輸入,而并非主動的探索用語音作為屏幕顯示的替代方案。所以,如果進一步整合現(xiàn)有技術(shù),能夠給我們帶來一個具有示范作用的應用,就會顯著加速業(yè)界對聲音交互場景的研究。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • RFID
    +關(guān)注

    關(guān)注

    388

    文章

    6189

    瀏覽量

    238308
  • gps
    gps
    +關(guān)注

    關(guān)注

    22

    文章

    2900

    瀏覽量

    166507
  • nfc
    nfc
    +關(guān)注

    關(guān)注

    59

    文章

    1629

    瀏覽量

    180793
收藏 人收藏

    評論

    相關(guān)推薦

    清華牽頭深開鴻參與:混合智能人機交互系統(tǒng)獲批立項

    近日,一個由清華大學牽頭、深開鴻重點參與的“面向混合智能的自然人機交互軟硬件系統(tǒng)”研發(fā)計劃項目,正式獲得了立項批準。該項目是國家“十四五”重點研發(fā)計劃“先進計算與新興軟件”專項中的一項關(guān)鍵核心技術(shù)
    的頭像 發(fā)表于 01-23 16:33 ?147次閱讀

    啟英泰倫新推出多意圖自然說,重塑離線人機交互新標準!

    智能語音識別技術(shù)作為人機交互領(lǐng)域的一場革命性突破,正逐步重塑我們與智能設備的交互方式。近期,啟英泰倫新推出了多意圖自然說技術(shù),進一步增強了人機交互
    的頭像 發(fā)表于 01-03 16:01 ?169次閱讀
    啟英泰倫新推出多意圖自然說,重塑離線<b class='flag-5'>人機交互</b>新標準!

    上海交大團隊發(fā)表MEMS視觸覺融合多模態(tài)人機交互新進展

    ? 近日,上海交通大學電子信息與電氣工程學院微米納米加工技術(shù)全國重點實驗室劉景全團隊和上海交通大學人工智能學院盧策吾團隊在人機交互領(lǐng)域取得重要進展,相關(guān)成果以“Capturing forceful
    的頭像 發(fā)表于 11-28 10:50 ?1146次閱讀
    上海交大團隊發(fā)表MEMS視觸覺融合多模態(tài)<b class='flag-5'>人機交互</b>新進展

    芯海科技ForceTouch3.0:重塑人機交互新境界

    在追求極致用戶體驗的智能時代,每一次技術(shù)的革新都是對未來的深度探索。芯海科技,作為業(yè)界領(lǐng)先的芯片設計企業(yè),憑借其ForceTouch3.0技術(shù),正引領(lǐng)著一場人機交互的變革,為智能手機、智能穿戴、家電乃至汽車電子等領(lǐng)域注入了全新的
    的頭像 發(fā)表于 11-28 09:20 ?263次閱讀
    芯海科技ForceTouch3.0:重塑<b class='flag-5'>人機交互</b>新境界

    新的人機交互入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)隨著智能眼鏡的出現(xiàn),加之AI技術(shù)的應用,AI智能眼鏡被認為是下一代人機交互的入口。在今年,不少品牌廠商都推出了AI智能眼鏡新品,包括李未可推出的Meta Lens
    的頭像 發(fā)表于 11-21 00:57 ?3157次閱讀
    新的<b class='flag-5'>人機交互</b>入口?大模型加持、AI眼鏡賽道開啟百鏡大戰(zhàn)

    具身智能對人機交互的影響

    在人工智能的發(fā)展歷程中,人機交互一直是研究的核心領(lǐng)域之一。隨著技術(shù)的進步,人機交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再到現(xiàn)在的自然語言處理和語音識別,每一次技術(shù)
    的頭像 發(fā)表于 10-27 09:58 ?416次閱讀

    聚徽-工控一體機是如何實現(xiàn)人機交互

    工控一體機實現(xiàn)人機交互的方式是多種多樣的,結(jié)合搜索結(jié)果,我們可以歸納出以下幾種主要的實現(xiàn)方式:
    的頭像 發(fā)表于 09-10 09:31 ?398次閱讀

    基于傳感器的人機交互技術(shù)

    基于傳感器的人機交互技術(shù)是現(xiàn)代科技發(fā)展的重要領(lǐng)域之一,它極大地推動了人機交互的便捷性、自然性和智能性。本文將詳細探討基于傳感器的人機交互技術(shù)
    的頭像 發(fā)表于 07-17 16:52 ?988次閱讀

    人機界面交互方式的介紹

    人機界面(Human-Computer Interaction, HCI)是研究人與計算機之間交互方式的學科。隨著計算機技術(shù)的發(fā)展,人機交互方式也在不斷地演變和創(chuàng)新。以下是對各種
    的頭像 發(fā)表于 07-01 14:22 ?974次閱讀

    人機交互界面是什么_人機交互界面的功能

    人機交互界面(Human-Computer Interaction Interface,簡稱HCI或HMI),也被稱為人機界面(MMI)、操作員界面終端(OIT)、本地操作員界面(LOI)或操作員
    的頭像 發(fā)表于 06-22 11:03 ?2785次閱讀

    工業(yè)平板電腦在人機交互中的應用

    工業(yè)平板電腦在人機交互(Human-Machine Interaction,HMI)中扮演著至關(guān)重要的角色,它們通過直觀的界面和強大的計算能力,極大地提升了工業(yè)環(huán)境下的操作效率和用戶體驗。以下是工業(yè)平板電腦在人機交互中的具體應用:
    的頭像 發(fā)表于 06-18 12:00 ?325次閱讀

    人機交互與人機界面的區(qū)別與聯(lián)系

    隨著信息技術(shù)的飛速發(fā)展,人機交互(Human-Computer Interaction,HCI)已成為現(xiàn)代社會不可或缺的一部分。人機交互技術(shù),作為實現(xiàn)人與計算機之間有效通信的橋梁,不僅
    的頭像 發(fā)表于 06-07 15:29 ?1116次閱讀

    芯海科技“壓容二合一SoC”系列芯片打造極致人機交互體驗

    5月7日晚,蘋果春季新品發(fā)布特別活動推出全新升級的Apple Pencil Pro,持續(xù)深度布局壓力觸控人機交互領(lǐng)域。
    的頭像 發(fā)表于 05-11 10:00 ?543次閱讀
    芯海科技“壓容二合一SoC”系列芯片打造極致<b class='flag-5'>人機交互</b>體驗

    人機交互的三個階段 人機交互的常用方式

    交互經(jīng)歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發(fā)表于 03-13 17:25 ?3298次閱讀

    人機交互系統(tǒng)的發(fā)展史及過程步驟

    人機交互系統(tǒng)還包括用戶界面(UI),它是用戶與系統(tǒng)之間進行信息交流和控制活動的載體。用戶界面可以是軟件系統(tǒng)界面,通過顯示器呈現(xiàn)系統(tǒng)信息,并接收來自用戶的視覺、聽覺等感官的輸入。
    的頭像 發(fā)表于 03-11 17:15 ?2643次閱讀
    <b class='flag-5'>人機交互</b>系統(tǒng)的發(fā)展史及過程步驟
    主站蜘蛛池模板: 果冻传媒视频在线观看完整版免费| 日本视频一区二区免费观看| 亚洲AV成人无码999WWW| 国内自拍 在线 亚洲 欧美| 伊人久久精品AV一区二区| 免费看国产曰批40分钟| 动态抽插图视频| 亚洲熟女丰满多毛XXXXX| 美女pk精子4| 国产成年网站v片在线观看| 亚洲一区精品伊人久久伊人| 男人把女人桶到爽免费看视频| 干性感美女| 一二三四在线观看韩国| 啪啪啪社区| 精品成人片深夜| qvod 韩国| 亚洲欧美日韩在线观看一区二区三区| 嫩B人妻精品一区二区三区| 国产精品日韩欧美一区二区三区 | 男人到天堂a在538线| 公交车被CAO到合不拢腿| 永久adc视频年龄确认| 日本乱子人伦在线视频| 久久精品动漫99精品动漫| 高清撒尿hdtube撒尿| 中文字幕在线视频网站| 国产成人亚洲综合无| 伊人久久精品午夜| 熟女人妻-蜜臀AV-首页| 男人和女人一级黄色大片| 国产在线播放91| 成人网视频在线观看免费| 在线日本v二区不卡| 亚洲第一免费播放区| 日本湿姝在线观看| 毛片手机在线| 久久观看视频| 国产午夜精品AV一区二区麻豆| videossexotv极度另类| 在线亚洲中文精品第1页|