車內語音識別—VUI實驗案例
該調查同時表明,車內語音界面的用戶中有大約50%認為VUI(語音用戶界面)性能在過去的兩年中沒有顯著的提升。
時至今日,大部分人仍舊認為VUI是一個小工具,并不能替代傳統(tǒng)觸控屏以及物理按鍵這樣強大的用戶界面。盡管語音識別引擎在過去十年中已經取得重大進展,車內VUI性能的可靠性還是不盡如人意。語音信號受到干擾以及駕駛過程中的噪聲即使對最前沿的語音識別引擎仍然是一種挑戰(zhàn)。

圖1:語音控制手冊
當今的汽車制造商會隨車提供一份本車VUI使用手冊,比如寶馬。但這些手冊實質上把VUI創(chuàng)造合適運行環(huán)境的責任丟給了用戶。
手冊中針對用戶的典型說明包括:“請避免背景噪聲”,“在執(zhí)行語音指令時,請車內乘客保持安靜”等諸如此類的語句。這也難怪用戶會因為機器無法準確識別他們的語音指令而心塞,從而對VUI又少了一份信任,減少了使用頻率。
這正是Kardome的切入點所在。Kardome的技術能夠讓VUI在車內有多人講話并且存在環(huán)境噪聲的現(xiàn)實環(huán)境中工作。Kardome的軟件允許多位用戶同時與設備進行交互,不受到同車乘客說話的影響,即使在身處嘈雜的車廂環(huán)境中,也能享受到語音技術服務。Kardome能夠最大程度地保障行車安全,為駕駛員/乘客提供優(yōu)質的VUI使用體驗。
本文將分享由聲學解決方案以及聲音振動分析領域的領導者HEAD acoustics GmbH開展的實驗性研究的結果。該研究的目的是為了比較在120kph行駛速度的車內,分別使用標準免提電話音頻棧和Kardome Gavel evaluation Kit內由人工智能控制的信號分離與降噪技術這兩套語音處理系統(tǒng),搭配谷歌語音轉換文本(GSST)引擎測量得到的語音識別率。
結果表明Kardome的技術能夠在任何聲音環(huán)境下提升語音交互設備的語音識別能力。
SRR評價設置
Kardome的Gavel evaluation Kit被安裝在雷諾Megane Grandtour汽車的車廂頂部,緊挨著標準免提電話系統(tǒng)的麥克風。我們同時在車內架設了四套人工頭測量系統(tǒng),通過人工頭上的全語音頻帶的人工嘴來發(fā)送語音。

圖2:使用4套人工頭測量系統(tǒng)和Kardome Gavel evaluation Kit作為評估設置
我們考量了三種場景:
1.僅有主駕駛員說話
2.主駕與副駕同時說話
3.車內有四人同時說話
在以上所有場景中,位于車內的標準免提電話系統(tǒng)與Kardome的Gravel evaluation Kit會采集語音信號。HEAD acoustics的工程師通過比較GSST輸出的文本與駕駛員實際的語音內容來測試語音識別率。
結果
圖3顯示了上述每一種考量的場景下的語音識別能力。圖表中的每一根柱形圖代表了在3種場景下兩種語音處理方法(HFT與Kardome)測量得到的語音識別率。綠色柱形圖代表HFT方法,藍色柱形圖代表Kardome的語音集群系統(tǒng)。

總結
Kardome由人工智能控制的信號分離與降噪技術顯著地提高了實驗中考量的各場景下的語音識別率。隨著車內說話人數(shù)的增多,引入的對語音信號的干擾增強,非常明顯地降低了標準免提電話系統(tǒng)的結果表現(xiàn)。然而Kardome技術能夠免受車內說話人數(shù)與語音信號干擾的影響,始終保持穩(wěn)定的語音識別能力。
使用Kardome提供的VUI設計來提高語音識別技術,能幫助語音助手廠家克服語音識別低效的問題,還能幫助車廠提高競爭力,在即將成為市場紅海的帶有語音助手功能的智能汽車中占據(jù)一席之地。
(本文由海德聲科編譯,原文請見Speech Recognition in Cars - An Experimental VUI Study (kardome.com))
廣告 編輯推薦
最新資訊
-
聯(lián)合國法規(guī)R60對兩輪車操縱件與指示裝置的
2026-03-04 12:08
-
標準立項|《汽車異種材料鉚接接頭拉伸性能
2026-03-04 11:40
-
“汽車大角度座椅 第1部分:通用要求”將有
2026-03-04 11:39
-
“汽車大角度座椅 第2部分:可靠性要求”將
2026-03-04 11:39
-
電池耐久評價開始從“電池單體性能指標”轉
2026-03-04 11:38





廣告


























































