如何測試和優(yōu)化骨傳導(dǎo)產(chǎn)品?結(jié)構(gòu)聲應(yīng)用是關(guān)鍵
藍牙耳機的應(yīng)用日益頻繁,但是,藍牙耳機的使用有一個重大問題仍未解決:在嘈雜環(huán)境中,藍牙耳機的麥克風離使用者的嘴巴更遠,導(dǎo)致在耳機麥克風處捕獲到的講話者語音信號的信噪比顯著降低。
骨傳導(dǎo)傳感器可以提高信噪比。但是如何測試和優(yōu)化帶骨傳導(dǎo)傳感器的耳機產(chǎn)品,這在之前行業(yè)內(nèi)一直是一片空白。為此,HEAD acoustics 改善了頭和軀干模擬器 (HATS) HMS II.3 LN-HEC (根據(jù)ITU-T P.57 [1]配備 type 4.4 人工耳 ),以對入耳式藍牙耳機的人體結(jié)構(gòu)音信號進行逼真的模擬。
本文從人體結(jié)構(gòu)聲測量和模擬的背景知識入手,介紹了使用結(jié)構(gòu)聲作為耳機信號處理中附加輸入信號的潛在益處,并用測量試驗和測試結(jié)果加以說明。
01、人體結(jié)構(gòu)聲——測量和模擬
測試耳機結(jié)構(gòu)聲的第一步,就必須了解耳機的骨傳導(dǎo)傳感器應(yīng)該放置在哪個位置,才是讓使用者聲音的人體結(jié)構(gòu)聲傳輸?shù)绞褂谜叨械淖顑?yōu)路徑。為此, 我們在入耳式耳機模型中放置了一個結(jié)構(gòu)聲傳感器,并且在不同人類個體身上進行測量。目的就是為了測量空氣聲和結(jié)構(gòu)聲的單獨頻譜。這些測量結(jié)果讓我們對個體傳播差異有了大概了解,成為獲取平均傳遞函數(shù)的基礎(chǔ)。
除此之外, 我們采集到的信息也顯示了男性和女性之間是否存在巨大差異。作為測試的一部分, 我們對11名女性和24名男性進行了測量。圖1 對比了個體結(jié)構(gòu)聲信號與嘴參考點(MRP)的空氣聲信號。圖2顯示了這兩個信號的男性講話者和女性講話者的平均值。這種差異主要表現(xiàn)在300 Hz以下的頻率范圍內(nèi),此時女性聲音由于基頻較高,往往沒有任何信號能量。因此,我們選擇男性平均頻譜作為結(jié)構(gòu)聲模擬的目標頻譜。
圖1: 不同測試人員的個體空氣聲信號與嘴參考點(MRP)的個體結(jié)構(gòu)聲信號進行對比
圖2: 平均結(jié)構(gòu)聲信號與嘴參考點(MRP)的平均空氣聲信號進行對比
下一步是模擬人體結(jié)構(gòu)聲。我們在人工頭HMS II.3 LN-HEC上接入了激勵器,在進行人體測量的位置準確地再現(xiàn)了人工耳中的平均人體結(jié)構(gòu)聲。圖3顯示了新的LN-HEC人工耳的模擬結(jié)構(gòu)聲與平均人體結(jié)構(gòu)聲的頻譜。請注意,由于目前可用傳感器的信噪比不足,只能對3 kHz以下的結(jié)構(gòu)聲模擬進行精準測量。如圖3所示,模擬在±3 dB的容差范圍內(nèi),是可以接受的。
圖3:模擬平均結(jié)構(gòu)聲與人類平均結(jié)構(gòu)聲對比
02、耳機信號處理和結(jié)構(gòu)聲的有待改進之處
耳機信號處理中使用結(jié)構(gòu)聲的主要目的是改善分離效果:近端講話者和近端背景噪聲的分離、近端講話者和近端受損講話者的分離、近端講話者和遠端講話者的 (雙講檢測)的分離。
使用結(jié)構(gòu)聲的第二個好處就是傳輸結(jié)構(gòu)聲信號,而非近端麥克風信號,至少在低頻中是這樣的。結(jié)構(gòu)聲幾乎沒有背景噪聲,因此理想情況下是“噪聲消除”。
圖4顯示了噪聲消除模塊收到的信號。使用結(jié)構(gòu)聲信號可以顯著改善近端語音和受損信號的分離。在增強信號處理方面會發(fā)生什么?噪聲消除模塊是一種自適應(yīng)濾波器,可以評估背景噪聲,并通過評估其信號功率和盡量降低噪聲水平等各種策略來降低背景噪聲。噪聲估計越精準,消除噪聲效果越好。
圖4: 這些是近端噪聲消除模塊的信號
然而,分離噪聲和語音是復(fù)雜的。噪聲消除模塊可能會無法收斂,導(dǎo)致語音信號降低。如果能夠更好地基于結(jié)構(gòu)聲區(qū)分語音和噪聲,則可以大幅改善自適應(yīng)控制??梢詢鼋Y(jié)自適應(yīng)或降低自適應(yīng)速度,以此避免噪聲消除模塊的發(fā)散。
因此,可以提供一個帶有低背景噪聲的高質(zhì)量語音信號。共同講話者的行為與之類似。假設(shè)只評估戴耳機的說話者的聲音的傳輸信號,則共同講話者的聲音就能被當做是背景噪聲。
03
真實的入耳式耳機的測量結(jié)果
基于這項基礎(chǔ)研究,我們對不同耳機進行了測量。測試設(shè)置使用的是典型的實驗室基礎(chǔ)配置——根據(jù)ETSI TS 103 224[2]標準,用八個揚聲器和一個預(yù)錄的背景噪聲進行仿真聲場模擬。人工頭放置在測試房間中,并將耳機小心地戴在人工頭上。所有實驗使用的語音信號都基于建議書ITU-T.P501[3]。測試結(jié)果在穩(wěn)定的狀態(tài)下不太可能會顯示出任何差異,因此我們針對骨傳導(dǎo)模擬的性能差異創(chuàng)建了特定的測試序列。
如圖5所示,測試序列A側(cè)重于噪聲消除模塊的潛在發(fā)散。如果背景噪聲突然出現(xiàn),發(fā)散可能會發(fā)生。那么在這種情況下,語音和噪聲也許無法再分離,并且在噪聲未充分消除時,語音可能會降級。
圖 5: 此處顯示了測試序列A及相應(yīng)分析
在語音信號停止后直接測量剩余的背景噪聲可以很好地了解噪聲消除性能。降噪量表示即使語音存在,噪聲消除模塊也能有效收斂的效率。圖 6 和圖 7 給出了兩個示例結(jié)果。
圖6: 在上行中帶有和不帶有骨傳導(dǎo)模擬的設(shè)備1噪聲頻譜,背景噪聲:根據(jù)ETSI TS 103 224用3PASS[2][4]模擬的公共噪聲。
圖 7: 在上行中帶有和不帶有骨傳導(dǎo)模擬的設(shè)備2噪聲頻譜,背景噪聲:根據(jù)ETSI TS 103 224用3PASS[2][4]模擬的公共噪聲。
有結(jié)構(gòu)聲和沒有結(jié)構(gòu)聲的剩余噪聲頻譜差異明顯,耳機性能之間的差異亦是如此。雖然設(shè)備1僅在高達500 Hz的頻域提升了高達30 dB,而設(shè)備2在傳輸?shù)恼麄€語音頻譜上將背景噪聲降低了多達30 dB。
實驗 B
類似的測試序列可以用來評估共同講話者存在的情況,該測試無需使用背景噪聲,而是用第二個人工頭模擬共同講話者。這個實驗的測試序列如圖8所示。
圖8: 此處顯示了有同時講話者時的測試序列A及相應(yīng)分析
你可以在實驗中使用不同的講話者位置。在本文中,我們討論一個特別有意思的組合。圖9顯示了兩個共同講話者的位置。在位置1中,人工頭直接面對戴有耳機的講話者。在位置2上,共同講話者對同一方向進行講話。
圖9: 此處顯示同時講話者的兩個位置
這兩種場景的測試結(jié)果非常有趣。對于設(shè)備1,共同講話者的兩個位置并沒有差異,也沒有觀察到骨傳導(dǎo)模擬的差異和缺失。(圖10)
圖10: 在上行中帶有和不帶有骨傳導(dǎo)模擬的同時講話者語音頻譜,同時講話者處于位置1
設(shè)備2的結(jié)果卻大相徑庭。當講話者面向戴著耳機的人并對其方向說話時,在傳輸上沒有任何衰減。但旋轉(zhuǎn)90°后,設(shè)備2就顯示出了差異,第二說話者無法再對戴著耳機的人說話,并且當骨傳導(dǎo)存在時,他的聲音被判定為背景噪聲(圖11),衰減程度大約為10 dB。
圖11: 在上行中帶有和不帶有骨傳導(dǎo)模擬的共同講話者語音頻譜,共同講話者處于位置2
實驗 C
第三個測試使用了圖12所示的測試序列。該測試側(cè)重于在背景噪聲之后存在語音時噪聲消除模塊的潛在發(fā)散。在這里,我們重點介紹語音信號(S-MOS)受損和降噪性能的變化。根據(jù)ETSI TS 103 281 [6] 規(guī)定,此類基于感知的評價測試可以使用3QUEST[5]來測量這些差異。
圖 12: 此處顯示了測試序列B和相應(yīng)分析
兩種設(shè)備的測試結(jié)果(表1和表2)顯示,使用骨傳導(dǎo)感應(yīng)能顯著改善語音質(zhì)量(S-MOS)。在這兩款設(shè)備中,改進了的語音檢測都有助于更好地控制降噪器。當存在背景噪聲的情況下,語音信號的劣化程度降低,語音質(zhì)量更高。通過這種方式,可以在實驗室中有效地測試和優(yōu)化帶有骨傳導(dǎo)傳感器的設(shè)備,以更好地調(diào)整降噪算法。
表 1: 背景噪聲存在場景下設(shè)備1的S、N和G-MOS結(jié)果
表 2: 背景噪聲存在場景下設(shè)備2的S、N和G-MOS結(jié)果
實驗 D: 雙講
結(jié)構(gòu)聲感應(yīng)也能使雙講情況得到改善。在通話設(shè)備中,回聲消除能防止遠端收聽者聽到近端產(chǎn)生的回聲??偟膩碚f,回聲消除裝置(圖13)是一種自適應(yīng)濾波器,對回聲路徑進行建模,并且通過減去逆回聲信號使回聲信號最小化。如果不能有效地檢測受損的近端語音信號,回聲消除裝置會發(fā)散。自適應(yīng)控制質(zhì)量至關(guān)重要,回聲與近端講話人信號的分離效果越好,在雙講情況下回聲消除效果就越好。使用骨傳導(dǎo)信號可以改善這種分離,因為它僅代表近端語音信號。
圖 13: 此處顯示了回聲消除器的基本功能和相關(guān)信號
結(jié)構(gòu)聲仿真在測試現(xiàn)代耳機時起著舉足輕重的作用。只有對人體產(chǎn)生的空氣聲和結(jié)構(gòu)聲模擬進行相互補充,才能全面評估和優(yōu)化耳機在不同對話情形下的性能。HEAD acoustics 推出全新帶有骨傳導(dǎo)聲模擬的低噪人工頭HMS II.3 ViBRIDGE,內(nèi)置的高靈敏度麥克風能夠提供一流的動態(tài)范圍:本底噪聲低至16 dBSPL(A),使得該頭部與軀干模擬器成為測量近耳與入耳式音頻及通信設(shè)備的理想之選。麥克風的最大聲壓級高至 148 dBSPL(A),因此該人工頭也同樣適合用于測量免提系統(tǒng)、車內(nèi)通訊系統(tǒng)或智能音箱中的遠耳聲學(xué)傳感器。了解 HMS II.3 ViBRIDGE 詳細信息,請點擊下圖。
參考目錄
[1] Recommendation International Telecommunication Union (ITU) ITU-T P.57 (06/21): Artificial Ears
[2] European Telecommunications Standards Institute (ETSI) ETSI TS 103 224: Speech and multimedia Transmission Quality (STQ); A sound field reproduction method for terminal testing including a background noise database
[3] Recommendation ITU-T P.501: Test signals for use in telephony and other speech-based applications
[4] HEAD acoustics datasheet: 3PASS
[5] HEAD acoustics datasheet: 3QUEST
[6] European Telecommunications Standards Institute (ETSI) ETSI TS 103 281: Speech and multimedia Transmission Quality (STQ); Speech quality in the presence of background noise: Objective test methods for super-wideband and fullband terminals
(本文編譯自發(fā)表于 2023年1月audioXpress文章, 作者:Dr. Hans W. Gierlich)
作者簡介:
Hans W. Gierlich 于1983年在亞琛工業(yè)大學(xué)的通信工程研究所開始了他的職業(yè)生涯。1988年2月,獲得電氣工程博士學(xué)位。1989年,加入 HEAD acoustics并擔任副總裁。 自1999年以來,一直擔任HEAD acoustics電信部門的負責人。2014年,被任命為董事會成員。 Hans主要從事聲學(xué)、語音信號處理及其感知效果、QOS和QOE主題、測量技術(shù)、語音傳輸和音頻質(zhì)量。 他積極參與各種標準化機構(gòu),如ITU-T、3GPP、GCF、IEEE、TIA、CTIA、DKE和VDA。任歐洲電信標準協(xié)會(ETSI)“語音和多媒體傳輸質(zhì)量”技術(shù)委員會副主席,2016年至2020年擔任主席。2021被評為ETSI院士。
- 下一篇:時域傳遞路徑優(yōu)化分析
- 上一篇:重磅!奇瑞汽車大連兩大項目啟動!
廣告 編輯推薦
最新資訊
-
國內(nèi)首個“路空一體”國家質(zhì)檢中心落戶廣東
2026-03-04 09:06
-
全國156個!IAE智行眾維入選!工信部2025年
2026-03-04 09:05
-
瓦力大作戰(zhàn)|輕科普——誤碼儀(BERT)架構(gòu)
2026-03-04 09:03
-
是德科技推出適用于AI數(shù)據(jù)中心的Scale-Up驗
2026-03-04 09:03
-
“汽車爬坡試驗方法”將有國家標準
2026-03-03 12:44





廣告


























































