應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個(gè)人注冊登錄

首款使用深度學(xué)習(xí)清除通話噪音的無線耳塞

2022-07-14 17:19 煤油燈科技

導(dǎo)讀:隨著在COVID-19疫情封鎖期間會議轉(zhuǎn)移到網(wǎng)上,許多人發(fā)現(xiàn),嘰嘰喳喳的室友、垃圾車和其他響亮的雜音會打斷了重要的對話。這經(jīng)歷啟發(fā)了華盛頓大學(xué)的三位研究人員(他們在COVID-19期間是室友)研發(fā)出了更好的耳塞,為了增強(qiáng)說話人的聲音和減少背景噪音,“ClearBuds”使用了一種新的麥克風(fēng)系統(tǒng)和第一個(gè)實(shí)時(shí)操作的機(jī)器學(xué)習(xí)系統(tǒng),該系統(tǒng)可以在智能手機(jī)上運(yùn)行。


隨著在COVID-19疫情封鎖期間會議轉(zhuǎn)移到網(wǎng)上,許多人發(fā)現(xiàn),嘰嘰喳喳的室友、垃圾車和其他響亮的雜音會打斷了重要的對話。這經(jīng)歷啟發(fā)了華盛頓大學(xué)的三位研究人員(他們在COVID-19期間是室友)研發(fā)出了更好的耳塞,為了增強(qiáng)說話人的聲音和減少背景噪音,“ClearBuds”使用了一種新的麥克風(fēng)系統(tǒng)和第一個(gè)實(shí)時(shí)操作的機(jī)器學(xué)習(xí)系統(tǒng),該系統(tǒng)可以在智能手機(jī)上運(yùn)行。

研究人員于6月30日在ACM移動系統(tǒng)、應(yīng)用和服務(wù)國際會議上介紹了這個(gè)項(xiàng)目。

“ClearBuds在兩個(gè)關(guān)鍵方面區(qū)別于其他無線耳機(jī),”Paul G. Allen(保羅·艾倫)計(jì)算機(jī)科學(xué)與工程學(xué)院的博士生Maruchi Kim說。首先,ClearBuds使用了雙麥克風(fēng)陣列,每個(gè)耳塞上的麥克風(fēng)可以產(chǎn)生兩個(gè)同步的音頻流,提供信息,并允許我們在空間上以更高的分辨率分離來自不同方向的聲音。其次,輕量級的神經(jīng)網(wǎng)絡(luò)進(jìn)一步增強(qiáng)了說話人的聲音。”

雖然大多數(shù)商業(yè)耳塞也在每個(gè)耳塞上都有麥克風(fēng),但只有一個(gè)耳塞在同一時(shí)間主動向手機(jī)發(fā)送音頻。使用ClearBuds耳機(jī),每個(gè)耳塞都會向手機(jī)發(fā)送一串音頻,研究人員設(shè)計(jì)了藍(lán)牙網(wǎng)絡(luò)協(xié)議,允許這些數(shù)據(jù)流在70微秒內(nèi)同步。

該團(tuán)隊(duì)的神經(jīng)網(wǎng)絡(luò)算法在手機(jī)上運(yùn)行來處理音頻流。首先,它會抑制任何非語音的聲音,然后它會隔離并增強(qiáng)同時(shí)從兩個(gè)耳塞揚(yáng)聲器的聲音——傳入的任何噪音。

Allen School的博士生Ishan Chatterjee說:“因?yàn)檎f話者的聲音與兩個(gè)耳塞的距離很近,而且距離大致相等,所以神經(jīng)網(wǎng)絡(luò)可以訓(xùn)練成只關(guān)注他們的聲音,消除包括其他聲音在內(nèi)的背景聲音,這種方法和你自己耳朵的工作原理非常相似,它們利用聲音到達(dá)你左右耳朵的時(shí)間差來判斷聲音來自哪個(gè)方向?!?/p>

當(dāng)研究人員將 ClearBuds 與蘋果的AirPods Pro 進(jìn)行比較時(shí),ClearBuds 表現(xiàn)更好,在所有測試中實(shí)現(xiàn)了更高的信號失真比。

”Allen School的博士生Vivek Jayaram說:“當(dāng)你考慮到我們的神經(jīng)網(wǎng)絡(luò)在iPhone上運(yùn)行不到20毫秒這一事實(shí)時(shí),這是非常了不起的,與通常用于運(yùn)行神經(jīng)網(wǎng)絡(luò)的大型商業(yè)顯卡相比,iPhone的計(jì)算能力只是一個(gè)小部分,我們?nèi)绾卧诒3州敵鲑|(zhì)量的同時(shí)減少傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的大小?這是我們在這篇論文中必須解決的挑戰(zhàn)的一部分。

研究小組還在“野外”對ClearBuds進(jìn)行了測試,他們記錄了8個(gè)人在嘈雜的環(huán)境中閱讀“古登堡計(jì)劃”,比如在咖啡店或繁忙的街道上。然后,研究人員讓37人對這些10到60秒的錄音片段進(jìn)行打分,參與打分者認(rèn)為通過ClearBuds的神經(jīng)網(wǎng)絡(luò)處理的片段具有最好的噪音抑制和最好的整體聆聽體驗(yàn)。

研究人員說,ClearBuds的一個(gè)限制是人們必須同時(shí)戴上兩種耳塞才能獲得噪音抑制的體驗(yàn)。

但該團(tuán)隊(duì)表示,這里開發(fā)的實(shí)時(shí)通信系統(tǒng)可以用于各種其他應(yīng)用,包括智能家居揚(yáng)聲器、跟蹤機(jī)器人位置或搜索和救援任務(wù)。

團(tuán)隊(duì)目前正在努力提高神經(jīng)網(wǎng)絡(luò)算法的效率,以便它們能夠在耳塞上運(yùn)行。