導讀:聲控電梯這波熱潮帶來的化學反應。
你是否想過,未來某一天,你可以像喚醒智能音箱一樣語音控制電梯?
在這場疫情到來之前,我不曾想過這個問題。
但是,在疫情中,它確實在某些醫(yī)院、園區(qū)、寫字樓中開始應用。
改造一部聲控電梯,需要幾步?
2020年,復工后的生活讓在家中備受各類種疫情信息轟炸的上班族多少有些憂慮,當從“云辦公”切換到“坐班制”的模式時,這種憂慮尤其明顯。
經(jīng)歷了封路、封城、小區(qū)戒嚴,如今世衛(wèi)組織又將新冠肺炎列為“大流行病”,一百多個國家出現(xiàn)確診病例超10萬例,讓區(qū)域防控機制不斷升級??爝f、外賣、公共交通均針對疫情做出了調控,通過無接觸避免病毒傳播,因疫情而起的無接觸服務由此席卷了關乎民眾出行的各個行業(yè),甚至電梯這一狹小空間也被考慮在內。
不得不說,物聯(lián)網(wǎng)時代對用戶體驗的高度重視,以及各廠商的響應速度,達到了常人難以想象的地步。不少電梯廠商通過與互聯(lián)網(wǎng)廠商合作,應用各類新興控制方案,開始對電梯進行改造。
其中,智能語音方案在此期間應用尤其廣泛,聲控電梯也成為疫情期間被喚醒的一類“新物種”。
2月18日,思必馳位于蘇州騰飛創(chuàng)新園的總部大樓完成了聲控電梯的改造。
整部電梯的改造其實可以分為內外兩部分,
整個聲控電梯改造過程很快,不過由于考慮到安全性、可靠性等因素,我們當時請了原裝電梯的售后工程師來做現(xiàn)場指導,我們邊做邊學,實際上也只用了兩個小時。
思必馳IoT產(chǎn)品總監(jiān)梅劍雄告訴雷鋒網(wǎng)。
思必馳在此次疫情期間推出了智能電梯離線語音方案,這一方案在思必馳總部大樓電梯中的應用,多少有些場景驗證的意思,其實早在2月2日,內部就已正式立項并開始緊急研發(fā)的方案。
當時的主要工作是將我們此前成熟的語音方案移植到電梯場景中,做一套完整的智能電梯語音方案。
到2月15日,這一方案的軟硬件其實都已經(jīng)調試完成,當時在找實際落地設備時,想到我們公司大樓剛好有電梯,于是就和公司申請,將這一方案應用到了我們總部大樓的電梯中。
看似一次簡單的電梯改造,看似一個簡單的語音方案研發(fā),其實中間仍有諸如語音模型訓練、硬件方案設計等諸多細節(jié),這些細節(jié)的打磨主要解決的是拾音、降噪問題。
語音模型:電梯場景中特殊的噪音與降噪
國際上針對智能語音技術的識別率、翻譯準確率等參數(shù)的相關競賽已經(jīng)進行了將近十年,智能語音技術也迭代優(yōu)化了近十年,如今智能語音技術的成熟度已經(jīng)足以支撐相關產(chǎn)品應用到家居、車載等生活場景中,市面上也有了科大訊飛、思必馳、云知聲、聲智科技等一批以語音技術為核心的AI獨角獸企業(yè)及初創(chuàng)企業(yè)。
雷鋒網(wǎng)向多家廠商了解到,電梯場景中的語音方案與家居、車載場景中的語音方案基本類似,不過由于所需的控制功能(呼叫電梯、選層)更簡單,不需要太多定制化,最需要考慮的反而是基本的降噪問題。
電梯場景中應用的語音控制方案需要考慮哪些噪聲?梅劍雄解釋稱:
其實在密閉的電梯空間中,噪聲分兩種,設備自身的噪聲,如開關門產(chǎn)生的摩擦聲、運行的聲音、通風設備的風噪;還有外部的噪聲,如乘客說話的聲音、電梯開關門產(chǎn)生的風壓,開關門產(chǎn)生的風壓噪聲。
其實這些因素在此前多年研發(fā)的方案中我們都有考慮到,只不過此次在電梯中應用需要做一些特殊的定制優(yōu)化。
對于這樣的噪聲處理,思必馳通過對降噪算法進行場景化優(yōu)化,以及搭載自家生態(tài)公司深聰智能研發(fā)的語音芯片TH1520.進行降噪。
我們針對語音算法在芯片上做了很大的性能優(yōu)化,使得算法與芯片完全適配,這樣就可以通過此前80%的算力實現(xiàn)100%的性能,節(jié)省下來的算力可以通過增加算法的復雜度,進一步提升降噪能力。
正如神槍手都是用子彈喂出來的一樣,好的AI算法也都需要用大量數(shù)據(jù)來訓練,AI語音算法顯然也是如此。據(jù)梅劍雄透露,思必馳智能電梯語音方案研發(fā)過程中,一周內,通過公司員工和思必馳的眾包平臺收集了數(shù)萬分鐘電梯場景下的錄音數(shù)據(jù)(其中80%為有效數(shù)據(jù))作為數(shù)據(jù)集對模型進行了再次訓練和優(yōu)化。
在硬件上,我們對麥克風的位置也做了多次調整,需要反復多次試驗,以尋求在電梯場景下的最佳位置。
據(jù)官方信息顯示,思必馳此次發(fā)布的智能電梯離線語音方案,“1-3米喚醒成功率>97%、識別率>95%”。
同樣對智能語音解決方案有深入理解的科大訊飛,也在近期對外發(fā)布了智能電梯離線語音方案,科大訊飛消費者業(yè)務群AIoT平臺產(chǎn)品研發(fā)部副總經(jīng)理周正友告訴雷鋒網(wǎng):
考慮到電梯運行噪音的干擾、封閉小空間聲場的變化、空間光滑引起的聲音反射的變化等干擾因素,訊飛智能電梯語音解決方案采用傳統(tǒng)HMM-NN模型和基于深度學習的End-to-End方案的混合模型架構,發(fā)揮End-to-End系統(tǒng)高召回率的特性,同時兼顧HMM-NN系統(tǒng)誤喚醒穩(wěn)定的特性。此外,在語音模型和聲學模型上也做了優(yōu)化:
語音模型,采用了基于深度學習的解碼網(wǎng)絡,針對高頻詞匯進行了重點訓練,增強高頻指令集的識別率,降低串擾率;
聲學模型,針對電梯密閉場景以及常用詞匯(尤其是數(shù)字)進行訓練數(shù)據(jù)擴充,提升高頻指令集的音素切分效果。
離線語音方案只是智能語音技術中的一個分支,可以通過對本地指令的支持和識別,來滿足諸如電梯此類更為本地化、更加注重功能性的場景應用。
然而,在此次疫情中也涌現(xiàn)出了諸多智能電梯在線語音方案,包括科大訊飛、云知聲等廠商在發(fā)布智能電梯離線智能語音方案的同時,也發(fā)布了在線版語音方案。
在線語音方案or離線語音方案?
與離線語音方案不同的是,在線語音方案需要有較好的網(wǎng)絡環(huán)境支撐,通過網(wǎng)絡連接到云端資源,提供除“選擇樓層”、“開關電梯門”這些基本功能型操作之外的語音播報信息的能力。
訊飛智能電梯在線語音方案除具備離線方案的所有功能外,還可實現(xiàn)更加豐富的語音交互功能,包括播報海量云端信息,實現(xiàn)百余種語音技能,動態(tài)切換及數(shù)十位發(fā)音人等。
對于二者功能上的差異,周正友這樣解釋。
在線語音方案在提供更豐富的語音播報功能和信息的同時,其實也提高了軟硬件成本,例如硬件層面需要加裝網(wǎng)絡相關的傳感器。當然,即使在線語音方案成本更高,但相對于電梯成本來說,也是九牛一毛。
是該選在線語音方案,還是選離線語音方案,除去成本外,還有三個因素值得考慮:
第一,網(wǎng)絡環(huán)境是否允許。在線語音方案涉及到云端資源的應用,因而需要有較好的網(wǎng)絡環(huán)境支撐,因而尤其在電梯這樣特殊場景,是否有優(yōu)質網(wǎng)絡直接決定了選擇擁有更豐富功能的在線語音方案是否會有與之相匹配的更好的用戶體驗。
第二,施工周期能否接受。相對離線語音方案來說,在線方案部署更復雜,部署周期也更長。
同樣推出了智能電梯離/在線語音方案的云知聲告訴雷鋒網(wǎng),“純離線語音方案部署起來非???在線方案部署涉及到對電梯井的網(wǎng)絡部署等工作,部署會更復雜,周期也會更長。疫情期間客戶對方案部署周期很重視,所以現(xiàn)在市面上已經(jīng)落地的智能電梯語音方案采用純離線方案的會更多。”
第三,是否需要更多的語音播報等功能。電梯中的語音控制方案是否需要更多的語音播報功能,這主要看電梯廠商或酒店、地產(chǎn)等應用方的考慮。
從功能上而言,離線語音方案已經(jīng)能夠滿足當下基本應用需求,而且離線語音方案的語音交互穩(wěn)定性更高、響應速度也更快。
不過在線方案除去能夠提供更多的語音播報功能外,雷鋒網(wǎng)認為,更實用的還是在控制方式上引入了更多可能。云知聲此次在智能電梯方案中引入「小程序梯控」功能,正是基于在線語音方案用戶可以通過手機小程序遠程呼叫電梯。
在線方案的應用,為智能電梯的控制方式提供了更多可能;在線語音方案的應用,其實更多還是智能電梯需求側對于智能語音此類技術高智能化的期望。
具體到實際應用場景中,還需要考慮另一個問題——該方案要覆蓋的是前裝市場,還是后裝市場。
電梯行業(yè)的前裝市場與后裝市場
前裝市場、后裝市場概念常見于汽車行業(yè)中,其實,在電梯行業(yè)中,也有類似的前裝市場與后裝市場之分。
在電梯行業(yè)中,前裝市場和后裝市場的界限可以理解為在于是否已出廠。電梯出廠前,包括沒有完成或已經(jīng)完成的電梯產(chǎn)品都可以認為是前裝市場產(chǎn)品;電梯出廠后,已經(jīng)安裝到各樓宇的電梯則是后裝市場產(chǎn)品。
電梯前裝與后裝兩類場景,由于工程部署的環(huán)境不同,電梯改造難易程度也不同,智能語音技術廠商也會提供完全不同的解決方案。
在前裝市場,由于是在原廠生產(chǎn)或改裝過程中加入的語音方案,因而只需要將語音模塊嵌入到電梯中,所以他們可能只需要一個主控模塊;
對于后裝市場而言,尤其像這次疫情中亟需改造的電梯,我們會提供一個即插即用的模塊,直接安裝到電梯中,完成簡單的接線就可以使用。
對于兩類場景所需的解決方案的差異,梅劍雄在實際項目研發(fā)中深有體會,具體針對以上兩類應用市場,又可以將智能電梯語音解決方案從工程部署上分為兩類:
第一類,通過485或CAN總線實現(xiàn)語音模塊與電梯中控系統(tǒng)的通信,這類方案接線少,但需要通過電梯原廠或供應商配合完成方案改造,改造周期較長;
第二類,通過線控并聯(lián)方式,通過語音模擬物理按鍵實現(xiàn)改造(典型案例如思必馳總部大樓電梯的改造),這類方案實施起來更快,但由于電梯屬于特種安全設備,仍需要有專業(yè)的電梯售后現(xiàn)場指導。
湖北宜昌第二人民醫(yī)院聲控電梯安裝現(xiàn)場,圖源:啟英泰倫官網(wǎng)
顯然,前裝市場對智能語音方案的需求和應用,更符合產(chǎn)品研發(fā)的常規(guī)邏輯,這樣的產(chǎn)品研發(fā),其實早年間已經(jīng)開始,在疫情期間升溫的智能電梯語音方案,也已經(jīng)在電梯廠商發(fā)布會的PPT上,甚至部分國際電梯品牌的高端產(chǎn)品線中出現(xiàn)多年。
電梯物聯(lián)網(wǎng)的這幾年
訊飛在2016年就已經(jīng)有了智能電梯語音解決方案,此前幾年也不斷有電梯廠商來訊飛交流。
科大訊飛告訴雷鋒網(wǎng)。
科大訊飛涉足電梯行業(yè)之初,首先考慮的是前裝方案,杭州西奧電梯正是科大訊飛在電梯領域的早期合作廠商,雙方合作可以追溯到2018年。
2018年8月,西奧電梯到科大訊飛合肥總部進行了一次深入交流,也是在此次交流之后,雙方開始合作研發(fā)智能電梯(在線)語音方案,當時用到的正是科大訊飛麥克風陣列解決方案,據(jù)科大訊飛透露,這一方案其實早在2019年年初就已經(jīng)調試完成。
在2020年疫情期間的新聞報道中,西奧電梯余杭區(qū)工廠中的三臺配備智能語音功能的電梯用到的正是此前與科大訊飛合作的智能電梯在線語音方案。
智能電梯語音方案其實只是電梯行業(yè)對大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能相關技術應用的冰山一角,近年來,隨著經(jīng)濟下行倒逼產(chǎn)業(yè)升級,傳統(tǒng)電梯產(chǎn)業(yè)對數(shù)字化、智能化技術變革的熱情已經(jīng)燃燒多年,包括奧的斯、日立、三菱、迅達、西奧等國內外知名電梯品牌已經(jīng)早早開始將物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能技術應用到電梯產(chǎn)品中。
電梯物聯(lián)網(wǎng)的概念由此而生。
電梯物聯(lián)網(wǎng)不僅僅是呼梯方式的一次變革,更重要是通過對電梯加裝信息采集設備(或模塊)以及多種有線、無線傳輸技術,將電梯的運行狀態(tài)、故障報警、監(jiān)控視頻等信息匯聚到物聯(lián)網(wǎng)綜合管理平臺上,通過多種算法對數(shù)據(jù)進行分析處理,實現(xiàn)電梯的智能運維。
相對于智能電梯而言,電梯物聯(lián)網(wǎng)是一個更為時髦的概念,但多數(shù)電梯廠商對于這一概念并不陌生。
早在2016年,日立電梯對外發(fā)布了Lumada物聯(lián)網(wǎng)核心平臺,將大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等技術應用到電梯產(chǎn)品中。日立電梯副總裁賈宇輝此前在接受媒體采訪時表示,將大數(shù)據(jù)應用于電梯上,其一可以為定向產(chǎn)品研發(fā)提供數(shù)據(jù)支持;其二進行可預見性的維護,為維修員工提前準備好重點信息;其三和建筑方面的數(shù)據(jù)結合,應用于相關場景。
2018年5月,在世界電梯博覽會上,奧的斯推出了Otis ONE物聯(lián)網(wǎng)服務平臺(又稱數(shù)字化電梯維保服務平臺);也是在此次展會上,奧的斯還展示了集成亞馬遜Alexa和微軟Cortana語音控制功能的智能電梯。
西奧電梯總裁周俊良此前也表示,“隨著智能化程度越來越高,電梯廠商需要考慮如何跟上時代的步伐。西奧電梯在2012年新工廠采購設備開始考慮數(shù)據(jù)連接問題,西奧電梯的目標是通過人臉識別、智能語音等技術打造'會思考有溫度的電梯'。其中,如碧桂園、融創(chuàng)等西奧電梯的戰(zhàn)略合作伙伴已經(jīng)開始啟用智能電梯?!?/p>
目前西奧電梯在物聯(lián)網(wǎng)技術方面有怎樣的應用和布局?西奧電梯告訴雷鋒網(wǎng):
幾年前,西奧就已經(jīng)啟動了物聯(lián)網(wǎng)技術和智能化技術的布局,西奧的北斗星智能服務系統(tǒng)就是采用了物聯(lián)網(wǎng)相關技術,通過數(shù)據(jù)采集、平臺計算、提前預警這些措施提升我們對客戶需求的響應速度和服務質量。
智能化的身份識別梯控技術,既保障了業(yè)主的安全,也使他們的乘梯體驗越來越好,比如業(yè)主回家通過單元門機時,就可以為他召好電梯,自動登記上樓的目的樓層,出門下樓時只需要在家里的室內機登記上要去的樓層,電梯就會幫他自動按好下樓的按鈕,電梯到達時自動登記要去的1樓或地下車庫等樓層,全程實現(xiàn)無接觸乘梯。
對于年輕一族,我們也研發(fā)了使用手機遠程呼梯的產(chǎn)品,所有的乘梯過程操作在乘梯前手機上一次性操作完成,這個產(chǎn)品在商務辦公寫字樓尤其受歡迎。
在物聯(lián)網(wǎng)這波浪潮中,傳統(tǒng)電梯行業(yè)也在生產(chǎn)側、管理側,以及產(chǎn)品側極力尋求變革。疫情期間,無接觸服務的興起,為智能電梯語音方案的落地應用提供了一個“機會”,顯然,一些智能語音技術廠商、電梯廠商也抓住了這樣的機會,開始將聲控電梯這一青澀少年推到聚光燈下。
等待“機會”的三股力量
2016年,科大訊飛在逐步推進AIoT的行業(yè)落點的進程中了解到,在智能樓宇的體系下,電梯控制中真實存在著智能語音交互場景。
首先,從智能樓宇的發(fā)展趨勢來看,多模態(tài)交互在不同空間、場景中的應用是一個必然趨勢;其次,電梯也是我們智能家居概念一個延伸的應用場景。
基于這樣的邏輯,科大訊飛開始著手研發(fā)智能電梯語音方案。
雷鋒網(wǎng)向業(yè)內人士了解到,當時,關注智能電梯語音方案的除了電梯廠商,還有另外兩股力量:
地產(chǎn)商。諸如萬科、碧桂園等頭部地產(chǎn)商本身就在打造智能樓宇概念,電梯智能化自然也成了這些廠商的關注點;
智能家居行業(yè)集成商。這類廠商也希望將智能電梯語音方案融合到自家提供的智能家居或智能樓宇方案,不過由于此前部分智能語音技術廠商更偏重于做前裝方案,與電梯廠商合作較為緊密,集成商在二者間難以找到合適的定位;隨著智能語音技術廠商針對后裝市場推出越來越多的語音方案,集成商也將有更多的進入機會。
盡管技術已經(jīng)相對成熟、方案也已就位,甚至得到了從集成商、設備廠商、地產(chǎn)商供需鏈條上各環(huán)節(jié)的關注,但是智能電梯語音方案此前始終未能成為電梯或高端電梯的標配,即使配有語音方案的電梯,也只是作為呼梯操作的補充方式。
對此,西奧電梯認為主要有以下兩方面原因:
第一,客戶形成一定的用戶習慣需要一個培養(yǎng)期,而目前市場尚未對語音呼梯進行全方位的推廣;
第二,語音識別系統(tǒng)在應用過程中需要逐步適應各類方言和口音,逐步完善其功能。
因此,三股力量都在等待一個“機會”,一個提升用戶對智能電梯語音方案的認知,讓用戶對智能電梯語音方案的接受度不再只是停留在好奇層面的“機會”;一個智能電梯語音方案成熟度足以應付狹小電梯轎廂復雜聲學環(huán)境及各類方言的“機會”。
與此同時,智能語音技術廠商也需要一個機會來在實際應用場景中證明自己,從而拿到一張通向(國內)年出貨量百萬臺,市場保有量超700萬臺,市場規(guī)模在2020年將超4000億的電梯行業(yè)的特別通行證。
“無接觸服務”的興起帶來正是這樣一個機會。
科大訊飛告訴雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)),隨著無接觸服務的興起,從需求側來看,開始有更多的電梯廠商找我們合作,地產(chǎn)廠商對智能電梯語音方案的關注度也更高了。
思必馳市場總監(jiān)陳輝龍也向雷鋒網(wǎng)透露,目前,思必馳智能電梯語音方案已有超過80家意向客戶。
電梯按鍵會被取消嗎
經(jīng)年之后,配有語音方案的電梯終于走向市場時,傳統(tǒng)按鍵是否會被逐漸取代?
對于這個問題,各類廠商雖然觀點略有不同,但結論卻很一致:不會。
科大訊飛認為,電梯是一個對安全性要求非常高的產(chǎn)品,置身其中的用戶會認為按鍵更有安全感,因而語音方案完全取代按鍵這件事,至少現(xiàn)在還不會出現(xiàn)。
思必馳認為,至少在十年之內,電梯按鍵(物理按鍵或觸屏按鍵)不會被取代,而未來更多會是多模態(tài)交互方式,包括按鍵、語音、人臉識別,甚至手勢識別等組成的多模態(tài)交互方式將成趨勢。
西奧電梯也表示,疫情過后,雖然還是不一定會成為無接觸乘梯的主流方案,但用戶對語音呼梯的認識較之前肯定有一個明顯的接受度,隨著語音技術的越來越成熟越來越可靠,以及成本的越來越低,相信將會成為電梯智能化的一部分。比如乘電梯時雙手拿著東西不方便按電梯按鈕,殘疾盲人使用語音呼梯肯定會比去觸摸電梯盲文按鈕來的方便。
2020年,在抗擊疫情中出現(xiàn)的無接觸服務讓聲控電梯有機會走入大眾視野,也使得語音方案在未來智能電梯的多模態(tài)交互系統(tǒng)中有了一席之地;與此同時,聲控電梯這波熱潮帶來的化學反應,或將撬動千億級電梯市場,促使整個電梯行業(yè)的智能化進程加速并入快車道。