導(dǎo)讀:“智能音箱正處于野蠻生長(zhǎng)的初級(jí)階段,擴(kuò)展到整個(gè)智能家居,都會(huì)經(jīng)歷這些初級(jí)階段,這時(shí)的隱私保護(hù),只能依賴(lài)于廠(chǎng)家自律,”徐家明堅(jiān)信,“當(dāng)這些產(chǎn)品徹底普及之后,一定會(huì)有更高級(jí)別的隱私規(guī)范出現(xiàn),統(tǒng)一行業(yè)、限制權(quán)限,并作為強(qiáng)制標(biāo)準(zhǔn)來(lái)執(zhí)行?!?/p>
女兒過(guò)生日時(shí),朋友送給司蘭一臺(tái)智能音箱,是市場(chǎng)上常見(jiàn)的主流品牌的款式,小方盒子、價(jià)格不高。司蘭對(duì)新奇事物的興趣一般,就隨手?jǐn)[放在了客廳,倒是6歲的女兒愛(ài)上了這個(gè)小音箱,總是纏著它講故事。
逐漸地,司蘭對(duì)這個(gè)智能音箱產(chǎn)生了好感?!昂?jiǎn)直是哄娃神器”,欣喜之余,她開(kāi)始在淘寶上瀏覽相關(guān)產(chǎn)品,計(jì)劃買(mǎi)一臺(tái)配置更高、音質(zhì)更好的款式。
直到數(shù)月前的一天,司蘭無(wú)意間打開(kāi)了與智能音箱連接的手機(jī)App,卻意外發(fā)現(xiàn),其中記錄的一段文字,正是自己與丈夫剛剛聊天內(nèi)容的文字轉(zhuǎn)寫(xiě)。令她驚訝的是,這段對(duì)話(huà)發(fā)生在女兒聽(tīng)完故事之后,理論上,音箱已經(jīng)處于休眠狀態(tài),不應(yīng)收取聲音,更不應(yīng)該將內(nèi)容傳輸至手機(jī)、并轉(zhuǎn)為文字。
“它一直在偷聽(tīng)我們家里的談話(huà)嗎?”疑慮浮現(xiàn)在司蘭的心頭。家人也對(duì)智能音箱產(chǎn)生了忌憚,新機(jī)購(gòu)買(mǎi)計(jì)劃自然擱淺,對(duì)于已有的這臺(tái)音箱,司蘭則選擇了“斷電”,“女兒喜歡聽(tīng)故事,聽(tīng)的時(shí)候開(kāi)一會(huì),聽(tīng)完就拔電源”。最近四、五個(gè)月,他們都是這樣使用的。
正在“監(jiān)聽(tīng)”的音箱
智能音箱第一起廣為人知的“竊聽(tīng)事件”發(fā)生于美國(guó)俄勒岡州。
2018年5月,Danielle的丈夫接到一位下屬的電話(huà):“馬上拔掉你的Echo設(shè)備插頭,你被黑客攻擊了!”Danielle居住在俄勒岡州波特蘭市,家中擁有四臺(tái)亞馬遜智能音箱Echo設(shè)備。當(dāng)天早些時(shí)候,她丈夫的這位下屬接到一份錄音文檔,隨手打開(kāi)后,卻聽(tīng)到了Danielle和丈夫在家中的私密談話(huà),夫妻倆正在商量使用哪個(gè)牌子的硬木地板。
震驚之下,Danielle拔掉了所有Echo設(shè)備電源,迅速撥打亞馬遜客服電話(huà)尋求解釋?zhuān)瑫r(shí),她將這一事件爆料給哥倫比亞廣播公司。
對(duì)于這一事故,亞馬遜給出的回復(fù)是“誤操作”,意思是,在運(yùn)行時(shí),Echo設(shè)備將一段對(duì)話(huà)的內(nèi)容誤解為指令,以為用戶(hù)希望將此前的語(yǔ)音內(nèi)容發(fā)送給通訊錄中的某個(gè)人,隨即執(zhí)行了這一指令。
Echo是亞馬遜推出的智能音箱,搭載其語(yǔ)音助手Alexa。截至2018年年中,Echo在美累計(jì)出貨約3500萬(wàn)臺(tái);根據(jù)CIRP預(yù)測(cè),其市占率達(dá)到70%,遠(yuǎn)超其它品牌。
頭部產(chǎn)品出事,消息迅速被廣泛傳播和發(fā)酵。不久之后,Echo的第二起“事故”又出現(xiàn)了。一位德國(guó)用戶(hù)向當(dāng)?shù)仉s志《c’t》爆料,當(dāng)他讓亞馬遜發(fā)給自己個(gè)人活動(dòng)的語(yǔ)音數(shù)據(jù)時(shí),卻收到了一個(gè)可供下載的100MB壓縮文件,下載內(nèi)容是一份解釋Alexa語(yǔ)音命令的PDF分類(lèi)記錄,以及1700份陌生人對(duì)話(huà)錄音。
《c‘t》聽(tīng)取了其中的部分錄音,發(fā)現(xiàn)根據(jù)對(duì)話(huà)內(nèi)容,可以“拼湊”出的生活細(xì)節(jié)包括:在家和外出的時(shí)間,家里其它品牌的智能設(shè)備,家中人員的性別,甚至包括用戶(hù)沐浴的聲音。
盡管亞馬遜對(duì)以上兩起事故均已致歉,卻未能掩蓋一個(gè)在輿論中逐漸成型的猜測(cè):作為一款新興設(shè)備,智能音箱的“竊聽(tīng)”或許不僅是隱患、而且真實(shí)存在?!八?tīng)到喚醒詞就可以啟動(dòng)工作,那是否意味著,智能音箱正在隨時(shí)隨地聽(tīng)取我們的談話(huà)?”司蘭這樣懷疑。
最近數(shù)月中,智能設(shè)備相關(guān)的更多“竊聽(tīng)”事故正在被曝出。今年7月,據(jù)國(guó)外媒體報(bào)道,蘋(píng)果的一名承包商稱(chēng),為了提升Siri的產(chǎn)品能力,蘋(píng)果會(huì)雇傭外部承包商審聽(tīng)錄音,其中包括了Siri在意外被激活時(shí)收錄的私密對(duì)話(huà),例如醫(yī)療信息、毒品交易和其它信息。
無(wú)獨(dú)有偶,同月,有消息傳出,谷歌智能助手會(huì)將錄下的聲音文件提供給公司員工,甚至世界各地的谷歌第三方承包商也能定期聽(tīng)取這些談話(huà)內(nèi)容。
對(duì)于智能音箱及內(nèi)置于各設(shè)備中的語(yǔ)音助手的疑慮正在蔓延,不僅是“竊聽(tīng)”,智能音箱偶爾出現(xiàn)的自啟動(dòng)現(xiàn)象也刺激了一部分用戶(hù)。從去年起,先后有用戶(hù)表示,Echo在未被喚醒時(shí),卻出現(xiàn)了“呵呵”的笑聲,令人毛骨悚然。
類(lèi)似現(xiàn)象也出現(xiàn)在一些國(guó)內(nèi)的智能音箱上。一位用戶(hù)透露說(shuō),家中擺放的智能音箱多次突然匯報(bào)“設(shè)備正在進(jìn)行系統(tǒng)升級(jí),已更新**個(gè)應(yīng)用”,“雖說(shuō)很正常的內(nèi)容,但家里沒(méi)其他人,音箱突然說(shuō)話(huà),每次都嚇我一跳?!鄙踔劣幸淮?,在她邀請(qǐng)朋友到家中做客,彼此相談甚歡時(shí),智能音箱突然被喚醒了,并毫無(wú)預(yù)兆地為眾人播放了一首林俊杰的《殺手》。
“帶屏”音箱則帶來(lái)了影像方面的疑慮,隨著“竊聽(tīng)事故”增多,有用戶(hù)懷疑稱(chēng),自家的帶屏音箱有“回家看看”的功能,既然可以遠(yuǎn)程直播家里正在進(jìn)行的情景,是否也會(huì)同時(shí)將這些影像記錄下來(lái),傳輸至其它地方?
人們對(duì)智能音箱這款新產(chǎn)品的疑惑越來(lái)越多。從“它在監(jiān)聽(tīng)我嗎”延伸至:它休眠時(shí)會(huì)收聲嗎?收聲之后,是否會(huì)存儲(chǔ)和傳輸這些對(duì)話(huà)?這些聲音真的會(huì)被人聽(tīng)到嗎?以及,它會(huì)被黑客攻擊,變成一個(gè)“竊聽(tīng)器”嗎?
謠傳與真相
“最近一年,身邊很多朋友買(mǎi)智能音箱前,都會(huì)來(lái)問(wèn)我監(jiān)聽(tīng)問(wèn)題”,張思成說(shuō)。他先后在多家公司的智能音箱部門(mén)工作,被朋友們視為行業(yè)專(zhuān)家。“比較有趣的是,問(wèn)完之后,幾乎每個(gè)人都還是買(mǎi)了音箱?!?/p>
據(jù)張思成及多位熟悉智能音箱的從業(yè)者介紹,智能音箱的識(shí)別工作分為“本地”和“云端”兩種情況,在智能音箱處于未喚醒狀態(tài)時(shí),為本地工作狀態(tài),雖然會(huì)收錄外界聲音,但不會(huì)對(duì)這些聲音進(jìn)行存儲(chǔ)與語(yǔ)義識(shí)別?!皢拘亚跋喈?dāng)于在做聲波識(shí)別的工作,”徐家明介紹說(shuō),“(智能音箱)將收錄的聲音與喚醒詞做對(duì)比,聲波相符時(shí),才會(huì)自動(dòng)打開(kāi)。”徐家明是一位智能音箱產(chǎn)品經(jīng)理。
張思成否認(rèn)了“偷偷監(jiān)聽(tīng)”的傳言,據(jù)他了解,市場(chǎng)主流的多款國(guó)產(chǎn)智能音箱無(wú)一存在主觀(guān)故意監(jiān)聽(tīng)的情況。
“這是一件成本很高的事情”,張思成認(rèn)為。他這樣算了一筆賬:假設(shè)一家企業(yè)累計(jì)售出100萬(wàn)臺(tái)音箱,有20萬(wàn)日活,如果企業(yè)要啟動(dòng)這些音箱做24小時(shí)監(jiān)聽(tīng),就算每秒鐘產(chǎn)生100k數(shù)據(jù),乘以20萬(wàn)的話(huà),累計(jì)起來(lái)傳輸帶寬、存儲(chǔ)和計(jì)算的花費(fèi)相當(dāng)驚人。
更關(guān)鍵的是,在當(dāng)前的技術(shù)處理能力下,企業(yè)尚不能將這些龐大而又碎片化的錄音轉(zhuǎn)化為有商業(yè)價(jià)值的有效信息。在張思成看來(lái),就算不考慮道德層面,只看商業(yè)利益,企業(yè)也沒(méi)有動(dòng)機(jī)去做主觀(guān)的信息收集。
據(jù)張思成回憶,在去年的一項(xiàng)由國(guó)家工信部主導(dǎo)的智能音箱檢測(cè)工作中,在未喚醒狀態(tài)下,各家智能音箱傳輸?shù)臄?shù)據(jù)量均僅為KB級(jí)別,對(duì)于語(yǔ)音資料而言,這一數(shù)據(jù)量幾乎可以忽略不計(jì)。
與“竊聽(tīng)”傳言較為相符的內(nèi)容是“喚醒詞”之后的智能音箱工作模式。
張思成和徐家明均承認(rèn),音箱被喚醒后,將進(jìn)入云端工作狀態(tài),將收取的聲音傳輸至云端服務(wù)器,完成語(yǔ)音語(yǔ)義識(shí)別和反饋工作?!斑@是無(wú)法避免的,”張思成有些無(wú)奈,他提到,目前智能音箱內(nèi)置的運(yùn)算能力,無(wú)法支撐AI類(lèi)的語(yǔ)音語(yǔ)義計(jì)算,更無(wú)法在本地實(shí)現(xiàn)識(shí)別能力的提升。
為了避免網(wǎng)絡(luò)故障和隱私問(wèn)題,在一些客戶(hù)定制的全屋智能中,張思成的公司曾提供過(guò)僅在本地運(yùn)算的語(yǔ)音方案。不過(guò),這將使功能性變得非常單一,僅支持固定命令,例如,主人回家后,可告訴語(yǔ)音助手“打開(kāi)燈”,但若換成“打開(kāi)這盞燈”,它便無(wú)法識(shí)別。
按照智能音箱的產(chǎn)品策略,當(dāng)用戶(hù)結(jié)束命令,如數(shù)秒內(nèi)無(wú)新聲音出現(xiàn),機(jī)器則會(huì)恢復(fù)休眠狀態(tài)?!懊考移放圃O(shè)定不太一樣,有的是3秒內(nèi)、有的是5秒內(nèi),”徐家明透露。然而,在實(shí)際工作中,由于智能音箱整體成熟度有限,“喚醒”和“休眠”均有可能出現(xiàn)誤差?!袄鐒偤糜新曇艉蛦拘言~相似,或者命令結(jié)束后有其他聲響,使智能音箱以為需要繼續(xù)工作,它就會(huì)持續(xù)收音,而用戶(hù)對(duì)此是不知道的?!睋?jù)他推測(cè),包括司蘭在內(nèi),眾多用戶(hù)遭遇的所謂“竊聽(tīng)事件”,均源于這類(lèi)原因。
據(jù)多位從業(yè)者介紹,目前智能音箱行業(yè)內(nèi)較理想的“誤喚醒率”約為每48小時(shí)2次,更糟糕的情況則達(dá)到每24小時(shí)2-3次,這無(wú)疑意味著誤操作下較高的所謂“竊聽(tīng)”頻率。“對(duì)于各家品牌來(lái)說(shuō),當(dāng)下最關(guān)鍵的都是提高AI能力,減少誤操作,收集來(lái)的語(yǔ)料是最好的訓(xùn)練素材?!毙旒颐魈岬?。
今年4月,彭博社的調(diào)查報(bào)道顯示,亞馬遜在全球有數(shù)千名工作人員負(fù)責(zé)人工聽(tīng)取和檢查用戶(hù)與Alexa的對(duì)話(huà),并對(duì)這些錄音進(jìn)行標(biāo)注、檢查、反饋,以降低誤操作,幫助Alexa更好地響應(yīng)指令。位于羅馬里亞的兩名亞馬遜員工提到,他們一天需要工作9小時(shí),解析音頻多達(dá)1000條。
“這在行業(yè)中其實(shí)不是秘密,”張思成認(rèn)為,不僅是國(guó)外品牌,在國(guó)內(nèi)幾家主流智能音箱品牌中,均有“人工審聽(tīng)”環(huán)節(jié)。為盡量保護(hù)用戶(hù)隱私,錄音在被人工聽(tīng)取前會(huì)進(jìn)行數(shù)據(jù)脫敏、打散,盡管員工會(huì)聽(tīng)到錄音對(duì)話(huà),甚至涉及私密事務(wù),但并不能識(shí)別用戶(hù)的具體身份?!霸谠贫诉^(guò)程中,音頻文件本身不會(huì)跟用戶(hù)賬號(hào)信息、設(shè)備信息相對(duì)應(yīng),主要是為了優(yōu)化指令?!眹?guó)內(nèi)一家主流智能音箱廠(chǎng)商回應(yīng)表示。
“被人工審聽(tīng)的語(yǔ)料不足總量的1%,主要集中在識(shí)別困難的內(nèi)容上,比如,當(dāng)音箱回答‘我不懂你在說(shuō)什么’,這句之前的內(nèi)容,會(huì)優(yōu)先選擇為人工審聽(tīng),”張思成解釋說(shuō)。在他此前任職的公司中,當(dāng)某些新功能上線(xiàn)時(shí),為提高其準(zhǔn)確率,某些特定語(yǔ)料的審聽(tīng)比例會(huì)提升至10%左右;不過(guò),這類(lèi)工作的持續(xù)時(shí)間很短,往往“用幾天時(shí)間攻關(guān)后,就恢復(fù)正常比例了”。徐家明同樣認(rèn)為,隨著AI模型識(shí)別能力的提高,企業(yè)采用人工審聽(tīng)的比例或?qū)?huì)有所降低。
智能音箱所錄取的語(yǔ)料不會(huì)被永久存儲(chǔ),前述音箱廠(chǎng)商稱(chēng),在完成識(shí)別后,音頻文件會(huì)被刪除?!懊恳患冶A粑募臅r(shí)間不等,我們這邊大概是幾個(gè)月?!毙旒颐餮a(bǔ)充說(shuō)。
無(wú)所遁形
無(wú)疑,智能音箱和其它語(yǔ)音助手類(lèi)產(chǎn)品,尚且不是一個(gè)成熟品類(lèi)。
這使此類(lèi)產(chǎn)品存在諸多漏洞,例如誤喚醒,再例如“黑客攻擊”。去年8月,在美國(guó)拉斯維加斯舉行的全球黑客大會(huì)Defcon大會(huì)上,騰訊安全團(tuán)隊(duì)僅用26秒便成功破解了亞馬遜的Echo,遠(yuǎn)程控制指定設(shè)備,使該設(shè)備在未喚醒、不提示的靜默狀態(tài)下自動(dòng)錄音,并將錄音文件通過(guò)網(wǎng)絡(luò)發(fā)送給遠(yuǎn)程服務(wù)器。
“當(dāng)2300臺(tái)音箱中,有1臺(tái)智能音箱被物理攻擊,其他的智能音箱都可以通過(guò)局域網(wǎng)內(nèi)的非接觸式攻擊被黑客置入后門(mén),成為黑客的遠(yuǎn)程竊聽(tīng)器?!痹谄平鈺r(shí)間后不久,騰訊安全專(zhuān)家伍惠宇在一場(chǎng)演講中表示。當(dāng)然,在騰訊將這些漏洞提交后,亞馬遜已經(jīng)完成了這部分的修復(fù)和更新。
在另一層面上,正是興起時(shí)間短、成熟度低,迄今為止,智能音箱尚未形成任何黑灰產(chǎn)業(yè)鏈。錄音語(yǔ)料在企業(yè)被賦予相當(dāng)嚴(yán)格的保密級(jí)別,張思成透露說(shuō),在他所任職的公司,涉及錄音的工作均會(huì)在公司內(nèi)完成,雖因人員有限,將部分保密級(jí)別較低的識(shí)別工作外包,也會(huì)要求外包人員來(lái)到公司完成識(shí)別工作。
“在國(guó)內(nèi)市場(chǎng)上,還沒(méi)有聽(tīng)說(shuō)任何一家企業(yè)將語(yǔ)料轉(zhuǎn)賣(mài)的情況,沒(méi)有聽(tīng)到過(guò)成功竊聽(tīng)的案例,同樣,據(jù)我所知,智能音箱還不會(huì)利用收聽(tīng)到的語(yǔ)料,為每一位用戶(hù)形成全景畫(huà)像。”張思成肯定地說(shuō),“說(shuō)到底,現(xiàn)在智能音箱還笨得要死,提取有效信息成本太高,我個(gè)人覺(jué)得,在未來(lái)3到5年內(nèi),都不用擔(dān)心音箱帶來(lái)的隱私問(wèn)題?!?/p>
但他也和其他從業(yè)者一樣,并不否認(rèn)以上種種“尚未發(fā)生”的情況,會(huì)在技術(shù)更為成熟的未來(lái)均有“發(fā)生”的可能。
作為這個(gè)新興行業(yè)的從業(yè)者,張思成已經(jīng)可以坦然接受技術(shù)與隱私難以平衡的問(wèn)題,“在物聯(lián)網(wǎng)、AI時(shí)代,我們是沒(méi)有隱私、無(wú)所遁形的”,即便沒(méi)有智能音箱,通過(guò)手機(jī)和電腦,每個(gè)人的信息、喜好、習(xí)慣等種種信息,早已被各家公司所掌握,本質(zhì)上,這并無(wú)不同。
除非在計(jì)算能力更為強(qiáng)大的未來(lái),全部智能產(chǎn)品均在本地運(yùn)算,全部斷網(wǎng),只有偶爾更新系統(tǒng)時(shí)聯(lián)網(wǎng)。張思成認(rèn)為,這但對(duì)普通人而言,這種高技術(shù)難度、低商業(yè)價(jià)值的設(shè)想過(guò)于遙遠(yuǎn),也過(guò)于不切實(shí)際。
面對(duì)這些焦慮,一些人選擇了遠(yuǎn)離智能音箱。一位技術(shù)人員稱(chēng),其已經(jīng)將家中智能音箱徹底斷電,亦不再有購(gòu)買(mǎi)其它智能家居的計(jì)劃;而張思成已經(jīng)默默接受,他購(gòu)買(mǎi)了三、四臺(tái)智能音箱放置于家中,本來(lái)是用于工作測(cè)試,后來(lái)也就習(xí)慣了它們的存在。
在技術(shù)探測(cè)隱私的邊緣,張思成的底線(xiàn)是“不形成危害”。他將智能音箱置于客廳和門(mén)廳,這樣,即使一些語(yǔ)音資料被泄露,也不會(huì)對(duì)他與家人形成實(shí)質(zhì)危害,“智能音箱的收聲范圍大約是3到5米,很難隔墻收集,臥室基本聽(tīng)不到,實(shí)在有私密話(huà)題的時(shí)候,也可以拔掉電源再講”。
他不能接受的是影像泄露,“我絕不會(huì)買(mǎi)一臺(tái)帶攝像頭的音箱、或者其它帶攝像頭的產(chǎn)品放置在臥室”,他很清晰地認(rèn)識(shí)到,一旦泄露影像,將是難以挽回的重大危害:不止一位從業(yè)者透露,聯(lián)網(wǎng)的攝像頭設(shè)備,的確會(huì)將影像回傳至服務(wù)器,這些資料會(huì)被嚴(yán)格保密,但仍存在理論上的外泄風(fēng)險(xiǎn)。
你無(wú)法隱藏自己,所以,只能采用最基本的方法來(lái)保護(hù)自己——這是張思成的理論。
不過(guò),有些人也抱有更樂(lè)觀(guān)的態(tài)度,“智能音箱正處于野蠻生長(zhǎng)的初級(jí)階段,擴(kuò)展到整個(gè)智能家居,都會(huì)經(jīng)歷這些初級(jí)階段,這時(shí)的隱私保護(hù),只能依賴(lài)于廠(chǎng)家自律,”徐家明堅(jiān)信,“當(dāng)這些產(chǎn)品徹底普及之后,一定會(huì)有更高級(jí)別的隱私規(guī)范出現(xiàn),統(tǒng)一行業(yè)、限制權(quán)限,并作為強(qiáng)制標(biāo)準(zhǔn)來(lái)執(zhí)行。”