澎湃新聞?dòng)浾?虞涵棋
謹(jǐn)慎設(shè)置麥克風(fēng)權(quán)限,就能百分百避免手機(jī)被“竊聽(tīng)”了嗎?越來(lái)越多的研究表明,一些硬件設(shè)備可能淪為內(nèi)置的“間諜”。
近日在美國(guó)舉行的網(wǎng)絡(luò)與分布式系統(tǒng)安全會(huì)議(NDSS 2020)上,浙江大學(xué)與加拿大多倫多大學(xué)、麥吉爾大學(xué)的一個(gè)聯(lián)合研究團(tuán)隊(duì)報(bào)告稱,軟件通過(guò)收集加速度計(jì)的震動(dòng)數(shù)據(jù),就可識(shí)別、重構(gòu)出手機(jī)揚(yáng)聲器播放的語(yǔ)音,對(duì)數(shù)字、字母和敏感詞匯均具有一定程度的還原能力。
值得警惕的是,由于加速度計(jì)被認(rèn)為是一種“低權(quán)限”的硬件,所有App無(wú)需授權(quán)即可獲取數(shù)據(jù)。這意味著,加速度計(jì)“竊聽(tīng)軟件”可以包裝成任何形態(tài)。
NDSS是全球計(jì)算機(jī)安全領(lǐng)域的四大頂級(jí)學(xué)術(shù)會(huì)議之一。論文的通訊作者為浙江大學(xué)網(wǎng)絡(luò)空間安全研究中心主任任奎。
被低估的“竊聽(tīng)”工具
加速度計(jì)是一種在智能手機(jī)中廣泛應(yīng)用的傳感器,可以通過(guò)計(jì)算手機(jī)在各個(gè)方向上的“應(yīng)力”來(lái)得出加速度。加速度計(jì)配合陀螺儀,可以對(duì)手機(jī)的位置狀態(tài)、運(yùn)動(dòng)狀態(tài)進(jìn)行感知。像導(dǎo)航、橫豎屏切換、微信“搖一搖”、計(jì)步器和許多重力感應(yīng)手機(jī)游戲都基于這些傳感器。
該聯(lián)合團(tuán)隊(duì)上傳到NDSS 2020會(huì)議網(wǎng)站的研究論文提到,此前學(xué)界雖對(duì)加速度計(jì)的隱私風(fēng)險(xiǎn)有所關(guān)注,但由于兩大局限性的存在,大家普遍認(rèn)為其風(fēng)險(xiǎn)性較低。
首先,加速度計(jì)只能收集通過(guò)固體介質(zhì)傳播的信號(hào),不像麥克風(fēng)能收集空氣中的聲波。
例如,科學(xué)家試驗(yàn)過(guò)用一臺(tái)手機(jī)的加速度計(jì)去“竊取”桌上另一臺(tái)揚(yáng)聲器播放的聲音。這個(gè)實(shí)驗(yàn)的條件限制很大,而且單個(gè)數(shù)字的識(shí)別準(zhǔn)確率也只有26%。
此外,手機(jī)加速度計(jì)的采樣上限為200Hz,通常只能采集85-100Hz的窄帶信號(hào)。而成人說(shuō)話的頻率范圍為85-255Hz。
看起來(lái),加速度計(jì)似乎很難“竊聽(tīng)”并準(zhǔn)確識(shí)別本臺(tái)手機(jī)上的說(shuō)話聲音。
然而,這次的研究把上述兩大局限性都顛覆了。
同一臺(tái)手機(jī)里的揚(yáng)聲器和加速度計(jì)之間,確實(shí)存在固態(tài)介質(zhì),那就是手機(jī)的主板。
具體來(lái)說(shuō),就是手機(jī)揚(yáng)聲器發(fā)出的震動(dòng)總是會(huì)穿過(guò)主板,“擊中”加速度計(jì)。
針對(duì)另一個(gè)限制,研究團(tuán)隊(duì)發(fā)現(xiàn)在最新的智能手機(jī)中,加速度計(jì)的采樣上限提高到了500Hz。
識(shí)別準(zhǔn)確率
有了采集震動(dòng)數(shù)據(jù)的可能性,接下去的問(wèn)題是,這些數(shù)據(jù)能否準(zhǔn)確地還原聲音內(nèi)容?
為了提高識(shí)別和還原準(zhǔn)確性和魯棒性,該團(tuán)隊(duì)利用深度學(xué)習(xí)工具,訓(xùn)練這款名為“AccelEve”的模擬竊聽(tīng)軟件對(duì)加速度計(jì)震動(dòng)數(shù)據(jù)與原始音頻內(nèi)容的聯(lián)系能力。
訓(xùn)練和實(shí)驗(yàn)主要用到了兩個(gè)數(shù)據(jù)集,一個(gè)是來(lái)自20位講者的單數(shù)字信號(hào),這些信號(hào)以0.1秒的間隔播放,模擬“受害者”說(shuō)出自己密碼的情景。另一個(gè)數(shù)據(jù)集采集自志愿者,他們手持智能手機(jī),以報(bào)密碼的語(yǔ)速說(shuō)出一串?dāng)?shù)字與字母的混合。
結(jié)果顯示,對(duì)純數(shù)字而言,模型的top1準(zhǔn)確率可以達(dá)到78%,數(shù)字和字母混合的準(zhǔn)確率則達(dá)到55%。即使在高度噪音的情況下,還原準(zhǔn)確率也有47%。
接著,研究團(tuán)隊(duì)又做了另一項(xiàng)測(cè)試,AccelEve軟件能否識(shí)別出下列8個(gè)敏感詞匯:密碼(password)、用戶(username)、社交(social)、安全(security)、號(hào)碼(number)、郵件(Email)、信用(credit)、卡(card),測(cè)試的平均準(zhǔn)確率(真陽(yáng)性率)達(dá)到了90%。
最后,研究團(tuán)隊(duì)發(fā)現(xiàn)在華為Mate 20和Oppo R17上采集的加速度計(jì)信號(hào)噪音比三星S8小,但用前兩者采集的數(shù)據(jù)訓(xùn)練,也可提升針對(duì)后者的“竊聽(tīng)”能力。這意味著AccelEve能在不同型號(hào)的手機(jī)間拓展。
延伸閱讀
蘋果自動(dòng)駕駛汽車去年在加州路測(cè)里程同比大幅下滑
特斯拉1月在華新車注冊(cè)量環(huán)比下降46% 同比增長(zhǎng)318%
毛骨悚然!擁有超30億人臉數(shù)據(jù)的美國(guó)AI公司被黑