盡管我們已經(jīng)知道 NSA 依靠指紋和面部圖像來識(shí)別目標(biāo),但是根據(jù) 2008 年的一份機(jī)構(gòu)文件,聲紋才是“NSA 的統(tǒng)治地位所在”。
在美蘇冷戰(zhàn)最嚴(yán)峻的時(shí)期,那是 1980 年的冬天,美國(guó)聯(lián)邦調(diào)查局(FBI)的特工人員記錄到了一次通話——一名男子被安排與在華盛頓特區(qū)的蘇聯(lián)大使進(jìn)行秘密會(huì)晤。然而,在約定的那天,調(diào)查局的特工們沒能看到究竟是誰進(jìn)入了大使館。當(dāng)時(shí),特工們沒有辦法僅根據(jù)他的通話聲音就查出他的名字,所以這個(gè)間諜得以繼續(xù)藏匿自己的身份,并在隨后的五年中,將一些美國(guó)機(jī)密項(xiàng)目的細(xì)節(jié)賣給了蘇聯(lián)。
直到 1985 年,根據(jù)一名俄羅斯叛逃者提供的情報(bào),F(xiàn)BI 才最終確定了當(dāng)時(shí)那名通話者為前美國(guó)國(guó)家安全局(NSA)分析員 Ronald Pelton。次年,Ronald Pelton 被判處間諜罪。
這種技術(shù)的原理在于分析個(gè)人聲音中獨(dú)特的物理和行為特征來區(qū)分不同人的聲音,例如發(fā)聲的音高、嘴型、咽部長(zhǎng)度等。算法隨后會(huì)創(chuàng)建個(gè)人聲音特征的動(dòng)態(tài)計(jì)算機(jī)模型,也就是通常所說的“聲紋”模型。整個(gè)過程——捕捉所說的單詞、將單詞轉(zhuǎn)化為聲紋、并將這種表示與數(shù)據(jù)庫(kù)中其他的“聲紋”進(jìn)行對(duì)比——都可以在瞬間完成。盡管我們已經(jīng)知道 NSA 依靠指紋和面部圖像來識(shí)別目標(biāo),但是根據(jù) 2008 年的一份機(jī)構(gòu)文件,聲紋才是“NSA 的統(tǒng)治地位所在”。
我們不難看出原因。NSA,無論獲得許可與否,截取了數(shù)以百萬計(jì)的美國(guó)公民的電話,甚至包括越洋電話、視頻電話和互聯(lián)網(wǎng)電話,從而建立了一個(gè)無可比擬的聲紋庫(kù)。來自斯諾登提供的文件顯示,分析人員將部分人的錄音提供給聲紋識(shí)別算法之后,即使這些人在其他通話中使用未知的號(hào)碼、秘密代碼亦或是不同語言,算法都可以將其與已有的音頻相匹配。
早在伊拉克自由行動(dòng)時(shí),分析人員就使用聲紋識(shí)別技術(shù),證實(shí)了那些“疑似被廢黜的領(lǐng)導(dǎo)人薩達(dá)姆的錄音”確實(shí)是薩達(dá)姆本人,而不像公眾以為的那樣是偽造的。NSA 的備忘錄進(jìn)一步表明,NSA 分析員為本·***也構(gòu)建了聲紋,“在幾次放送中,他的聲音都十分明顯且一致”;與基地組織的現(xiàn)任領(lǐng)導(dǎo)人 Ayman al-Zawahri 以及基地組織的三把手 Abu Musab al-Zarqawi 有顯著不同。他們也使用 Zarqawi 的聲紋從幾份網(wǎng)上發(fā)布的音頻中找到了他。
據(jù) 2004 年至 2012 年間的機(jī)密文件顯示,NSA 對(duì)其聲紋識(shí)別技術(shù)進(jìn)行了愈發(fā)復(fù)雜的迭代。文件證實(shí)了聲紋識(shí)別在反恐行動(dòng)和緝毒行動(dòng)中均獲使用。文件還建議更多國(guó)家機(jī)構(gòu)部署這項(xiàng)技術(shù),不僅僅是為了追溯像 Pelton 這樣的間諜,還為了防止像斯諾登這樣的舉報(bào)人出現(xiàn)。
永遠(yuǎn)在聽的算法
一些民權(quán)專家擔(dān)心聲紋識(shí)別技術(shù)和該技術(shù)的擴(kuò)展應(yīng)用將會(huì)侵害公民隱私。白宮前國(guó)家情報(bào)局局長(zhǎng)顧問 Timothy Edgar 解釋說,“聲紋識(shí)別技術(shù)即創(chuàng)建了一種新的情報(bào)能力,一種容易被濫用的能力。”“我們的聲音代替我們本人穿越各種渠道完成溝通。在大眾監(jiān)控的時(shí)代,這種能力對(duì)我們所有人的隱私都有深遠(yuǎn)的影響。”
Edgar 和其他專家指出,相比于姓名、地址、密碼、電話號(hào)碼和個(gè)人識(shí)別碼,人聲的相對(duì)穩(wěn)定性使得其難以被改變或偽裝。電子前線基金會(huì)(Electronic Frontier Foundation)的律師 Jamie Williams 表示,這讓追蹤變得“容易的多”。“只要你能識(shí)別出某個(gè)人的聲音,”她表示,“你就能在監(jiān)聽記錄或錄音中找到他們。”
聲音是一種獨(dú)特且易于獲取的生物特征:與 DNA 不同,它可以被動(dòng)地被收集,且不受距離的限制,不需要目標(biāo)知悉或者征得他們的同意。雖然識(shí)別的準(zhǔn)確度受到收音條件的相似性,但是在受控的環(huán)境中——低底噪、熟悉的聲學(xué)環(huán)境和良好的通信質(zhì)量——這種技術(shù)可以用寥寥幾句話就精確地匹配到個(gè)人。計(jì)算機(jī)模型擁有的同一個(gè)人的不同聲音樣本越多,模型就愈發(fā)強(qiáng)大,愈發(fā)“成熟”。
在商業(yè)環(huán)境中,聲紋識(shí)別技術(shù)與呼叫中心欺詐審查、與 Siri 等語音助理交談以及個(gè)人銀行業(yè)務(wù)密碼驗(yàn)證等任務(wù)關(guān)聯(lián)密切。并且這種技術(shù)的用途正在逐漸增長(zhǎng),根據(jù)市場(chǎng)研究公司 Tractica 的報(bào)告,到 2024 年,語音生物識(shí)別技術(shù)產(chǎn)業(yè)的收入預(yù)計(jì)將達(dá)到每年 50 億美元,其用途將擴(kuò)展至邊境檢查站、醫(yī)療、信用卡支付和可穿戴設(shè)備中。
一位前國(guó)防情報(bào)官員,因政策所限無法對(duì)機(jī)密文件進(jìn)行討論,匿名對(duì) The Intercept 表示,他相信這種技術(shù)一直隱而不漏絕非偶然。“政府避免討論這種技術(shù),正是因?yàn)樗岢隽艘恍﹪?yán)峻的問題,而這些問題政府不愿意回答,”這位官員如是說道。“這是自 911 事件發(fā)生以來,對(duì)于我們個(gè)人及我們的權(quán)利的一項(xiàng)重要轉(zhuǎn)變。”而想要進(jìn)入技術(shù)監(jiān)控范圍,官員指出,“你什么都不用做,張嘴說話就行了。”
民權(quán)主義者擔(dān)心,如果沒有針對(duì)政府秘密收集我們的語音模式這一事項(xiàng)的公開討論以及監(jiān)督,我們可能會(huì)進(jìn)入一個(gè)越來越沉默的世界。
新型聲音工具
2013 年開始,美國(guó)人就已經(jīng)知道 NSA 在大量收集國(guó)內(nèi)外的電話數(shù)據(jù),但如何將原始數(shù)據(jù)轉(zhuǎn)化為有用情報(bào)這一技術(shù)仍然鮮為人知。2015 年,據(jù) The Intercept 報(bào)道,NSA 為處理政府收集的大量音頻建立了一系列“人類語言技術(shù)”。通過開發(fā)程序自動(dòng)將語音翻譯成文本——分析員稱之為“語音版 Google”——政府部門可以使用關(guān)鍵詞和“選擇器”來搜索、閱讀和索引錄音而不是派人親自去聽,從而節(jié)省了大量的人力。
從語音轉(zhuǎn)寫文字項(xiàng)目衍生的聲紋識(shí)別技術(shù)為分析員提供了一種額外的工具,使其可以將不計(jì)其數(shù)的戰(zhàn)區(qū)音頻進(jìn)行攔截與分類。NSA 和國(guó)防部斥巨資發(fā)展此技術(shù)并增加其可靠性。數(shù)字時(shí)代之前,聲紋識(shí)別隸屬于法庭科學(xué)。二戰(zhàn)期間,人類分析員對(duì)來自無線電的聲音頻率的可視化輸出進(jìn)行比較。根據(jù)《法庭聲紋識(shí)別》的作者 Harry Hollien 的說法,這些可以“閱讀語音”的機(jī)器——即語譜圖技術(shù)——甚至用來駁斥阿道夫?希特勒被暗殺并被人取代的謠言。
作為法庭聲紋識(shí)別標(biāo)準(zhǔn)化事宜的聯(lián)邦領(lǐng)導(dǎo)者,首席聲紋識(shí)別專家 James Wayman 解釋道:“聲紋可以被看到,”他指出,雖然“聲紋”這個(gè)詞已經(jīng)被商業(yè)公司用爛了,但其實(shí)有一定的誤導(dǎo)性。因?yàn)椤凹y”意味著所捕獲的信息是物理的,而不是行為的。他說:“其實(shí)你所擁有的是軟件程序里的一個(gè)方程,能夠輸出不同的數(shù)字。”
這些方程已經(jīng)從簡(jiǎn)單的求均值演變?yōu)閯?dòng)態(tài)算法模型。自 1996 年依賴,NSA 資助了美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院語音研究所(NIST),培養(yǎng)和測(cè)試“解決聲紋識(shí)別問題的最具主導(dǎo)性和前途的算法”。與 NIST 一起測(cè)試系統(tǒng)的還有,領(lǐng)先的生物識(shí)別公司和研究人員,其中有一些人獲得了 NSA 和國(guó)防部高級(jí)研究計(jì)劃局(DARPA)的資助。
11 月,根據(jù)國(guó)際刑警組織發(fā)布的新聞,由歐盟資助的一個(gè)國(guó)際聲紋識(shí)別的項(xiàng)目通過了最后的測(cè)試。來自 50 多個(gè)國(guó)家的 100 多名情報(bào)分析員、研究人員和執(zhí)法人員(其中包括國(guó)際刑警組織的探員,英國(guó)大都會(huì)警察局和葡萄牙司法系統(tǒng)的警察們)都來到了展示現(xiàn)場(chǎng),研究人員證明他們的方案可以識(shí)別“社交媒體上或合法截獲的音頻中說不同語言的未知發(fā)言者”。
The Intercept 查閱的 NSA 文件中描繪了一個(gè)類似地正在發(fā)展的系統(tǒng)的輪廓——在 9/11 事件之后的幾年里,這個(gè)系統(tǒng)的發(fā)展使得“語音分析員能夠在幾秒鐘內(nèi)對(duì)數(shù)百小時(shí)的語音剪輯進(jìn)行篩選,基于關(guān)鍵詞或說話者聲紋識(shí)別篩選出有用的信息。”
“戲劇性”結(jié)果
但 NSA 的系統(tǒng)的功能遠(yuǎn)遠(yuǎn)不止回答“是”或者“不是”。在 2006 年的一系列通訊中,報(bào)道了一個(gè)名為“實(shí)時(shí)語音”(Voice RT)的項(xiàng)目,這個(gè)系統(tǒng)不僅能在語音攔截中自動(dòng)識(shí)別說話者身份,還能識(shí)別他們的語言、性別和口音。分析員可以對(duì)攔截按上述類別進(jìn)行分類,通過關(guān)鍵字進(jìn)行實(shí)時(shí)搜索,并設(shè)置自動(dòng)警報(bào),在傳入的攔截符合某些標(biāo)簽的條件時(shí)通知他們。一份 NSA 的 PPT 進(jìn)一步證實(shí),Voice RT 程序?qū)⑵洹皵z入”的伊拉克語音數(shù)據(jù)轉(zhuǎn)換為了聲紋。
斯諾登提供的 NSA 備忘錄并沒有說明 Voice RT 的部署范圍,而 GCHQ 的語音/傳真用戶組的會(huì)議記錄中提到了這一點(diǎn)。英國(guó)機(jī)構(gòu)的備忘錄中的詳細(xì)說明了 NSA 的聲紋識(shí)別計(jì)劃是如何針對(duì)外國(guó)目標(biāo)進(jìn)行部署的。2007 年秋季,當(dāng)其語音/傳真用戶組在與 NSA 代表會(huì)面時(shí),NSA 成員們介紹了一個(gè)高效的 Voice RT 系統(tǒng),可以為語言學(xué)家和分析員提供說話者識(shí)別和語言類別識(shí)別能力,可以將語音轉(zhuǎn)換為文本和并搜索語音。“實(shí)質(zhì)上,”會(huì)議記錄將 Voice RT 描述為,“一個(gè)一站式商店……他們?yōu)榱颂岣呦到y(tǒng)的可部署性付出了大量的努力。”到 2010 年,NSA 的 Voice RT 程序可以處理超過 25 種外語的音頻。在阿富汗,NSA 將語音分析和地圖軟件配合使用,定位那些講阿拉伯語的信號(hào)塔集群——用來發(fā)現(xiàn)新的基地組織訓(xùn)練營(yíng)。
GCHQ 則使用了一個(gè)名為 Broad Oak 的項(xiàng)目,根據(jù)聲音來識(shí)別目標(biāo)者。英國(guó)政府在中東地區(qū)建立了聲紋識(shí)別系統(tǒng),識(shí)別對(duì)象不乏沙特、巴基斯坦、格魯吉亞和伊拉克的領(lǐng)導(dǎo)人。GCHQ 的會(huì)議記錄稱:“如果您認(rèn)為我們可以幫助您在海量信息流中找到您感興趣的目標(biāo),請(qǐng)隨時(shí)與我們聯(lián)系,我們很樂意與您討論您的需求,并希望能夠提供一個(gè)迅速準(zhǔn)確的解決方案。”
這不是一張空頭支票。2009 年,在識(shí)別伊拉克副總統(tǒng)之一 Adil Abdul Mahdi 時(shí),GCHQ 吹噓說他們比對(duì)手 NSA 做得要好。“由于我們一直以比他們更快的速度報(bào)告他(副總統(tǒng))的相關(guān)消息,NSA 已經(jīng)放棄參與其中 …… 此項(xiàng)良好的表現(xiàn)也提高了我們?cè)?NSA 的聲譽(yù)。“2010 年,GCHQ 的研究概述顯示,兩個(gè)機(jī)構(gòu)就聲紋分析項(xiàng)目的聯(lián)合實(shí)驗(yàn)進(jìn)行了廣泛的合作。
但聲紋識(shí)別工具的發(fā)展并非一帆風(fēng)順。在其早期階段,這項(xiàng)技術(shù)遠(yuǎn)不如今天那么強(qiáng)大有效。前國(guó)防情報(bào)官員回憶說,雖然分析員能夠在他們的工作站播放語音樣本,但由于音頻沒有編入索引,搜索重要的樣本是一個(gè)很大的挑戰(zhàn)。在 SIDtoday 發(fā)表的一封 2006 年的寫給編輯者的信中,一位分析員抱怨說語音工具的引入使其非常崩潰,并將其初始速度比作“流淌在一月的糖漿”。
然而到了 2007 年,聲紋識(shí)別技術(shù)已經(jīng)明顯成熟。NSA 專門為伊朗總統(tǒng) Mahmoud Ahmadinejad 的紐約市聯(lián)合國(guó)大會(huì)之行建立的備忘錄中詳細(xì)列舉了該技術(shù)的實(shí)際功用。在獲得合法授權(quán)后,分析員配置了一個(gè)專門的系統(tǒng),盡可能多的跟蹤 143 名伊朗代表的電話。在所有的這些傳入流量上,他們運(yùn)行了語音活動(dòng)檢測(cè)算法,以避免目標(biāo)在沒有說話的時(shí)候分析員浪費(fèi)時(shí)間跟蹤; 通過關(guān)鍵字來搜索“電子郵件地址的傳遞和重要人物的討論”;以及根據(jù)說話者聲紋識(shí)別來成功定位“包括伊朗外交大臣在內(nèi)的重要人士”的對(duì)話。
2010 年,機(jī)構(gòu)的技術(shù)人員制定出了一個(gè)應(yīng)對(duì)這些調(diào)制聲音的解決方案——應(yīng)用 HLT Lite——一個(gè)用來搜索修改過或異常的聲音的軟件。SIDtoday 稱,該方案在掃描了 100 多萬條音頻后,在也門發(fā)現(xiàn)至少 80 個(gè)經(jīng)過修改的語音的例子。據(jù)報(bào)道,這使機(jī)構(gòu)發(fā)現(xiàn)了同時(shí)使用幾個(gè)新電話號(hào)碼的目標(biāo)人物。
隨著系統(tǒng)能力的提升,他們的監(jiān)控范圍也在擴(kuò)大。2010 年 9 月的一則通訊詳細(xì)介紹了墨西哥城升級(jí)的聲紋識(shí)別系統(tǒng)的“戲劇性”發(fā)展——網(wǎng)站的負(fù)責(zé)人稱,堪比相當(dāng)于一臺(tái)額外的掃描儀。通過在音頻攔截中搜索“bomba”這個(gè)詞,分析員可以分離和檢測(cè)有關(guān)炸彈威脅的對(duì)話。
聲紋識(shí)別系統(tǒng)也可以很容易地通過重新配置,用在別的地方。GCHQ 2008 年 10 月的會(huì)議記錄描述了一個(gè)“涉及阿富汗毒品交易的高層人員網(wǎng)絡(luò)”的建立過程,這個(gè)網(wǎng)絡(luò)后來被“投入到意想不到的應(yīng)用之中”。分析員甚至“在毒品流量較大的區(qū)域進(jìn)行了一次地毯式搜索”來識(shí)別更多的目標(biāo)。
從戰(zhàn)場(chǎng)上到機(jī)構(gòu)中
NSA 很快意識(shí)到,他們的錄音處理能力可以用來識(shí)別 NSA 內(nèi)部的員工。正如 2006 年 1 月那篇討論 Ronald Pelton 的音頻的備忘錄所解釋的那樣,“聲音匹配技術(shù)正被應(yīng)用到新提出的內(nèi)部威脅(Insider Threat)計(jì)劃中,企圖捉住『我們中的間諜』。”
在美國(guó)軍方告密者 Chelsea Manning 泄密之后,該計(jì)劃由奧巴馬政府公開宣布,其內(nèi)容是密切監(jiān)視政府雇員的生活。但這份文件似乎表明,該舉措在 2011 年奧巴馬頒發(fā)行政命令之前就已經(jīng)開始實(shí)行了。
據(jù)新聞自由基金會(huì)的 Trevor Timm 的分析,NSA 將用于檢測(cè)外部威脅人員的生物技術(shù)運(yùn)用到檢測(cè)內(nèi)部成員中的異見人士身上這一手段并不新鮮。“在過去 15 年中,我們已經(jīng)看到了一連串這樣的例子:執(zhí)法機(jī)構(gòu)把那些侵犯式的、本來作用于恐怖分子身上的工具——無論是定位跟蹤還是人臉識(shí)別,或者是像這種聲紋識(shí)別技術(shù)——用于其它各種犯罪調(diào)查中。”
Timm 指出,在過去幾年中,告密者,情報(bào)人員以及記者都采取了更嚴(yán)密的安全措施來避免暴露身份。但是,“如果記者使用的電話號(hào)碼并未與其身份關(guān)聯(lián),那么政府就會(huì)通過許可證等方式來掃描他們通話,這項(xiàng)技術(shù)也將潛在被用于抑制新聞業(yè)的發(fā)展。”
對(duì)于情報(bào)圈的民權(quán)律師第一人 Timothy Edgar 來說,這些“風(fēng)險(xiǎn)”可以歸為這樣一個(gè)問題:“他們是在尋找正當(dāng)目標(biāo),還是在濫用權(quán)力?比如試圖監(jiān)控記者或告密者這樣的做法?”
Edgar 說,在某些方面,聲紋識(shí)別或有助于保護(hù)個(gè)人隱私。這項(xiàng)技術(shù)允許分析員來篩選電話,這樣他們就可以專注于目標(biāo)人物的聲音,從而剔除掉其他人的聲音。一份 2010 年度的 SIDtoday 備忘錄強(qiáng)調(diào),通過確保“該名說話人是某國(guó)領(lǐng)導(dǎo)人而非甜甜圈店的某個(gè)服務(wù)員,”該技術(shù)可以降低情報(bào)人員所需監(jiān)聽的通話量。
“事實(shí)上,”這一級(jí)別的精確度,成為了“NSA 解釋當(dāng)初大量收集元數(shù)據(jù)的做法的擋箭牌”,Edgar 解釋說。“他們?yōu)轫?xiàng)目進(jìn)行辯護(hù)的手段之一,就是自稱沒有收集所有的數(shù)據(jù),而是通過篩選器來收集信息。”
同時(shí),從大量數(shù)據(jù)中識(shí)別特定個(gè)體的目標(biāo),常常證明了繼續(xù)收集更多數(shù)據(jù)的必要性。識(shí)別可以幫助分析人員縮小電話接聽的范圍,但這項(xiàng)技術(shù)似乎會(huì)鼓勵(lì)他們?cè)诟蠓秶鷥?nèi)進(jìn)行搜索,因?yàn)楸举|(zhì)上這項(xiàng)任務(wù)的目標(biāo)是監(jiān)聽目標(biāo)聲音出現(xiàn)的對(duì)話,無論他用什么號(hào)碼撥出。或如 Pelton 備忘錄所指出的那樣,這項(xiàng)技術(shù)使得分析員能夠“在任何地方辨別出那個(gè)聲音。”
雖然這些文件表明,該機(jī)構(gòu)確實(shí)試圖在其員工身上運(yùn)用這項(xiàng)技術(shù),但 The Intercept 所查閱的文件并沒有明確表明,該機(jī)構(gòu)是否已經(jīng)在美國(guó)普通公民的對(duì)話數(shù)據(jù)中進(jìn)行聲紋創(chuàng)建。
外國(guó)人情報(bào)監(jiān)視法案(Foreign Intelligence Surveillance Act,F(xiàn)ISA)規(guī)定,機(jī)構(gòu)可以自由收集在國(guó)外服務(wù)器和基礎(chǔ)設(shè)施上傳輸?shù)囊纛l數(shù)據(jù),以及美國(guó)人與外國(guó)人的語音交流數(shù)據(jù)。因?yàn)轫?xiàng)規(guī)定,Edgar 稱,越洋電話“基本上”是被系統(tǒng)錄過聲紋了。“如果他們沒對(duì)越洋電話使用這些技術(shù)手段,我才會(huì)感到驚訝。在某種程度上,這就是他們的工作內(nèi)容。”
然而專家們對(duì)“NSA 是否有權(quán)利在沒有許可的情況下掃描美國(guó)公民在美國(guó)領(lǐng)土上進(jìn)行的通話并制作聲紋”這一議題表現(xiàn)出了分歧的態(tài)度。這種分歧部分源自監(jiān)督相關(guān)法律的不完備,這方面的法律未能跟上聲紋與語音識(shí)別等數(shù)字技術(shù)的發(fā)展。
雖然美國(guó)已經(jīng)制定了嚴(yán)格的法律,禁止在沒有許可證的情況下對(duì)美國(guó)領(lǐng)土上進(jìn)行的電話內(nèi)容進(jìn)行記錄,但也沒有任何聯(lián)邦機(jī)構(gòu)負(fù)責(zé)監(jiān)管聲音數(shù)據(jù)的采集和處理事宜。
監(jiān)管缺失的部分原因是,雖然政府需要許可才能獲得“內(nèi)容”,但聲紋應(yīng)該被歸類為“內(nèi)容”嗎?或者像 NSA 聲稱的那樣,聲紋不過是“元數(shù)據(jù)”——這部分信息所受的法律保護(hù)就少多了。在這個(gè)問題上,法律基本上沒有做對(duì)這部分信息做任何具體的規(guī)定,這導(dǎo)致一些專家推測(cè),NSA 正在利用這一法律灰色地帶實(shí)行聲紋建立。
針對(duì)一系列詳細(xì)的問題,NSA 給出了如下的回應(yīng):“根據(jù)長(zhǎng)期政策,NSA 將不確認(rèn)也不否認(rèn)該文所指的涉及的美國(guó)政府信息的準(zhǔn)確性。”
無所不用其極
星期四,參議院投票通過擴(kuò)大外國(guó)人情報(bào)監(jiān)視法案(FISA)的 702 條,這使得 NSA 有權(quán)對(duì)那些與外國(guó)人溝通的美國(guó)人進(jìn)行暗中監(jiān)視,且不需要許可證。這種再授權(quán)行為,與上周在眾議院的行動(dòng)類似,證實(shí)了那些評(píng)論家的觀點(diǎn),他們認(rèn)為 NSA 對(duì)其法律權(quán)力的解釋整日益強(qiáng)硬——同時(shí)日益模糊。
計(jì)算機(jī)科學(xué)家和監(jiān)控研究專家 Andrew Clement 在斯諾登披露相關(guān)信息之前就已經(jīng)在調(diào)查 NSA 的無許可竊聽活動(dòng)。他堅(jiān)信,該機(jī)構(gòu)對(duì)美國(guó)公民的聲紋識(shí)別的利用并未收到任何限制。他解釋說,該機(jī)構(gòu)經(jīng)常選擇將收集到的所有信息進(jìn)行分類,直到達(dá)到人類分析員能夠?qū)⑵渥鳛樵獢?shù)據(jù)來進(jìn)行聽或讀為止。“那只是一個(gè)巨大的漏洞,”他解釋說,“看來,他們會(huì)把通過算法方式從內(nèi)容中獲取到的任何信息,都簡(jiǎn)單地歸類為元數(shù)據(jù)。”
Clement 類比了 NSA 對(duì)待電話號(hào)碼和電子郵件地址的方式,來類比 NSA 會(huì)如何將建立聲紋的行為合法化。斯諾登在 2013 年披露的 XKeyscore 項(xiàng)目,就允許工作人員從截獲的電郵中提取出電郵地址(它們被歸類為元數(shù)據(jù))。這些工作人員還可以對(duì)關(guān)鍵字進(jìn)行全文搜索,它們同樣被歸類為上下文信息而不是內(nèi)容。
然而 Edgar 認(rèn)為,如果政府把我們的聲音也算作元數(shù)據(jù),那么他會(huì)大吃一驚。“你可以試著辯解說,聲音特點(diǎn)不等于說話內(nèi)容,”Edgar 說,“但是為了做聲紋識(shí)別,你還是得收集一通國(guó)內(nèi)電話的內(nèi)容,并對(duì)其進(jìn)行分析以便提取出聲音。”
目前還不知道 NSA 收集、取樣或保留了多少國(guó)內(nèi)的通話內(nèi)容。但 EFF 的 Jamie Williams 指出,NSA 不一定非得通過收集美國(guó)人的電話錄音來制作美國(guó)人的聲紋庫(kù),因?yàn)槊駹I(yíng)企業(yè)就一直在記錄我們的聲音。他們正擁有越來越多的音頻資源。汽車、恒溫器、冰箱、電燈泡,甚至是垃圾桶,都已變成了“智能的”(即互聯(lián)網(wǎng)化的)語音設(shè)備。Gartner 預(yù)測(cè),今年有三分之一的人機(jī)交互將通過與語音系統(tǒng)的對(duì)話來進(jìn)行。最近,Google 和亞馬遜的“智能音箱”都推出了聲紋識(shí)別系統(tǒng),用以區(qū)分家庭成員的聲音。“一旦公司擁有這些聲音數(shù)據(jù),”Williams 說,“在理論上,執(zhí)法機(jī)構(gòu)就能拿到它,只要他們有一個(gè)有效的法律程序。”
這位前政府官員指出,原始語音數(shù)據(jù)可以存儲(chǔ)在民營(yíng)企業(yè)那里,并供 NSA 通過秘密協(xié)議進(jìn)行訪問。比如在 Fairview 計(jì)劃中,該機(jī)構(gòu)與 AT&T 是合作伙伴關(guān)系。盡管美國(guó)國(guó)會(huì)試圖控制 NSA 對(duì)國(guó)內(nèi)電話記錄的收集行為,但該機(jī)構(gòu)一直在尋求獲得我們提供給企業(yè)數(shù)據(jù)庫(kù)的原始數(shù)據(jù)。(例如與 Verizon 和 AT&T 的合作伙伴關(guān)系,對(duì) Xbox 游戲系統(tǒng)的滲透,以及對(duì)萬千網(wǎng)友的在線元數(shù)據(jù)的暗中收集,這些只是幾個(gè)最近的例子。)“電信公司持有數(shù)據(jù),而沒有什么可以阻止他們運(yùn)行一個(gè)算法,”這位前官員說。
Clement 想知道的是,對(duì)于 NSA 而言,可能聲紋識(shí)別能力比其內(nèi)容識(shí)別能力更為重要。“這可以讓他們把你和你自己的其他身份聯(lián)系起來,并確定你和其他人的關(guān)系,”他說。
這似乎才是 NSA 的最終目標(biāo)。在 2010 年的一次關(guān)于“一次前所未有的機(jī)會(huì),了解 NSA 如何將其創(chuàng)造性的能量用于個(gè)人跟蹤”的會(huì)議上,NSA 的高層領(lǐng)導(dǎo)談到如何將“全生活(whole life)”戰(zhàn)略納入他們的目標(biāo)。他們描述了將生物特征數(shù)據(jù)(比如聲紋)與傳記資料(如社交網(wǎng)絡(luò)和個(gè)人歷史)進(jìn)行整合的需求。用該機(jī)構(gòu)自己的話說,“一切都是關(guān)于在空間和時(shí)間上進(jìn)行個(gè)人定位、跟蹤和維護(hù)的連續(xù)性。我們不局限于傳統(tǒng)的通訊方式——我們無所不用其極。”
-
指紋識(shí)別
+關(guān)注
關(guān)注
43文章
1741瀏覽量
102169 -
面部識(shí)別
+關(guān)注
關(guān)注
1文章
375瀏覽量
26620 -
聲紋識(shí)別
+關(guān)注
關(guān)注
3文章
140瀏覽量
21503 -
NSA
+關(guān)注
關(guān)注
4文章
106瀏覽量
18042
原文標(biāo)題:如何將聲紋識(shí)別技術(shù)用到極致
文章出處:【微信號(hào):WW_CGQJS,微信公眾號(hào):傳感器技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論