技術(shù)
導(dǎo)讀:明明 AI 連預(yù)測(cè)個(gè)天氣都時(shí)準(zhǔn)時(shí)不準(zhǔn),怎么就突然能預(yù)報(bào)國(guó)家大事了?
“城市東部的一所房屋有炸彈即將爆炸!”
“炸彈是由捕鼠器,ACDelco 品牌 AA 電池和鍍鋅管碎片組成的,似乎跟轟炸機(jī)有關(guān)。”
“恐怖分子來(lái)電,第五枚炸彈已經(jīng)在聯(lián)邦快遞的傳送帶上了!”
上述劇情如果發(fā)生在好萊塢電影里,此刻一定會(huì)出現(xiàn)一群運(yùn)籌帷幄的聯(lián)邦調(diào)查局分析師,在蛛絲馬跡中開(kāi)展一場(chǎng)爭(zhēng)分奪秒的競(jìng)賽,利用各種類(lèi)型的數(shù)據(jù)中,抽絲剝繭,作出預(yù)判,再與一線特工們緊密合作,阻止悲劇的發(fā)生。
這事兒聽(tīng)起來(lái),是不是比下象棋、寫(xiě)文章、玩游戲、替人巡邏、流水線“打工人”要炫酷多了?
最近美國(guó)情報(bào)高級(jí)研究項(xiàng)目活動(dòng)(IARPA)提出利用人工智能來(lái)預(yù)測(cè)地緣政治事件,進(jìn)而找出恐怖分子、黑客或任何被認(rèn)為是美國(guó)敵人的人,所以我們就借此機(jī)會(huì),聊聊AI做情報(bào)分析師這事兒,到底靠不靠譜。
科學(xué)算命:美國(guó)情報(bào)機(jī)構(gòu)來(lái)了一位新員工
IARPA 所自主的一些項(xiàng)目,從技術(shù)角度看都是我們熟悉的名字:量子計(jì)算、低溫計(jì)算、人臉識(shí)別、通用語(yǔ)言翻譯等等,這些看起來(lái)人畜無(wú)害的項(xiàng)目,好像和 BAT 這種大廠的實(shí)驗(yàn)室沒(méi)啥不一樣。
但作為一個(gè)由間諜以及博士精英們組成的機(jī)構(gòu),一切顯然不會(huì)這么簡(jiǎn)單,IARPA 可以說(shuō)是美國(guó)政府秘密項(xiàng)目中風(fēng)險(xiǎn)最大、影響最深遠(yuǎn)的一個(gè),因?yàn)樗枰嬖V決策者未來(lái)可能發(fā)生的地緣政治事件。
他們關(guān)注的大多是諸如:G7 成員國(guó)是否會(huì)(在某一特定日期)對(duì)敘利亞發(fā)動(dòng)軍事攻擊?委內(nèi)瑞拉一個(gè)月內(nèi)究竟能生產(chǎn)多少石油等等,之類(lèi)的硬核題材。
那AI在其中扮演了什么角色呢?比如 IARPA 資助的一個(gè)名叫 SAGE 的項(xiàng)目,就是利用機(jī)器學(xué)習(xí)來(lái)進(jìn)行協(xié)同預(yù)測(cè),通過(guò)合作將大量的人類(lèi)非專(zhuān)家預(yù)測(cè)因子集中起來(lái),使它們“比單一的人類(lèi)專(zhuān)家預(yù)測(cè)得更準(zhǔn)確、更快”。
通過(guò)這一混合模型,SAGE 可以向人類(lèi)提供機(jī)器從圖表中獲得的信息,將趨勢(shì)可視化呈現(xiàn)出來(lái),以及AI做出的具體預(yù)測(cè)。
該項(xiàng)目的負(fù)責(zé)人、南加州大學(xué)維特比信息科學(xué)研究所(ISI)人工智能部主任阿蘭·加爾斯泰安(Aram Galstyan),前不久就發(fā)聲說(shuō),SAGE 成功預(yù)測(cè)了朝鮮何時(shí)將發(fā)射導(dǎo)彈試射。聽(tīng)起來(lái)是不是很刺激?
放在上古時(shí)代,擁有占卜未來(lái)能力的 AI 絕對(duì)會(huì)成為部落里權(quán)利最高的大巫師。不過(guò)子不語(yǔ)亂力亂神,想必大家更想知道這種玄而又玄的能力到底是怎么來(lái)的。
耳目、尖兵、參謀:分析師的職場(chǎng)密碼,AI 學(xué)會(huì)了幾招?
明明 AI 連預(yù)測(cè)個(gè)天氣都時(shí)準(zhǔn)時(shí)不準(zhǔn),怎么就突然能預(yù)報(bào)國(guó)家大事了?
用南加州大學(xué)計(jì)算機(jī)科學(xué)家弗雷德·莫爾斯塔特(Fred Morstatter)的話來(lái)說(shuō),“AI 之所以有效,是因?yàn)槿祟?lèi)有硬幣的一面,而機(jī)器有硬幣的另一面”——不是針砭時(shí)事、運(yùn)籌帷幄,而是與以前的分析工具相比,讓人類(lèi)更加準(zhǔn)確地抵達(dá)未來(lái)。說(shuō)人話就是提高“猜中”的概率和效率。
就拿雙十一剁手來(lái)說(shuō),電商網(wǎng)站的“猜你喜歡”合你心意的幾率越來(lái)越高多了,其中就有分析預(yù)測(cè)模型的功勞。
國(guó)家大事也同樣遵循這一定律,在各類(lèi)犯罪行為發(fā)生之前,通過(guò)不正常的間諜活動(dòng)、社交網(wǎng)絡(luò)動(dòng)態(tài)、消費(fèi)記錄等等,來(lái)分析和研究對(duì)象的行為與活動(dòng),將潛在損害扼殺在搖籃里。所以 AI 在政治預(yù)測(cè)中起到的作用,更像是一個(gè)情報(bào)分析師,而非指哪兒打哪兒的超級(jí)特工。
一個(gè)情報(bào)分析師應(yīng)該具備哪些能力?簡(jiǎn)單來(lái)說(shuō)有三個(gè):耳目、尖兵、參謀,AI 又做到了哪一階段?
1. 無(wú)處不在的數(shù)字“耳目”。
預(yù)測(cè)的前提,是在數(shù)據(jù)收集環(huán)節(jié)就能夠提供給分析師們足夠規(guī)模的準(zhǔn)確而有效的數(shù)據(jù)。
古代的大巫師靠燒龜殼、看星象來(lái)“未卜先知”。而 IARPA 的操作模式,就將數(shù)據(jù)收集通過(guò)人工智能進(jìn)行自動(dòng)化管理,根據(jù)《匹茲堡郵報(bào)》的報(bào)道,該系統(tǒng)“能夠全天候記錄世界各地所有人的生活?!?/p>
其中包括了每一篇 Facebook 帖子、推特和 YouTube 視頻;每一個(gè)收費(fèi)站的標(biāo)簽號(hào)碼;每一個(gè) GPS 下載、網(wǎng)絡(luò)搜索和新聞提要;每一個(gè)街頭攝像機(jī)視頻,甚至是每一次外賣(mài)下單和餐廳預(yù)約……
IARPA 的系統(tǒng)讓程序沒(méi)日沒(méi)夜地不斷訪問(wèn)并抓取這些數(shù)據(jù),輸送到上游來(lái)支撐決策。
2. 先知先覺(jué)的模型“尖兵”。
每個(gè)人對(duì)數(shù)據(jù)的敏感度和運(yùn)用能力是不同的,一個(gè)對(duì)各種信息和情報(bào)變化不敏感的人,自然無(wú)法從中洞察并做出對(duì)未來(lái)的判斷和預(yù)測(cè),也就是缺乏態(tài)勢(shì)感知(Situation Awareness,SA)的能力,而 AI 亦如是。
要在讀懂大量信息和情報(bào)的基礎(chǔ)上,結(jié)合復(fù)雜的國(guó)內(nèi)外政治、經(jīng)濟(jì)、科技、文化環(huán)境等等,找到規(guī)律,這就需要復(fù)雜且高性能的模型了。
模型,也就是一種預(yù)測(cè)的基本方法論,就像媒體們總愛(ài)拿“義烏指數(shù)”來(lái)預(yù)測(cè)美國(guó)大選結(jié)果(競(jìng)選者的應(yīng)援道具如旗子等大多是由義烏生產(chǎn)的)一樣。一個(gè)有效的預(yù)測(cè)模型,可以成為一把尖刀,在紛繁的大數(shù)據(jù)中間庖丁解牛、抽絲剝繭。
這一部分可以說(shuō)是科技競(jìng)賽的核心機(jī)密了,IARPA 到底采用了哪些算法創(chuàng)新我們不得而知,但從大體來(lái)看,一般通用的包括決策樹(shù)、回歸技術(shù)、聚類(lèi)算法、深度神經(jīng)網(wǎng)絡(luò)等等,結(jié)合 NLP 自然語(yǔ)言處理來(lái)理解網(wǎng)絡(luò)信息,來(lái)綜合判斷事件的走向與結(jié)果。這也是一個(gè)科技廠商的大練兵場(chǎng),比如在 2015 年巴西世界杯期間,谷歌、微軟、百度、高盛等巨頭就對(duì)全部 64 場(chǎng)比賽的勝負(fù)結(jié)果,以及冠軍和黑馬進(jìn)行了預(yù)測(cè),哪家準(zhǔn)確率更高大家可以自己搜搜看。
3. 不令而信的決策“參謀”。
光有模型,那豈不是沒(méi)有人類(lèi)啥事兒了?如果要評(píng)選“最晚被 AI 搶走崗位的職業(yè)”,那情報(bào)分析師一定位居前列。原因無(wú)他,分析的目的是為行動(dòng)服務(wù)的。
尤其是 IARPA 這樣的情報(bào)機(jī)構(gòu),最終是要針對(duì)各種可能的突發(fā)政治事件、公共危機(jī)、恐怖活動(dòng)等等,迅速產(chǎn)出針對(duì)性、國(guó)家性的戰(zhàn)略決策。
這就需要兩個(gè)前提:第一,創(chuàng)新。分析師更強(qiáng)調(diào)基于隱性知識(shí)的處理和分析,并在此基礎(chǔ)上提出自己的論斷和建議。對(duì)于未來(lái)不確定的事物,個(gè)人的既有知識(shí)與經(jīng)驗(yàn)就極為重要了。如果拿情報(bào)流程鏈來(lái)說(shuō)的話,數(shù)據(jù)收集與模型分析大概處于前半段,而后半段能改變事情走向的則來(lái)自于專(zhuān)家的智慧結(jié)晶。
尤其是一些主觀層面的信息,必須面對(duì)面溝通才能從表情、言談舉止中反映出來(lái),依然需要人類(lèi)分析師出馬,AI 在后端提升的效率優(yōu)先;還有一些隱藏信息,像是一些國(guó)家大政方針之類(lèi)的報(bào)告等等,在網(wǎng)絡(luò)上可能根本就沒(méi)有任何數(shù)據(jù)留存,也讓 AI 心有余而力不足。在這個(gè) AI 連小學(xué)生作文都寫(xiě)不好的當(dāng)下,人類(lèi)分析師的飯碗自然端的穩(wěn)穩(wěn)的。
IARPA 就每 3 年到 5 年輪換一批項(xiàng)目經(jīng)理,這些人往往來(lái)自各個(gè)領(lǐng)域,比如語(yǔ)言學(xué)、航空航天、原子物理、人工智能、生物識(shí)別、神經(jīng)科學(xué)等等。
第二,影響力。分析師所找到的“政策密碼”,不能閉門(mén)造車(chē),最終要在現(xiàn)實(shí)中接受檢驗(yàn),而執(zhí)行力度就取決于其建議被認(rèn)可的程度了。如果是 AI 上馬,它能保證執(zhí)行者不用三令五申就會(huì)遵守服從嗎,能讓隊(duì)友們勇往直前時(shí)不需要為判斷失誤而擔(dān)憂嗎,預(yù)測(cè)錯(cuò)誤導(dǎo)致行動(dòng)失敗的責(zé)任又如何劃分呢?
換句話說(shuō),分析師兜售的是一種具有不確定性的“思想商品”,這就需要其具備能夠與他人發(fā)生關(guān)系、獲得認(rèn)可,并推動(dòng)他人更充分地展開(kāi)行為的能力。
技術(shù)與影響力,在分析師這一角色的能力體系中互為表里。少了后者的 AI,目前只能當(dāng)個(gè)“工具人”。
讀到這里,或許我們不會(huì)對(duì) IARPA 的 AI 動(dòng)作有太高的憂慮感。不過(guò),此前我國(guó)也有領(lǐng)導(dǎo)人提出了“從科技規(guī)律出發(fā)前瞻思考世界科技發(fā)展走勢(shì),提出咨詢建議,開(kāi)展科學(xué)評(píng)估,進(jìn)行預(yù)測(cè)預(yù)見(jiàn),在國(guó)家宏觀決策中發(fā)揮建設(shè)性作用”的意見(jiàn)。
我們能從 IARPA 打造 AI 情報(bào)師的經(jīng)驗(yàn)中,去粗取精找到什么收獲嗎?
變局之前:AI 情報(bào)待解的隱患
盡管兩國(guó)國(guó)情不同,但從美國(guó)政府機(jī)構(gòu)將 AI 引入情報(bào)工作的動(dòng)作以及引起的輿論反響中,也可以幫我們規(guī)避掉許多不必要的煩惱。
目前來(lái)看,IARPA 的 AI 實(shí)踐有幾點(diǎn)值得探討。
首先,AI 預(yù)測(cè)結(jié)果只在小部分范圍內(nèi)有效,并沒(méi)有更多案例被曝光。除了技術(shù)本身的原因之外,許多地方的數(shù)據(jù)覆蓋范圍并不普遍也有著直接關(guān)系。數(shù)據(jù)是預(yù)測(cè)的前提,數(shù)據(jù)不足自然會(huì)出現(xiàn)失真的情況。
還有一些領(lǐng)域的規(guī)律不明顯,充滿了突發(fā)事件和意外影響,比如商界相對(duì)于農(nóng)林牧漁等傳統(tǒng)行業(yè),時(shí)不時(shí)就有人為因素影響,這些都需要不斷實(shí)時(shí)修正。
因此,AI 在信息 、知識(shí)的獲取和處理上所體現(xiàn)出的極強(qiáng)能力,值得重視,卻也不用過(guò)度緊張。
另外,IARPA 在 AI 情報(bào)分析上過(guò)度發(fā)力,已經(jīng)開(kāi)始侵犯公民的信息邊界。此前就有媒體曝出,IARPA 對(duì)國(guó)家安全局收集的數(shù)百萬(wàn)私人海外通信進(jìn)行數(shù)據(jù)挖掘,盡管其目的是防止恐怖活動(dòng),但濫用和侵犯隱私權(quán)的可能性也已經(jīng)引起了不少觀察家的警覺(jué)。
在美國(guó),這樣的事情還不在少數(shù),2017 年,F(xiàn)acebook 收到了來(lái)自世界各國(guó)政府的 78890 條信息請(qǐng)求,41%來(lái)自美國(guó),其中 85%的請(qǐng)求得到了批準(zhǔn),同時(shí)也向谷歌、蘋(píng)果和其他公司提出了類(lèi)似的要求。
美國(guó)國(guó)土安全部(U.S.Department of Homeland Security)的一篇帖子也顯示,他們正試圖創(chuàng)建一個(gè)系統(tǒng),能夠“全天候訪問(wèn)有密碼保護(hù)的影響力人群的個(gè)人社交媒體,并從內(nèi)容、情感、數(shù)量等方面進(jìn)行分析”。
如何平衡好公民隱私安全與國(guó)家利益之間的問(wèn)題,考驗(yàn)著政府對(duì)待數(shù)字化、智能化技術(shù)的管理水平。
而在沒(méi)有給出具有說(shuō)服力的共識(shí)方案之前,我想大多數(shù)人都會(huì)更希望這一天更慢一點(diǎn)到來(lái)。