數據驅動時代的情報

尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️

加入LINE好友

數據驅動時代的情報 科技 第1張

人工智能和機器學習將有助於提高未來情報分析人員的工作效率,增加獲得和保持競爭優勢或時間優勢的機會。數字化轉型、多域數據集成和算法戰將是情報集團保持長期競爭優勢的核心。

數據驅動時代的情報 科技 第2張

2017年7月,參謀長聯席會議主席發布了聯合出版物JP1《美國武裝部隊條令》的修訂版,將「信息」作為新的第7項聯合職能。這一變化預示著聯合部隊計劃和實施跨地區、多域和多職能行動的方式將發生重大變化。同樣地,這為重新思考「聯合軍種」在21世紀戰爭中的內涵提供了機會。

在可預見的將來,戰爭極有可能以前所未有的形式展開,武器和戰術都讓美國措手不及。今天的彈道導彈飛越海洋需要幾十分鐘,但未來的高超音速武器可能只需要幾分鐘。城市戰爭可能在超連接的城市中爆發,天上的傳感器也許只能提供有限的信息,而無處不在的地面傳感器則可以為分析人員提供海量的數據供其挖掘。在網路領域,當操作員檢測到一次「發射」時,那枚武器可能已經抵達了目的地,並收獲了預期的效果。對衛星的攻擊、經濟攻擊以及隱蔽的影響活動,都會在暗中進行,人們發現時已為時過晚。

數據的向量、體積、速度、多樣性和普遍性正在改變國家安全政策、軍事行動和情報活動的傳統工具和方法。影響範圍只會越來越大並且變化速度也只會越來越快。在「信息就是力量」這一格言的指導下,社會創造的技術能夠產生海量的結構化和非結構化的數據,其規模之大足以顛覆以往所有的諜報分析技術和模式識別。2017年1月,美國國防創新委員會表示,不管是誰,只要收集並組織了最多有關美國及美國對手的數據,都將保持技術優勢。如果我們不能將數據作為戰略資產,就會把寶貴的時間和空間拱手讓給競爭對手。

數據驅動時代的情報 科技 第3張

美國情報界(IC),包括國防情報事業,都不光面臨著純粹規模上(數量和速度)上的挑戰,還面臨數據越來越複雜(多樣性和準確性)的嚴峻挑戰。情報界面臨的挑戰是獲取、管理、關聯、融合和分析各機構之間以及與盟國和夥伴之間不斷增長的數據。在我們的經驗中,情報界中的數據以太多不同的格式生成,在太多的不連接或不可訪問的系統中生成,沒有標準化的結構,也沒有統一的本體。這種情況有可能導致收集浪費、缺乏及時性、指示和警告漏報以及缺乏決策相關性等風險。其結果是,無法在情報周期早期融合數據構建多源情報,並盡可能接近收集點。分析師的任務太艱巨、太繁瑣,而且還需要清除太多障礙,以向決策者和作戰人員提供及時和相關的分析判斷或可操作的情報。

這些挑戰可以用下列方法應對:

  1. 使用能夠解析數據、從數據中學習,然後做出響應的機器學習算法;

  2. 鼓勵情報專家的創造力和深度思考;

  3. 設計策略、信息技術(IT)、敏捷獲取和安全環境,使人機交互能夠蓬勃發展。

這些問題不可能只在任何一個機構、一個項目或情報部門內得到解決。我們認為,迫切需要以創造性的方式來適應這種新環境,其中必須包括利用能夠操縱和理解大數據的系統和機器來提高情報界的技術和操作優勢,並推進人機和機器協作,這樣情報分析人員就能夠最好地利用他們的時間來處理最困難的問題。

數據驅動時代的情報 科技 第4張

同時,機器學習「黑匣子」的不可預見性仍然存在嚴重問題,這種「黑匣子」能人類操作員無法解釋的方式產生解決方案。人工智能(AI)系統創造它們自己的語言,並教會了自己如何使用人類沒有教授也無法理解的策略來玩遊戲。這些影響在國家安全系統中仍是未知且未經過檢驗的,而且其中大部分仍未得到研究。

未來的戰場

未來的戰鬥空間不只由船只、坦克、導彈和衛星組成,還包括算法、網路和傳感器。同歷史上任何時期一樣,未來的戰爭將在衛星系統、電網、通信網路和運輸系統的民用和軍事基礎設施以及人的網路內進行。這兩個戰場——電子戰場和人類戰場——都容易受到敵手算法的操縱。

在電子環境中,算法已經被用於監測和控制大多數關鍵基礎設施領域(電力、水、糧食、金融、通信等)。俄羅斯和中國已表示有興趣測試美國這些系統的能力和弱點,情報機構需要能夠融合多源數據,以了解對手活動和預期結果。

為了破壞人際網路,人事管理辦公室違規的政府工作人員會竊取個人數據,為對手提供了豐富的數據集,使其能夠針對每一位軍事主管人或決策者量身定制隱秘的影響活動。如果將這些數據與Equifax公司被盜的財務記錄、雅虎的電子郵件記錄、Anthem health保險公司的醫療信息以及其他來源的數據結合起來,算法可能會生成針對美國的高度複雜、個性化且隱秘的影響活動。北大西洋公約組織軍事部隊最近報告說,在一個不那麼複雜的戰役中,俄羅斯在軍事訓練演習期間竊聽了美國士兵的電話,以「獲取作戰信息、衡量部隊兵力和恐嚇士兵」。

數據驅動時代的情報 科技 第5張

融合來自不同數據集的大量數據並提供有意義的答案正是人工智能和機器學習的用途所在。只要商業部門能夠找到使用數據預測消費者可能購買的汽車或牙刷品牌的方法,供應商就會出售識別用戶偏好和弱點的功能,情報人員可以在心理層面發現用戶的精確偏好和弱點。

美國面臨著讓對手加速並竊取競爭優勢的風險。中國為人工智能制定了一項國家戰略,承諾今後5年在人工智能技術上投資數十億美元。中國研究人員發表的關於人工智能的期刊文章也比美國同行更多。中國人民解放軍的戰略家正在為一個人類無法跟上戰場決策腳步的世界做準備。

在美國,最近公布的《國家安全戰略》《國防戰略》都提到了人工智能和自主系統對國家安全和戰爭的重要性。然而,除了2016年《國家人工智能研究和發展戰略計劃》(主要側重於研究和開發),美國目前還沒有一個全面的人工智能國家戰略。

數據驅動時代的情報 科技 第6張

前Alphabet(Google母公司)CEO兼國防創新咨詢委員會主席埃里克·施密特描述了中國與美國相比在人工智能方面取得的進展:「到2020年,中國將趕上美國。到2025年,中國將比美國做得更好。到2030年,中國將主導這個行業。」

面臨失敗風險的情報工作

未來的情報技術將取決於數據訪問、圍繞數據塑造正確的企業架構、開發基於人工智能的能力,通過人機協同工作極大加快對數據的語境理解,以及不斷增長的能夠在海量數據中操作和定位的分析技能。情報界需要開發用於訪問、安排和分析數據的諜報技術和方法,包括結構化分析技術和用於機器智能的分析諜報技術標準。新技術的發展速度超過了國防部和情報界實施、培訓和有效利用這些技術的能力。

在國防情報事業中,對收集器和傳感器的投資正在大幅提升傳感器收集數據的能力。美國國防部為無人系統描述了一個藍圖,為數以千計的無人空中、海上和地面系統制定了一個計劃,但還沒有明確的路徑來確定如何分析這些系統中的所有數據,從而創造出價值。這是對空間系統和公開可用的非機密系統的補充。收集能力的提升,包括高度機密的精密傳感器的應用,不一定等同於更多或更好的情報和方向,尤其是在面對那些可能同樣善於適應信息環境的競爭者時。

數據驅動時代的情報 科技 第7張

由香農(Shanahan)中將主管的國防部項目Maven的目標是,克服人類情報分析員無法有效地處理各個領域的大量收集活動的有限性,這一困境被稱為「成功的災難」。作為一個起點和探索性項目,前國防部副部長羅伯特·沃克委托Maven團隊尋找人工智能和計算機視覺的解決方案,以增強、放大和自動利用無人飛行系統的全動態視頻。

目前的情報工作涉及從大量的跨學科(跨情報)信息集中提取有價值的信息——就像找一根藏在草堆里的針。在收集和儲存的大量幹草里,希望最終能找到所有藏在里面的針。在一個更加以數據為導向的時代,越來越有可能從總體數據(例如時間和地理空間行為模式)中提取價值情報。這可能導致一個具有諷刺意味的兩難局面,即人類有太多的數據而無法有效地搜尋那一根「針」,同時又沒有足夠的可獲取的數據來獲取和驗證有用的情報。

下一個問題是,一旦獲得情報,該如何處理它。軍事部門正在開發和採購對數據和情報的渴求比以往更加強烈的作戰系統,並且情報任務數據必須在採購周期中以可攝取的數據結構和作戰系統能夠處理的分類層次盡早被轉移到這些系統中,然後要頻繁更新並盡快用於作戰。同時,在政策界,當機密情報來得太慢或過於機密而沒有用處時,決策者會越來越多地依賴非機密的開源信息。

美國空軍上校約翰·博伊德在關於觀察、調整、決策和行動(OODA循環)的開創性研究中,強調了以一種對手無法理解或跟得上的節奏作戰的重要性。在對手的OODA循環內進行操作,可以通過擾亂或扭曲對手的心理圖像來幫助做到這些目標,這樣他就不能評估或應對周圍發生的一切。在當今快節奏和不斷變化的數據驅動時代,「信息領先」或「信息優勢」這兩個術語是不現實的;相反,「時間優勢」可能產生最好的結果。然而,即使這樣,如果美國作戰人員可以留在對手的OODA循環中,同時以富有想像力的方式使用數據來扭曲對手的方向的話,這也足以占上風。

數據驅動時代的情報 科技 第8張

人工智能和機器學習通過在數據到達時實時地了解數據,以毫秒為單位評估選項並啟動一個動作,從而為加速OODA循環的每個步驟提供了機會。此類決定可包括在操作人員有時間閱讀警報或在預先確定的一組經批准的參數內啟動響應之前對指示和警告作出響應。機器學習為縮小OODA循環的前兩個階段提供了機會,極大地增加了人類加速決策和採取行動的潛力。

我們很可能會面臨一個算法與算法進行對決未來,這讓我們質疑21世紀的作戰人員是否會把幾分鐘的決策時間看作是過去的奢侈遺物。

可及範圍內的解決方案

情報機構能夠而且應該投資於跨領域、跨項目和跨學科的機器學習能力,並要求情報人員最大限度地利用這些能力。在隔離區、專有數據庫和算法無法到達的機密領域中,保留的任何數據都需要情報人員進行人工整合、延遲情報評估、並創建受保護的數據氣泡,以防情報分析人員無法看到內部全貌,導致在情報分析時無法考慮所有情報來源。這一情景威脅到「按需知密」(need to know)的原則,並將迫使收集和分析部門,包括反間諜和安全辦公室,將來自外部的威脅和來自內部的威脅調和起來。數據保護策略可以讓算法訪問人類分析人員無法查看的數據字段,不過這也取決於人類對機器的信任程度以及如何對機器工作的漏洞(包括自然發生的和敵人製造的)進行審計。

數據驅動時代的情報 科技 第9張

要達到這種終結狀態,應該考慮幾件事情。

首先,要找到任何情報問題的答案,必須先提出這樣的主張:每個分析員都需要來自各種可能來源的所有潛在相關數據。這意味著要在經典演繹法(尋找已知的未知數)和歸納(綜合發現未知數)分析方法之間找到一個不同的平衡點。它還要求採取不同的收集方法,因為所有數據在收集之後的很長時間內都可能是相關的,並且應能夠在可發現的檔案中被查閱;這樣做的過程在很大程度上取決於數據集是否包括有關美國人和其他受保護實體的信息,同時數據控制和數據質量保證也是必不可少的功能。

機器學習和人工智能的廣泛融合將為欺騙行為提供新的機會,而欺騙行為則來自於被改變或操縱的數據。反人工智能的言論將甚囂塵上,而影響行動將在新的尚未被理解的層面進行,這都需要重新強調以進攻和防禦認知為中心的行動。情報分析人員需要被培訓,以了解如何識別對手篡改或操縱數據的企圖,其中還包括了解如何最大限度地利用人工智能,以防止甚至更為複雜的影響行動達到其預期的行動結果。

第二,數據不會被視為IT問題;相反,IT系統應該由它們所解決的操作問題組成。這就需要從封閉的專有架構和不可持續的數據標準的缺乏,轉向開放架構和敏捷方法(開放的架構和新技術和應用程序的快速瞬時採用),任何分析師都可以隨時查找和獲取任何來源的任何數據。更常見的情況是,算法被移動到數據中,而不是試圖將數據移動到算法中。全局雲解決方案對於集成、針對人工智能的所有方面進行優化都必不可少的,而不再是僅僅用於數據存儲或搜尋。我們必須掌握數據訪問,以便為機器學習和人機合作提供動力。反過來,快速的數據訪問需要有效的數據管理,這就需要新的技能和專門知識,例如數據架構師和數據科學家。跨所有安全域的網路訪問、對所有相關數據類型的訪問以及對顛覆性技術的敏捷集成是做到和保持決策優勢的關鍵。

數據驅動時代的情報 科技 第10張

第三,公開可用的信息和開源信息將為我們的情報知識提供第一層基礎。這就需要從「認為最高機密情報是最可靠的」到「接受和整合非傳統和非機密來源」的重大轉變。從所有其他情報學科中收集的精準資料將增強基礎情報,並填補現有知識空白。當機密性不再是信息具有情報價值的必要條件,這就顛覆了60年的范式並對「情報」概念提出了挑戰。

第四,將聯合和組合的分析人員隊伍從工業時代生產線處理和利用單一的數據收集流程,轉變為一個信息時代的企業模式,在這種模式下,一些分析人員與聯盟、國家和國際夥伴充分結合,進行多源和全源的關聯和融合。將情報數據分層是一個不錯的開始,但這還不夠。更要為決策提供時間和空間,這既需要人的決策,也需要人工智能系統的決策。這樣還引入了更廣泛的問題,即分析工作隊伍未來的廣度和深度的平衡。培訓需要更加注重分析中的綜合與創新能力。

最後,上述解決辦法將需要對人力資本、預算編制、收購以及研、發的情報界生命周期進行一次革命。持續2年甚至更長時間的雇用和安全審批流程將導致2年前(在一個數據驅動的世界中,這就意味著一個時代)處於行業領先地位的雇員入職,而對於事業中期雇員的招聘,職位要求具有政府的價值經驗,而不是商業和學術部門的科學、技術和分析經驗。在最好的情況下,國防部和情報界面臨著在4年規劃、方案擬訂、預算編制和執行過程中制定多年預算戰略的挑戰,而在今天這個長期持續決議的環境中,制定預算戰略只是一種美好的願望,並不會經常發生。情報機構一再嘗試使用一小部分預算和「創新辦公室」來創建創新的收購改革,但當這些解決方案在跨國家或軍事情報項目中會停滯不前。

數據驅動時代的情報 科技 第11張

改變情報界傳統的採購程序,需要一代訂約官員,他們擁有培訓經驗和資源來管理對合同程序的全面改革,他們要將重點放在質量、結果和相關性的速度上,而不是被技術上可接受的最低價格所桎梏。採用敏捷方法將有助於加快技術開發、實施和改進的步伐。最後,每項改革都將創造一個環境,讓研發(R&D)辦公室(在情報界機構和軍事服務部門)能夠蓬勃發展。研發機構需要最優秀的技術專家在收集者、分析者和行業供應商之間建立夥伴關係,他們需要來自訂約官員的積極主動的支持和有效的預算環境,以取得成功,最終助力於形成一種可用於人工智能的原型戰爭文化。

結語

我們的提議至少有一個致命弱點,美國應該為其做準備並減輕其影響:對技術的過度依賴。即使在自主系統的時代,戰爭仍將是人類的主場。如果國家要與技術落後的敵人作鬥爭,例如在阿富汗的山區或非洲的叢林,作戰人員和情報官員就面臨著過於依賴需要大量數據的系統的風險。另一種情況是,有朝一日,美國可能會與一個發現並利用我們技術弱點的敵人作戰,他能蒙蔽我們的作戰人員,或以新的和有創意的方式使用數據來對付我們。鑒於這兩種情況,美國仍將重視在低技術測試和可靠的諜報技術和解決方案方面熟練的情報分析員和作戰人員的價值。

最好的情報分析來自藝術與科學的恰當融合。今天,情報的藝術可能和2000年前一樣。然而,不同的是,有必要大大加快以數據為中心的諜報技術的發展速度。分析人員必須具備處理大量信息所需的工具,使他們能夠縮小情報差距,以數據速度取得更好的作戰成果。

數據驅動時代的情報 科技 第12張

人工智能和機器學習將有助於提高未來情報分析人員的工作效率,增加獲得和保持競爭優勢或時間優勢的機會。數字化轉型、多域數據集成和算法戰將是情報集團保持長期競爭優勢的核心。這既是戰略創新,也是戰術或分析師層面的創新,二者缺一不可。

情報界正在利用人工智能和機器學習進行關鍵決策。盡管在16年間的持續反恐和反叛亂行動中存在一些固有不利因素,但國際反恐怖主義委員會建立了一支經驗豐富、訓練有素的分析人員隊伍,與世界上任何其他機構都不同。情報界最大的潛在非對稱優勢仍然是它能夠快速理解數據並保持在對手的OODA循環中。美國和它的對手會不會放慢他們機器的速度,以人類思維的速度來維持在一個OOAD循環中?或者每個國家都會盡最大可能追求人工智能,並擔心如果不這麼做它的對手就會取得先機麼?是時候讓情報界來決定如何回答這些問題了。

數據驅動時代的情報 科技 第13張

作者丨Cortney Weinbaum

編譯丨IITE

選自丨NDU Press

數據驅動時代的情報 科技 第14張