導讀:大數據所存儲的數據非常巨大,往往采用分布式的方式進行存儲
大數據所存儲的數據非常巨大,往往采用分布式的方式進行存儲,而正是由于這種存儲方式,存儲的路徑視圖相對清晰,而數據量過大,導致數據保護,相對簡單,黑客較為輕易利用相關漏洞,實施不法操作,造成安全問題。由于大數據環(huán)境下終端用戶非常多,且受眾類型較多,對客戶身份的認證環(huán)節(jié)需要耗費大量處理能力。由于APT攻擊具有很強的針對性,且攻擊時間長,一旦攻擊成功,大數據分析平臺輸出的最終數據均會被獲取,容易造成的較大的信息安全隱患。大數據安全雖仍繼承傳統(tǒng)數據安全保密性、完整性和可用性三個特性,但也有其特殊性,主要表現(xiàn)在以下兩方面:
一、大數據安全隱患
(一)大數據遭受異常流量攻擊
大數據所存儲的數據非常巨大,往往采用分布式的方式進行存儲,而正是由于這種存儲方式,存儲的路徑視圖相對清晰,而數據量過大,導致數據保護,相對簡單,黑客較為輕易利用相關漏洞,實施不法操作,造成安全問題。由于大數據環(huán)境下終端用戶非常多,且受眾類型較多,對客戶身份的認證環(huán)節(jié)需要耗費大量處理能力。由于APT攻擊具有很強的針對性,且攻擊時間長,一旦攻擊成功,大數據分析平臺輸出的最終數據均會被獲取,容易造成的較大的信息安全隱患。
(二)大數據信息泄露風險
大數據平臺的信息泄露風險在對大數據進行數據采集和信息挖掘的時候,要注重用戶隱私數據的安全問題,在不泄露用戶隱私數據的前提下進行數據挖掘。需要考慮的是在分布計算的信息傳輸和數據交換時保證各個存儲點內的用戶隱私數據不被非法泄露和使用是當前大數據背景下信息安全的主要問題。同時,當前的大數據數據量并不是固定的,而是在應用過程中動態(tài)增加的,但是,傳統(tǒng)的數據隱私保護技術大多是針對靜態(tài)數據的,所以,如何有效地應對大數據動態(tài)數據屬性和表現(xiàn)形式的數據隱私保護也是要注重的安全問題。最后,大數據的數據遠比傳統(tǒng)數據復雜,現(xiàn)有的敏感數據的隱私保護是否能夠滿足大數據復雜的數據信息也是應該考慮的安全問題。
(三)大數據傳輸過程中的安全隱患
數據生命周期安全問題。伴隨著大數據傳輸技術和應用的快速發(fā)展,在大數據傳輸生命周期的各個階段、各個環(huán)節(jié),越來越多的安全隱患逐漸暴露出來。比如,大數據傳輸環(huán)節(jié),除了存在泄漏、篡改等風險外,還可能被數據流攻擊者利用,數據在傳播中可能出現(xiàn)逐步失真等。又如,大數據傳輸處理環(huán)節(jié),除數據非授權使用和被破壞的風險外,由于大數據傳輸的異構、多源、關聯(lián)等特點,即使多個數據集各自脫敏處理,數據集仍然存在因關聯(lián)分析而造成個人信息泄漏的風險。
基礎設施安全問題。作為大數據傳輸匯集的主要載體和基礎設施,云計算為大數據傳輸提供了存儲場所、訪問通道、虛擬化的數據處理空間。因此,云平臺中存儲數據的安全問題也成為阻礙大數據傳輸發(fā)展的主要因素。
個人隱私安全問題。在現(xiàn)有隱私保護法規(guī)不健全、隱私保護技術不完善的條件下,互聯(lián)網上的個人隱私泄露失去管控,微信、微博、QQ等社交軟件掌握著用戶的社會關系,監(jiān)控系統(tǒng)記錄著人們的聊天、上網、出行記錄,網上支付、購物網站記錄著人們的消費行為。但在大數據傳輸時代,人們面臨的威脅不僅限于個人隱私泄露,還在于基于大數據傳輸對人的狀態(tài)和行為的預測。近年來,國內多省社保系統(tǒng)個人信息泄露、12306賬號信息泄露等大數據傳輸安全事件表明,大數據傳輸未被妥善處理會對用戶隱私造成極大的侵害。因此,在大數據傳輸環(huán)境下,如何管理好數據,在保證數據使用效益的同時保護個人隱私,是大數據傳輸時代面臨的巨大挑戰(zhàn)之一。
(四)大數據的存儲管理風險
大數據的數據類型和數據結構是傳統(tǒng)數據不能比擬的,在大數據的存儲平臺上,數據量是非線性甚至是指數級的速度增長的,各種類型和各種結構的數據進行數據存儲,勢必會引發(fā)多種應用進程的并發(fā)且頻繁無序的運行,極易造成數據存儲錯位和數據管理混亂,為大數據存儲和后期的處理帶來安全隱患。當前的數據存儲管理系統(tǒng),能否滿足大數據背景下的海量數據的數據存儲需求,還有待考驗。不過,如果數據管理系統(tǒng)沒有相應的安全機制升級,出現(xiàn)問題后則為時已晚。
二、大數據安全挑戰(zhàn)
大數據安全雖仍繼承傳統(tǒng)數據安全保密性、完整性和可用性三個特性,但也有其特殊性,主要表現(xiàn)在以下兩方面:
(一)個人隱私保護
以前數據是企業(yè)的資產,是在企業(yè)內部、局部的環(huán)境里使用,流動性不強,所以,數據的個人隱私表現(xiàn)不突出。但是到了互聯(lián)網+時代,數據無處不在,各種數據積累起來后形成了多元數據關聯(lián),不法分子和別有用心的人可通過多元數據關聯(lián)分析導致個人隱私信息泄露。怎樣有效保護個人隱私是大數據安全面臨的第一個重要問題。
(二)跨境數據流動
在現(xiàn)在這個時代,數據的流動很重要。全球性購物促銷活動多個國家都參與其中,數據的跨境流動是大數據的一個特殊屬性。在法律制度、數據服務外包、打擊網絡犯罪方面保護跨境數據的安全是很重要的。
所以,建立大數據安全標準體系框架時要對傳統(tǒng)數據的采集、組織、存儲、處理等生命周期各方面安全標準進行適用性分析,適合的接著采用,不適合的要修訂,缺項的必須增加。
外部非授權人員對信息系統(tǒng)進行惡意入侵,非法訪問隱私數據;數據具有易復制性,發(fā)生數據安全事件后,無法進行有效的追溯和審計;大數據有流動、共享的需求,大量數據的匯聚傳輸加大了數據泄露的風險。
(三)傳統(tǒng)安全措施難以適配
大數據海量、多源、異構、動態(tài)的特征導致大數據系統(tǒng)存儲結構復雜、開放性、分布式計算和高效精準的服務,這些特殊需求傳統(tǒng)安全措施解決不了。
(四)平臺安全機制亟待改進
以前我們用ORACLE數據庫,到了大數據時代,大家基于hadoop體系結構。在hadoop體系結構里,用戶的身份鑒別和授權訪問等安全保障能力比較薄弱。同時開源hadoop的一些組件在使用時沒有測試,里面可能存在漏洞和惡意代碼,存在人家開的后門。
(五)應用訪問控制愈加復雜
在數據庫時代應用訪問控制通過數據庫的訪問機制解決。每一個用戶都要注冊,注冊完才能訪問到數據庫。但是到了大數據時代,存在大量未知的用戶和大量未知的數據,有很多的用戶不知道他的身份,雖然他注冊了也不知道他是誰,所以預先設置角色和預先設置角色的權限都做不到。