今朝企業(yè)已進進全新的大年夜數(shù)據(jù)期間。在高帶寬、移動的、收集環(huán)境中工作和糊口的我們,會產(chǎn)生大年夜量的數(shù)據(jù),這些都成為大年夜數(shù)據(jù)的來歷,而這些信息很少存在于統(tǒng)一個處所。在幾微秒中,信息就可以夠發(fā)布給世界各地的良多人。企業(yè)的高管門(包含CEO、CIO、CSO等)都必需面對因為大年夜數(shù)據(jù)帶來的風(fēng)險和安然挑戰(zhàn),并打算好若何往應(yīng)對他們。本文將會商若何對待非布局化數(shù)據(jù)相對傳統(tǒng)的布局化數(shù)據(jù)帶來的安然風(fēng)險和挑戰(zhàn)和多層面防護編制。
辨認非布局化數(shù)據(jù)與布局化數(shù)據(jù)安然呵護的差別
信息凡是被回類為布局化情勢的或非布局化情勢的。不合的類型有不合的呵護編制。舉個例子來講,非布局化的Excel電子數(shù)據(jù)表實際上包含布局化的數(shù)據(jù)。在經(jīng)典的術(shù)語中,布局化的數(shù)據(jù)是指數(shù)據(jù)合適某種嚴格的數(shù)據(jù)模型和限制的模型。好比,模型可以定義一個營業(yè)流程節(jié)制信息流顛末一些面向辦事的架構(gòu)(SOA)系統(tǒng),或也可定義數(shù)據(jù)如安在內(nèi)存的一個數(shù)組中存儲。可是對大年夜大都IT和數(shù)據(jù)庫治理專家來講,布局化數(shù)據(jù)是駐留在數(shù)據(jù)庫中,并基于數(shù)據(jù)庫架構(gòu)和相干數(shù)據(jù)庫法則被組織的信息。而作為一個安然專家來講,這就意味著兩個首要的工作:
數(shù)據(jù)庫駐留在數(shù)據(jù)中間,周圍是物理安然舉措措施(包含磚墻、金屬柜子等)、收集防火墻和其他安然辦法,承諾你可以或許節(jié)制對數(shù)據(jù)的拜候。
數(shù)據(jù)本身的布局化編制凡是承諾對數(shù)據(jù)的簡單分類。舉個例子,你能在數(shù)據(jù)庫中辨認一個特定的人的醫(yī)療記實和利用響應(yīng)的安然節(jié)制。
所以,因為你知道布局化數(shù)據(jù)是甚么樣的和它駐留在哪里,你有嚴格的節(jié)制機制來決定誰能拜候它。對布局化數(shù)據(jù)定義和利用安然節(jié)制相對簡單,要么利用布局內(nèi)置的特點或?qū)iT為特定布局設(shè)計的第三方東西便可完成節(jié)制。
而在比擬之下,非布局化數(shù)據(jù)的治理和安然加倍堅苦。非布局化數(shù)據(jù)能在任何處所、以任何格局、在任何設(shè)備上存在,并且在大年夜數(shù)據(jù)期間可以或許超越任何收集。舉個例子申明非布局化數(shù)據(jù)的利用復(fù)雜性,一個病人的記實從數(shù)據(jù)庫中被提掏出來顯示在一個網(wǎng)頁上,從網(wǎng)頁拷貝到數(shù)據(jù)表格中,附在電子郵件中,然后發(fā)送到別的一個收集的郵箱中。
并且,非布局化的數(shù)據(jù)沒有嚴格的格局。當(dāng)然,我們的Word文檔,電子郵件等合適定義它們內(nèi)部布局的尺度;但是,它們此中包含的數(shù)據(jù)幾近沒有限制。好比上面列舉的阿誰病人記實的例子,假定一個用戶改變內(nèi)容后把它從網(wǎng)頁上拷貝到數(shù)據(jù)表格中,可能刪除某些字段和標(biāo)題問題。因為這個信息從一種格局改變成了別的一種格局,它原始的機構(gòu)被有效的改變了。
呵護存儲成布局化的數(shù)據(jù)和信息是相對簡單的??墒歉粋€信息從布局化的情勢移改變成非布局化的時辰,這個環(huán)境就會變得很是的復(fù)雜??紤]如許一個例子,良多闡發(fā)人士的陳述表白在當(dāng)前的企業(yè)組織中,80%或超越80%的電子信息長短布局化的,還有非布局化數(shù)據(jù)增加的速度是布局化數(shù)據(jù)的10到20倍。也考慮一下媒體上的新聞文章不竭夸大年夜常識產(chǎn)權(quán)的盜取、信息的不測丟掉、數(shù)據(jù)的歹意利用等,最核心的標(biāo)題問題就長短布局化的數(shù)據(jù)。在2010年,全球總的非布局化的數(shù)據(jù)估計大年夜概有100萬PB(1048576000000GB),被覺得將以每年25%的速度增加。我們明顯需要往理解我們?nèi)艉魏亲o非布局化數(shù)據(jù)的安然。
非布局化數(shù)據(jù)需安然呵護的“三態(tài)”
非布局化的數(shù)據(jù)在任何給定的時候老是處在三種狀況中的一種:非利用、傳輸中、利用中。非利用也就是在存儲設(shè)備中;它可能在傳輸中意味著它從一個處所被拷貝到另外一個處所?;?,它可能在利用中(被一些利用法度打開著)。好比一個PDF文件,它可能存儲在一個USB設(shè)備上,不在利用狀況;統(tǒng)一個PDF文件可能從USB設(shè)備拷貝,并附在電子郵件中發(fā)送到因特網(wǎng)上。PDF從USB設(shè)備上被拷貝,經(jīng)由過程良多州到電子郵件辦事器,經(jīng)由過程收集從發(fā)件箱到收件箱。最后,收件人收到郵件并打開PDF文件,在阿誰時刻非布局化數(shù)據(jù)處于利用狀況(駐留在內(nèi)存中),在一個利用法度的節(jié)制下(例如Adobe Reader瀏覽器),并被閃現(xiàn)給可以交互的用戶。
布局化數(shù)據(jù)轉(zhuǎn)化為非布局化數(shù)據(jù)帶來風(fēng)險
基于上面三種狀況的描述,可以加倍具體地會商今朝對呵護非布局化數(shù)據(jù)的挑戰(zhàn)。假定企業(yè)組織有一個HR的利用法度,它包含一個保護每個員工信息的數(shù)據(jù)庫,包含他們的年度工資、之前的規(guī)律處罰信息、小我數(shù)據(jù)(例如家庭地址和社會安然號碼)等。猶如大年夜大都現(xiàn)代的HR利用法度一樣,它是基于網(wǎng)頁的,所以當(dāng)一個認證的用戶運行一個報表的時辰,報表是從布局化的數(shù)據(jù)庫過渡到非布局化的數(shù)據(jù),以HTML的格局傳遞給網(wǎng)頁瀏覽器。用戶利用法度可以或許很等閑從瀏覽器的拷貝和粘貼這個信息到電子郵箱信息和經(jīng)由過程其他編制轉(zhuǎn)發(fā)。當(dāng)這個信息一旦添加到郵件正文中,它掉往了與原始的利用法度所有布局和聯(lián)系關(guān)系。用戶可能也會選擇只拷貝和粘貼一部門信息,更改一部門信息,或在原始的信息中添加一些新的內(nèi)容。收到用戶發(fā)的電子郵件的人可能會拷貝和粘貼數(shù)據(jù)到電子表格。這些電子表格信息可能被用來成立一個圖示的信息,利用的原始的一些文本信息在圖形上作為標(biāo)簽。猶如這個環(huán)境所示,布局化信息很快就被三種狀況的改變而轉(zhuǎn)化成了非布局化數(shù)據(jù),這些布局化數(shù)據(jù)從之前的數(shù)據(jù)庫中改變并重構(gòu)、存儲在較小的數(shù)據(jù)格局中,它們包含電子郵件,文檔,圖片,視頻等等。
企業(yè)可能已很好的定義了安然模型往節(jié)制拜候HR的利用法度和包含HR信息的數(shù)據(jù)庫。但是,信息需要傳遞給對成心義的人們或利用法度。假定它經(jīng)由過程收集傳輸了,企業(yè)和用戶能肯定拜候收集是安然的,但是,當(dāng)信息達到用戶時,它可以或許被轉(zhuǎn)換成數(shù)千種不合的格局,發(fā)送給各類各樣的利用法度和收集。每個信息存在的處所可以或許有呵護的,它可能利用拜候節(jié)制對共享文件和節(jié)制對數(shù)據(jù)駐留(內(nèi)容)的處所和收集的拜候;但是,你的非布局化信息可能在任何處所被終結(jié),是以很難對它呵護。事實上,乃至很難對它定位、辨認和分類信息。一旦HR的數(shù)據(jù)終結(jié)在電子郵件中,不測的轉(zhuǎn)發(fā)給弊端的人,它就沒有存儲在數(shù)據(jù)庫原始數(shù)據(jù)的杰出布局了。它在從數(shù)據(jù)庫到一個未授權(quán)的用戶的收件箱的傳輸過程中,也被復(fù)制了好幾回。
事實上,在大年夜數(shù)據(jù)期間,非布局化的數(shù)據(jù)不竭的產(chǎn)生改變,數(shù)據(jù)終結(jié)在你沒有預(yù)期的處所,出格是因特網(wǎng)供給了一個令人難以置信的由善于傳輸非布局化數(shù)據(jù)的計較機構(gòu)成的大年夜型收集。大年夜量的金錢和精力投進到往扶植社交收集(SNS),文件共享和協(xié)助辦事,點對點的利用。點對點供給了無數(shù)種將非布局化數(shù)據(jù)在幾秒鐘內(nèi)發(fā)布給數(shù)十億的用戶。所以我們常常聽到關(guān)于數(shù)據(jù)丟掉的例子就層見迭出,此刻我們創(chuàng)作發(fā)現(xiàn)了這么多令人詫異的編制承諾信息簡單的分開我們呵護的鴻溝,我們的收集節(jié)制用來禁止報復(fù)打擊者范圍受我們呵護的數(shù)據(jù)不再足以讓它安然了。
是以,企業(yè)高層治理者要充分意想到大年夜數(shù)據(jù)期間非布局化數(shù)據(jù)帶來的安然風(fēng)險和沖擊,并提早預(yù)備好響應(yīng)的辦法來應(yīng)對它。
多層面數(shù)據(jù)防泄漏呵護非布局化數(shù)據(jù)
非布局化數(shù)據(jù)凡是需要以以下幾種編制進行泄漏管控:
監(jiān)控:被動的監(jiān)控和陳述收集流量和其他通信通道的信息例如文件拷貝到附加的存儲。
發(fā)現(xiàn):掃描本地或長途數(shù)據(jù)存儲和在數(shù)據(jù)存儲庫或在終端上分類動靜。
捕獲:存儲從頭構(gòu)建的收集會話為今后的闡發(fā)和分類/政策細化。
防護/梗阻:基于信息從監(jiān)控和發(fā)現(xiàn)組件防護數(shù)據(jù)傳輸,要么經(jīng)由過程阻斷一個收集會話,或經(jīng)由過程一個本地代辦署理往遏制信息流。
針對以上需要,可以利用數(shù)據(jù)防泄漏進行有效的防控。數(shù)據(jù)防泄漏(也稱DLP)指的是一個相對較新的一組手藝設(shè)計往監(jiān)控,發(fā)現(xiàn)和呵護數(shù)據(jù)。你可能還聽到這類手藝成為數(shù)據(jù)泄漏防護—有時它也稱為“呵護”這個詞代替“防護”。在任何環(huán)境下,DLP像一個你“數(shù)據(jù)的防火墻”。有各類各樣DLP的解決方案在市場上,凡是可以或許利用以下三種類型來別離在不合的層面呵護非布局化數(shù)據(jù):
收集DLP 凡是一個收集利用法度在首要的收集周圍(大年夜大都環(huán)境是在企業(yè)的組織收集和互聯(lián)網(wǎng)之間)作為一個網(wǎng)關(guān)。收集DLP監(jiān)控經(jīng)由過程網(wǎng)關(guān)的流量試圖往探測敏感的數(shù)據(jù)或做點相干的工作,凡是會禁止它分開收集。
存儲DLP軟件要么運行在一個利用法度上或直接在文件辦事器上,履行像網(wǎng)路DLP一樣的功能。存儲DLP掃描存儲系統(tǒng)往發(fā)現(xiàn)敏感數(shù)據(jù)。當(dāng)找到的時辰,它可以刪掉落它,把它隔離或簡單的通知治理員。
終端的DLP軟件運行在終端系統(tǒng)上監(jiān)控把持系統(tǒng)勾當(dāng)和利用法度,不雅察內(nèi)存和收集流量往探測敏感信息不得當(dāng)?shù)睦谩?/P>
并且,收集、存儲和終端的DLP常常一路利用作為一個綜合DLP解決方案往知足非布局數(shù)據(jù)的安然管控需求。