仿佛所有人都在存眷大年夜數(shù)據(jù),乃至包含美國聯(lián)邦當局。美國聯(lián)邦商業(yè)委員會(FTC)往年年底向數(shù)據(jù)經(jīng)紀行業(yè)的9家公司發(fā)出號令,要求他們供給對客戶數(shù)據(jù)匯集和利用環(huán)境的信息。FTC的步履明白表白,當然大年夜數(shù)據(jù)的鼓起供給了良多商業(yè)好處,但也帶來重大年夜的隱私標題問題。
為甚么要利用大年夜數(shù)據(jù)?
大年夜數(shù)據(jù)不合于過往的數(shù)據(jù)倉庫,因為它幾近闡發(fā)所有類型的數(shù)據(jù)文件或格局,包含圖象、視頻和從社交媒體匯集的數(shù)據(jù)。大年夜數(shù)據(jù)的另外一個特點是它沒有像辦事器對數(shù)據(jù)存儲的“一對一”的關(guān)系,而是依托虛擬化架構(gòu),從大年夜型內(nèi)容商鋪和檔案中提取內(nèi)容作為單一全球資本。
在企業(yè)治理人員和營業(yè)線經(jīng)理中,利用大年夜數(shù)據(jù)的最大年夜念頭是構(gòu)成更準確、具體的猜想或猜測,從而為企業(yè)供給暗藏的優(yōu)勢。大年夜數(shù)據(jù)帶來的營業(yè)優(yōu)勢很遍及,從頭產(chǎn)品開辟和改進到最好訂價,再到遴選求職簡歷和設(shè)計有效的營銷勾當?shù)取J聦嵣?,政治活動已開端操縱大年夜數(shù)據(jù)闡發(fā):2012年奧巴馬競選就操縱了大年夜數(shù)據(jù)闡發(fā)來肯定可能投票的選平易近,然后影響他們,經(jīng)由過程他們來籌集競選資金,并獲得選票,這是奧巴馬獲得最終成功的關(guān)頭計謀。
大年夜數(shù)據(jù)隱私標題問題
FTC比來采納的步履是專門針對數(shù)據(jù)經(jīng)紀公司:這類公司匯集和闡發(fā)特定消費者行動數(shù)據(jù),然后將闡發(fā)成果賣給??催M步營銷和發(fā)賣事跡的公司。但是,需要承認的是,利用大年夜數(shù)據(jù)帶來愈來愈多的隱私標題問題,這其實不但限于這些傳統(tǒng)的數(shù)據(jù)經(jīng)紀公司。經(jīng)濟學人信息部(經(jīng)濟學人集體內(nèi)自力的營業(yè)部)發(fā)布了利用大年夜數(shù)據(jù)最多的19個行業(yè)范疇,包含制造業(yè)、IT和手藝、金融辦事、專業(yè)辦事、醫(yī)療保健、制藥和生物手藝和消費品等。毫無疑問,大年夜數(shù)據(jù)革命已開端。
按照大年夜數(shù)據(jù)的特點,和大年夜數(shù)據(jù)利用的營業(yè)念頭,最關(guān)頭的隱私標題問題是,簡單地說,數(shù)據(jù)的質(zhì)量或準確性;和企業(yè)利用這些數(shù)據(jù)來作出決定而可能會對小我產(chǎn)生的負面影響。例如,從社交媒體獲得的小我信息的準確性?從社交媒體或其他收集來歷的信息可以用于遴選或排名求職申請,或進步醫(yī)療保險的代價嗎?根基的小我資料,例如春秋、婚姻狀況、教育或就業(yè)環(huán)境凡是都是未經(jīng)驗證的。在免費電子郵件辦事中一樣也沒有這些驗證,幾近所有效戶城市點選接管利用條目和私隱聲明,表白同意拋卻用于數(shù)據(jù)匯總的必然程度的隱私權(quán)力。
另外一個質(zhì)量標題問題是,當匯集互聯(lián)網(wǎng)搜刮字詞或短語時,可能會對它們存在曲解。企業(yè)操縱大年夜數(shù)據(jù)不佳的例子包含利用互聯(lián)網(wǎng)搜刮詞條來評估產(chǎn)品訂價,或暗藏方針客戶。要知道,在家庭計較機中可能有多個用戶,并且有良多啟事或人在網(wǎng)上搜刮與他們無關(guān)的主題。這類類型的數(shù)據(jù)匯集、闡發(fā)和利用可能產(chǎn)生有標題問題標闡發(fā)成果,從而導(dǎo)致弊端的決定計劃,而最終造成小我和闡發(fā)數(shù)據(jù)的企業(yè)兩敗俱傷的場合排場。這類貧乏對大年夜數(shù)據(jù)質(zhì)量的節(jié)制將我們指向另外一個隱私呵護原則,即匯集合適且合適既定方針的小我數(shù)據(jù)。
大年夜數(shù)據(jù)隱私的最好做法
企業(yè)措置大年夜數(shù)據(jù)的最好做法仍然還沒有肯定,但已有一些經(jīng)驗可供我們借鑒,確保在不犧牲小我數(shù)據(jù)隱私的環(huán)境下,鞭策大年夜數(shù)據(jù)立異。
有效利用大年夜數(shù)據(jù)的第一步是準確地采購和治理云辦事,這是使大年夜數(shù)據(jù)合適成本效益的先決前提:大年夜大都企業(yè)不克不及或不會投資于撐持大年夜數(shù)據(jù)打算所需要的IT根本舉措措施,而是依托云計較利用、根本舉措措施和措置能力。別的,即便是那些愿意投資的企業(yè)也會發(fā)現(xiàn),沒有云計較供給的矯捷性,他們將寸步難行。這也透露了良多企業(yè)的虧弱環(huán)節(jié),即遍及不克不及確保云計較中數(shù)據(jù)的安然性和隱私性。企業(yè)履行尺度的一般安然合同條目其實不敷。對特定命據(jù)隱私節(jié)制,云辦事供給商和云辦事用戶明白各自必需承擔的責任。還必需對云辦事進行延續(xù)的檢測和審計,同時經(jīng)由過程相干指標來顯示數(shù)據(jù)完全、保密和可用。利用云計較辦事的完美的數(shù)據(jù)呵護資本是云安然聯(lián)盟(Cloud Security Alliance),其官網(wǎng)上有良多指導(dǎo)性文件可供參考。
從過往的經(jīng)驗來看,在擺設(shè)云辦事時,最好在公共云履行大年夜數(shù)據(jù)原型,然后轉(zhuǎn)移到私有云。為甚么?公共云擺設(shè),顧名思義,是在第三方環(huán)境內(nèi),并可能遭到“不信賴”各方的拜候。而私有云擺設(shè)直接管組織或企業(yè)的節(jié)制和治理,即便數(shù)據(jù)計較舉措措施可能位于企業(yè)外部,但私有云擺設(shè)只能由受信賴的各方來拜候。
更好地操縱大年夜數(shù)據(jù)的下一個計謀是擺設(shè)暢通領(lǐng)悟存儲。暢通領(lǐng)悟存儲更有效,并可以或許降落弊端的可能性,而這些弊端可能影響數(shù)據(jù)質(zhì)量或準確性。暢通領(lǐng)悟存儲與數(shù)據(jù)質(zhì)量和準確性相干的關(guān)頭特點是反復(fù)數(shù)據(jù)刪除,它還具有成本效益的優(yōu)勢。
另外一種最好做法是準確地清洗數(shù)據(jù),以幫忙避免一些上述隱私標題問題。Emory University數(shù)據(jù)倉庫專家Amy Dean暗示:“在盡可能早的時辰,對數(shù)據(jù)進行過濾、清理、刪減、一致化、匹配、連接和診斷?!辫b于數(shù)據(jù)質(zhì)量對闡發(fā)的影響,Dean建議對多樣的不合的數(shù)據(jù)進行衡量或評估。Dean還建議,為了查詢,數(shù)據(jù)來歷應(yīng)當有鏈接或可用,如許有標題問題標任何數(shù)據(jù)元素都可以追溯到其泉源。
最終,確保小我數(shù)據(jù)準確性(進而確保更好的數(shù)據(jù)隱私)的最好編制是鼓動鼓勵和要求消費者查看、審查和改正匯集到的有關(guān)本身的信息,而不只是企業(yè)本身出手。別的,消費者審查過程要易用,并且不需要消費者花錢的。對初期大年夜數(shù)據(jù)利用者,這是很艱巨的工作,因為他們凡是匯集大年夜量乃至他們從未利用的數(shù)據(jù),把持起來會很復(fù)雜。并且,企業(yè)可能也擔憂消費者看到他們匯集了如斯具體的小我信息。但這類透明度是讓消費者決定采取大年夜數(shù)據(jù),成立決定信念的最好編制。諾言陳述實體一向以來讓消費者拜候、審查和改正數(shù)據(jù),這是持久有效的做法,這也是美國監(jiān)管部門對該行業(yè)的要求。一樣,隱私提示、網(wǎng)站聲明(此中包含答復(fù)標題問題標具體聯(lián)系編制)可以或許實現(xiàn)更好的透明度,也是措置弊端數(shù)據(jù)的編制。
大年夜數(shù)據(jù)之謎
最富爭議的企業(yè)隱私不雅念是獲得同意或承諾匯集和利用小我數(shù)據(jù)。假定光陰可以倒流,一切從頭開端,這將是個抱負的根基法則。但是,尋求小我的同意來匯集小我數(shù)據(jù)已為時已晚,因為已有大年夜量小我數(shù)據(jù)被匯集和遍及共享。不爭的事實是,我們不成能肯定所有可能匯集了小我數(shù)據(jù)的企業(yè)。
有種編制可以幫忙小我從頭獲得對其小我數(shù)據(jù)的“節(jié)制”,即承諾他們完全刪除和斷根本身的數(shù)據(jù)。當然,大年夜數(shù)據(jù)用戶其實不樂于供給該功能,并且,這是對消費者是不是能意想到和相信利用其數(shù)據(jù)可以或許帶來優(yōu)勢的“嚴重考驗”。監(jiān)管部門在考慮呵護消費者隱私權(quán)力的時辰,必定會要求供給刪除數(shù)據(jù)的能力。跟著大年夜數(shù)據(jù)利用的不竭成長,在企業(yè)大年夜數(shù)據(jù)擺設(shè)的手藝設(shè)計和架構(gòu)階段,企業(yè)應(yīng)當考慮供給承諾小我刪除特定命據(jù)字段的功能。
一樣的,從呵護小我隱私權(quán)力的角度來看,利用小我數(shù)據(jù)的更好的編制就是對所有小我數(shù)據(jù)“匿名化”措置。但是,匿名化的概念(即刪除任何可辨認的字段或?qū)傩?并沒有被證實是可行的。早在2000年, Latanya Sweeney博士(現(xiàn)為哈佛大年夜學傳授)就表白只需要三個信息便可以肯定87%的美國人:ZIP代碼、出世日期和性別,而這些信息都可以在公共記實中找到??紤]到這些研究成果,即便擺設(shè)了匿名化系統(tǒng),我們?nèi)匀豢梢曰蛟S從頭肯定任何棲身在美國的小我消費者的身份。
考慮到所有這些標題問題和計謀,在蓬勃成長的大年夜數(shù)據(jù)范疇,呵護小我隱私權(quán)力的解決編制是,確??康米〉臏蚀_的小我數(shù)據(jù),并對其進行恰當?shù)慕庾g。同時,企業(yè)應(yīng)當將上述隱私原則納進其大年夜數(shù)據(jù)開辟和利用中,只有如許,企業(yè)才可以或許獲得最好的成果,或說,起碼的消費者矛盾情感。