掃二維碼與項目經(jīng)理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流
?作者 | Dan Neault

創(chuàng)新互聯(lián)自2013年創(chuàng)立以來,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目成都網(wǎng)站建設(shè)、做網(wǎng)站網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元銅陵做網(wǎng)站,已為上家服務(wù),為銅陵各地企業(yè)和個人服務(wù),聯(lián)系電話:028-86922220
譯者 | 陳峻
如今,大家都普遍認(rèn)為數(shù)據(jù)是商業(yè)環(huán)境中最有價值的資源。企業(yè)的成功往往與他們從數(shù)據(jù)中獲利的能力有著直接關(guān)系。而作為傳統(tǒng)關(guān)系型數(shù)據(jù)庫的演進(jìn),數(shù)據(jù)湖(Data Lake)能夠從多個來源獲取原始形式的數(shù)據(jù)。這就是為什么許多組織已經(jīng)開始轉(zhuǎn)向通過數(shù)據(jù)湖,來改進(jìn)分析,實現(xiàn)更有效的協(xié)作,并支持大規(guī)模的數(shù)據(jù)驅(qū)動型決策的原因。
雖然數(shù)據(jù)湖能夠給組織帶來卓越的業(yè)務(wù)成果,但它們的快速采用,也可能會給一些缺乏資源和專業(yè)領(lǐng)域知識團(tuán)隊,帶來合規(guī)性和安全控制上的門檻。更復(fù)雜的是,數(shù)據(jù)湖的廣泛使用,會讓更多內(nèi)、外部角色接觸到數(shù)據(jù),進(jìn)而放大了業(yè)務(wù)安全的潛在風(fēng)險。
在上個世紀(jì)60年代,隨著計算機(jī)變得更易于訪問,各個組織需要有效地存儲和管理手中的數(shù)據(jù),這便催生了數(shù)據(jù)庫技術(shù)的產(chǎn)生。
在之后的幾十年中,在線事務(wù)處理(online transactional processing,OLTP)型的工作負(fù)載和關(guān)系型數(shù)據(jù)庫,充當(dāng)了快速、準(zhǔn)確地處理數(shù)據(jù)的主力軍。
到了20世紀(jì)80年代,數(shù)據(jù)倉庫(data warehouses)將數(shù)據(jù)處理從事務(wù)或操作系統(tǒng),轉(zhuǎn)變?yōu)榱藳Q策支持系統(tǒng)。這種轉(zhuǎn)變使得許多組織能夠聚合來自多個環(huán)境的數(shù)據(jù),并通過匯集商業(yè)智能(business intelligence,BI),來支持戰(zhàn)略決策的制定。
如今,大量的組織都會利用數(shù)據(jù)庫、數(shù)據(jù)倉庫和BI ,用以提供創(chuàng)新信息,并指導(dǎo)戰(zhàn)略決策。然而,隨著云計算和現(xiàn)代化編程語言的興起,數(shù)據(jù)庫的使用方式也隨著如下因素,發(fā)生了巨大的變化:
數(shù)據(jù)倉庫在處理和分析結(jié)構(gòu)化的數(shù)據(jù)方面固然表現(xiàn)出色,但它們無法捕獲原始的、非結(jié)構(gòu)化的數(shù)據(jù),這在某種程度上對組織的數(shù)字化業(yè)務(wù)產(chǎn)生了限制。因此,數(shù)據(jù)湖等非關(guān)系數(shù)據(jù)庫變得越來越受歡迎,一些數(shù)據(jù)架構(gòu)師正在嘗試著默認(rèn)使用數(shù)據(jù)湖,來處理新的工作負(fù)載,并對現(xiàn)有的工作負(fù)載進(jìn)行現(xiàn)代化的改造。
正是由于數(shù)據(jù)架構(gòu)師們通過使用數(shù)據(jù)湖,來構(gòu)建ML模型,為無數(shù)分析系統(tǒng)提供數(shù)據(jù),進(jìn)而按需執(zhí)行查詢與分析等操作,因此他們從中獲得了數(shù)據(jù)的潛在價值,也促進(jìn)了越來越多的組織,開始在數(shù)據(jù)湖中構(gòu)造它們的數(shù)據(jù)生命周期。
畢竟,在傳統(tǒng)方式上,數(shù)據(jù)倉庫常被用于定期分析大量的結(jié)構(gòu)化數(shù)據(jù),或定期生成數(shù)據(jù)報告。而這往往要求企業(yè)在處理和存儲數(shù)據(jù)之前,就已經(jīng)完成、并將預(yù)定義的模式應(yīng)用到數(shù)據(jù)庫上。這在某種程度上,就限制了數(shù)據(jù)在后續(xù)交易或分析系統(tǒng)中的創(chuàng)新使用方式。
而數(shù)據(jù)湖并不需要這樣的前期工作。它能夠集成和存儲未經(jīng)轉(zhuǎn)換、或僅被少量處理的數(shù)據(jù)。這些數(shù)據(jù)可以來自包括:非結(jié)構(gòu)化的日志數(shù)據(jù)、物聯(lián)網(wǎng)(internet of things,IoT)傳感器、社交媒體、以及多媒體內(nèi)容等多個指向數(shù)據(jù)湖的來源。利用與數(shù)據(jù)湖配套的實現(xiàn)技術(shù),數(shù)據(jù)架構(gòu)師們可以:
顯然,進(jìn)入數(shù)據(jù)湖的數(shù)據(jù)需要得到與過去被存儲在關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),有著相同級別、甚至更高的保護(hù)。那么數(shù)據(jù)湖主要會面臨哪些安全風(fēng)險呢?
可見,為了在不影響安全性的情況下,充分發(fā)揮數(shù)據(jù)湖的優(yōu)勢,組織需要遵循一套優(yōu)秀的實踐,來降低運(yùn)營不合規(guī)、管理不善、數(shù)據(jù)泄漏、以及其他安全事件的發(fā)生風(fēng)險。
有效的安全策略往往能夠給數(shù)據(jù)湖賦予清晰的可見性和控制權(quán)。為此,組織可以采取四個步驟:
綜上所述,為了解決與數(shù)據(jù)湖的相關(guān)安全和合規(guī)風(fēng)險,組織應(yīng)該首先創(chuàng)建一種有效且高效的方法,來分類和發(fā)現(xiàn)其環(huán)境中的數(shù)據(jù)。接著,組織必須能夠識別誰在訪問數(shù)據(jù),何時訪問了敏感數(shù)據(jù),以及防止數(shù)據(jù)被惡意的內(nèi)部人員所竊取。
雖然上面提到的各種安全優(yōu)秀實踐都是創(chuàng)建數(shù)據(jù)湖安全環(huán)境的基礎(chǔ)步驟,但是組織應(yīng)當(dāng)從基礎(chǔ)入手,以數(shù)據(jù)為中心,確保數(shù)據(jù)在數(shù)據(jù)湖乃至組織的內(nèi)外部,無論身處何處、以何種形式存在,都是安全可控的。

我們在微信上24小時期待你的聲音
解答本文疑問/技術(shù)咨詢/運(yùn)營咨詢/技術(shù)建議/互聯(lián)網(wǎng)交流