掃二維碼與項目經理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯網交流
說到ETL,很多開發(fā)伙伴可能會有些陌生,我也是在近幾年的工作過程中才接觸到ETL的,現在的項目是比較依賴于ETL,可以說是項目中重要的一部分。

創(chuàng)新互聯是專業(yè)的宜豐網站建設公司,宜豐接單;提供網站制作、成都網站制作,網頁設計,網站設計,建網站,PHP網站建設等專業(yè)做網站服務;采用PHP框架,可快速的進行宜豐網站開發(fā)網頁制作和功能擴展;專業(yè)做搜索引擎喜愛的網站,專業(yè)的做網站團隊,希望更多企業(yè)前來合作!
先看一看ETL是做什么用的:ETL是將各個業(yè)務系統的數據,通過抽取、清洗、轉換之后,加載到數據倉庫的過程;ETL可以將分散、零亂、標準不統一的數據整合到一起。完整的ETL功能有很多(ETL是三個三次的縮寫...),我只從我實際使用的場景出發(fā),說明我對ETL的理解和實際應用。
我接觸過的項目,使用ETL工具的場景有這個幾種:
在公司建設的初期,業(yè)務比較少,系統也比較少,一臺數據庫就搞定了;
隨著公司業(yè)務的增加,業(yè)務系統被拆成很多系統;
隨著數據量的繼續(xù)增加,單個系統的數據增加到一定程度的時候,也做了分庫分表;
這時候領導、業(yè)務人員在用數據做分析的時候,數據來源可能是多個系統的多張表,這時候企圖通過一個復雜的SQL跑出來結果就很困難了;通常公司會建立一個數據倉庫,通過ETL工具把數據抽取到數據倉庫中,再做數據的擬合和展示。
目前來說是不行的,ETL任然是大數據時代下數據遷移不可缺少的
首先說一下什么是ETL,ETL是英文Extract-Transform-Load的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象并不限于數據倉庫。也就是說幾乎所有的數據的移動都需要ETL的參與!
目前用到的ETL工具常見的有Datastage,informatica,kettle三種,前兩者是收費的,并且占據了大多數國內市場,而kettle是來源免費的!但是在大數據量下Informatica 與Datastage的處理速度是比較快的,比較穩(wěn)定。Kettle的處理速度相比之下稍慢。所以很多公司尤其是金融機構選Informatica 與Datastage。但是kettle由于是開源的所以有很強的擴展性。
數據要想有價值,就必須把它進行分析,挖掘出來它潛藏的價值,人們日?;顒赢a生的數據一般是放在業(yè)務系統中,而在業(yè)務系統中的數據是不能直接進行分析處理的,這個時候我就得把這些數據搬運到一個倉庫里,再進行分析!也就是所說的數據倉庫,在而這個數據的搬運工就是ETL,在搬運的過程中我們還要做一些初步的清洗,去掉一些無用的不全的數據,這也是ETL的功能!最后我們那這些處理過的數據進行商業(yè)分析!這就是一個ETL的過程。
在數據就是價值的今天我們更加離不開ETL,當然這個過程也在不斷的改進,運用也越來越智能越來越方便
ETL是將業(yè)務系統的數據經過抽取、清洗轉換之后加載到數據倉庫的過程,目的是將企業(yè)中的分散、零亂、標準不統一的數據整合到一起,為企業(yè)的決策提供分析依據, ETL是BI(商業(yè)智能)項目重要的一個環(huán)節(jié)。通常情況下,在BI項目中ETL會花掉整個項目至少1/3的時間,ETL設計的好壞直接關接到BI項目的成敗。
ETL的設計分三部分:
目前常用的ETL工具有:
Datastage和Informatica是收費的,并且占據了大多數國內市場,而Kettle是來源免費的。但是在大數據量下Informatica 與Datastage的處理速度是比較快的,比較穩(wěn)定。Kettle的處理速度相比之下稍慢。所以很多公司尤其是金融機構選Informatica與Datastage。但是kettle由于是開源的所以有很強的擴展性。所以在這個巨大的市場條件下,基本是不會被淘汰的,除非出現更加劃時代的產物。
不可以。
哈哈,是不是離你的預期答案差很多?
先說說為什么會有不想再使用ETL的想法?
因為盡管在ETL上花費了大量時間和金錢,公司仍然會遇到很大的問題:比如數據不準確、查詢不夠徹底等。
那這些問題現在有辦法解決嗎?
暫時是沒有的,ETL還是得用,在具有成熟業(yè)務的公司里不可或缺,但這并不代表這是一個好崗位。
etl工程師主要進行數據采集、轉換等方面的數據預處理,也稱數據清洗。這個工作打個不恰當的比喻,是洗菜工而不是廚師,所以和工作年限和年齡無關,和自己的發(fā)展規(guī)劃相關。
所以做了幾年之后,發(fā)展的空間不夠大,但是養(yǎng)活自己是沒有問題的。
到此,以上就是小編對于mongodb 重啟的問題就介紹到這了,希望這1點解答對大家有用。

我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯網交流