網站首頁 生活 健康 母嬰 情感 職場 休閒
當前位置:生活百科谷 > 科技 > 科技生活

大數據處理流程包括哪些

欄目: 科技生活 / 發佈於: / 人氣:8.94K

品牌型號:華爲MateBook D15
系統:Windows 10

大數據處理流程包括哪些

大數據處理流程包括:數據採集、數據預處理、數據入庫、數據分析、數據展現。

1、數據採集概念:目前行業會有兩種解釋:一是數據從無到有的過程(web服務器打印的日誌、自定義採集的日誌等)叫做數據採集;另一方面也有把通過使用Flume等工具把數據採集到指定位置的這個過程叫做數據採集。

2、數據預處理:通過mapreduce程序對採集到的原始日誌數據進行預處理,比如清洗,格式整理,濾除髒數據等,並且梳理成點擊流模型數據。

3、數據入庫:將預處理之後的數據導入到HIVE倉庫中相應的庫和表中。

4、數據分析:項目的核心內容,即根據需求開發ETL分析語句,得出各種統計結果。

5、數據展現:將分析所得數據進行數據可視化,一般通過圖表進行展示。