數(shù)據(jù)分析師培訓(xùn)
課程介紹
了解Apache Pig、Apache Hive及Apache Impala如何通過刪選、連接進行數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)分析,以及利用其它常見技術(shù)自定義用戶功能。
Apache Hadoop基礎(chǔ)及數(shù)據(jù)ETL(包括數(shù)據(jù)提取、轉(zhuǎn)換及加載)、如何通過使用Hadoop相關(guān)工具將數(shù)據(jù)載入Hadoop并進行分析處理:
? 如何使用Apache Pig對多個關(guān)聯(lián)的數(shù)據(jù)集進行join操作以及如何分析不同的獨立數(shù)據(jù);
? 如何使用Apache Hive:通過定義合適的表來組織數(shù)據(jù)、執(zhí)行各種數(shù)據(jù)變換、簡化復(fù)雜查詢;
? 如何使用Impala來對存儲在HDFS里的大規(guī)模數(shù)據(jù)進行實時和交互式的分析查詢;
? 如何根據(jù)數(shù)據(jù)分析任務(wù)來選擇合適的數(shù)據(jù)分析工具。
課程目標
? 了解Apache Pig、Apache Hive及Apache Impala如何通過刪選、連接進行數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)分析,以及利用其它常見技術(shù)自定義用戶功能。
適合人群
? 需要使用Hadoop來進行數(shù)據(jù)分析的數(shù)據(jù)分析員,商業(yè)分析員,開發(fā)員以及系統(tǒng)管理員。
? 面向意欲使用SQL、腳本和基本Linux 操作 Hadoop數(shù)據(jù)的分析師、BI專家、架構(gòu) 師和管理員。培訓(xùn)對象不要求具有Hadoop 相關(guān)知識。
數(shù)據(jù)分析
Cloudera Hadoop數(shù)據(jù)分析師培訓(xùn)