如何進入大數據領域,學習路線是什么?
主要學習一些Java學習語言概念,如字符、過程控制、面向對象、過程線程、枚舉反射等MySQL學習數據庫的安裝、卸載及相關操作JDBC實現原理及Linux大數據剛剛開始基礎知識。scala**教程。
主要講解CAP理論、數據分布模式、一致性PC和3PC、大數據集成架構。涉及的知識點包括Consistency一致性、Availability可用性、Partitiontolerance分區容忍度,數據量分布,2PC流程、3PC流程、哈希方式、一致性哈希等。scala視頻教程。
協調服務主要講解ZK(1T)、數據存儲hdfs(2T)、數據存儲alluxio(1T)、數據采集flume、數據采集logstash、數據同步Sqoop(0.5T)、數據同步datax(0.5T)、數據同步mysql-binlog(1T)、計算模型MR與DAG(1T)、hive(5T)、Impala(1T)、任務調度Azkaban、任務調度airflow等。sparkjavascala。
主要講解數字倉庫的歷史背景和離線數字倉庫項目-與我的的汽車(5T)架構技術分析、多維數據模型處理kylin(3.5T)部署安裝、離線數字倉庫項目-升級后加入我們的汽車kylin多維分析等;
主要講解計算引擎,scala語言、spark、數據存儲hbase、redis、ku,通過平臺項目實現spark讀寫多數據源。scala和java。
主要講解數據通道Kafka、實時數倉druid、流式數據處理flink、SparkStreaming,通過解釋交通大數,你可以整合知識點。scala spark。
主要講解elasticsearch,包括全文搜索技術,ES安裝操作、index、創建索引、增刪改查、索引、映射、過濾等。
主要講解數據標準、數據分類、數據建模、圖紙存儲和查詢、元數據、血緣和數據質量HiveHook、SparkListener等。scala編程第3版。
主要講解Superset、Graphna這兩種技術包括基本介紹、安裝、數據源創建、表操作和數據探索分析。scala課程大綱。
主要講解機器學習中的數學系統SparkMlib機器學習算法庫,Pythonscikit-learn機器學習算法庫,機器學習結合大數據項目。