一、基于Hadoop的数据分析
HDFS和MapReduce介绍
Hive介绍
Hive实战
Sql on Hadoop 介绍
基于Hadoop数据分析步骤
基于Hive的数据建模
数据源的采集
数据治理介绍
二、分析结果展示
大数据展示工具介绍
Echarts使用介绍
Tableau工具介绍
Zepplin工具介绍
三、基于Spark 数据挖掘介绍
Spark框架介绍
Spark ML和Spark Mllib介绍
Spark GraphX介绍
SparkR介绍
四、聚类分析
聚类分析的模型介绍
数据源来源
创建与配置聚类模型
基于Spark Mllib Kmeans实现
参数的调优
基于SparkMllib用户分析案例实现
五、回归分析
回归分析模型介绍
数据来源
基于SparkMllib LR实现
LR模型的参数调优
基于SparkMllib用户打标签案例实现
六、推荐实现
基于mllib的推荐系统实战
基于Spark Mllib实现电影推荐案例
推荐模型的优化
七、Spark Graphx数据挖掘
Spark Graphx介绍
复杂社交网落分析实战
图分析实战—银行担保圈案例实战
八、SparkR介绍
SparkR介绍和原理
基于SparkR实现Kmeans案例
基于SparkR实现LR案例
九、Spark Graphx数据挖掘
Spark + R实战
Spark Graphx介绍
复杂社交网落分析实战
图分析实战