1、大数据前沿知识及hadoop入门
2、hadoop部署进阶
3、大数据导入与存储
4、Hbase理论与实战
5、Spaer配置及使用场景
6、spark大数据分析原理
7、hadoop+spark大数据分析
步骤阅读方法/步骤
- 共1图
1
第一阶段:大数据前沿知识及hadoop入门,大数据前言知识的介绍,课程的介绍,Linux和unbuntu系统基础,hadoop的单机和伪分布模式的安装配置。
- 2
第二阶段:hadoop部署进阶。Hadoop集群模式搭建,hadoop分布式文件系统HDFS深入剖析。使用HDFS提供的api进行HDFS文件操作。Mapreduce概念及思想。
- 3
第三阶段:大数据导入与存储。mysql数据库基础知识,hive的基本语法。hive的架构及设计原理。hive部署安装与案例。sqoop安装及使用。sqoop组件导入到hive。
- 4
第四阶段:Hbase理论与实战。Hbase简介。安装与配置。hbase的数据存储。项目实战。
- 5
第五阶段:Spaer配置及使用场景。scala基本语法。spark介绍及发展历史,spark stant a lone模式部署。sparkRDD详解。
- 6
第六阶段:spark大数据分析原理。spark内核,基本定义,spark任务调度。sparkstreaming实时流计算。sparkmllib机器学习。sparksql查询。
- 7
第七阶段:hadoop+spark大数据分析。实战案例深入解析。hadoop+spark的大数据分析之分类。logistic回归与主题推荐。
声明:本网页内容为来源互联网,旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理,E-MAIL:320919107#qq.com。#改@
如何快速的学会大数据分析 实战案例深入解析:http://www.3jise.com/article/84871.html