CDA_Hadoop大数据分析师培训
大数据基础知识
Linux及unbuntu系统基础
Hadoop的单机和伪分布模式的安装配置
第一阶段:大数据前沿知识及Hadoop入门
预期效果:零基础入门,了解大数据的历史背景及发展方向,掌握Hadoop多种安装配置
第二阶段:Hadoop部署进阶
1.Hadoop集群模式搭建
2. Hadoop分布式文件系统HDFS深入剖析
3.使用hdfs提供的api进行hdfs文件操作
熟练掌握Hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析
第三阶段:Java基础及实战
1. java程序的基本框架
2. Java的数据类型与表达式介绍
3. java程序设计的基础
4.java的面向对象编程及方法
5.mysql数据库基础知识
零基础入门,了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,基于web的程序开发流程
第四阶段:Mapreduce理论及实战
1. Mapreduce概念及思想
2.mapreduce构架和流程
3.三个基于mapreduce的初级案例
4.mapreduce高级案例--人大经济论坛日志管理
熟悉Mapreduce的工作原理及应用,熟悉基本的Mapreduce程序设计,掌握根据大数据分析的目标设计和编写基于Mapreduce的项目
第五阶段:Hadoop+Mahout大数据分析
1. mahout学习之简介、安装及配置
2. 六个实战案例深入解析hadoop+mahout的大数据分析之分类、聚类与主题推荐
掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析
第六阶段:Hbase Spark理论及实战
1. hbase简介、安装及配置
2. hbase实战
掌握hbase的数据存储及项目实战,Spark、Hive的安装、配置及使用场景
第七阶段:Hadoop+Spark大数据分析
实战案例深入解析Hadoop+Spark的大数据分析之分类、Logistic回归与主题推荐
掌握基于hadoop+Spark的大数据分析方法的使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析