Hadoop基础模块—Linux基础培训
Linux
Linux简介
通过本模块理论结合实践的学习,让学员对能够:
(1)掌握Linux的基础知识,
(2)熟练掌握Linux常用Shell命令、文本编辑工具,
(3)熟练掌握Linux的安装、部署、用户和权限等知识,
(4)熟练掌握基本的性能调试、网络相关的命令。
Linux
基础知识
Linux 安装部署
Hadoop常规模块
Hadoop运维——Hadoop
Hadoop简介
通过本模块理论结合实践的学习,让学员对能够:
(1)掌握Hadoop基本原理、架构和核心组件
(2)熟练掌握Hadoop的分布式安装、部署过程和基本的运维方法
Hadoop安装部署
Hadoop运维
Hadoop核心组件——HDFS
HDFS简介、HDFS分布式文件系统原理和体系结构
通过本模块理论结合实践的学习,让学员对能够:
(1)深刻理解HDFS的工作原理和常用命令
HDFS的I/0基本操作 、HDFS常用Java API详解
HDFS中的输入输出与读写数据流、WebHDFS详解
HDFS中的常用的重要的文件存储结构
HDFS I/0操作和读写工作原理 、HDFS数据压缩机制与程序实现
HDFS集群资源管理技术精讲
Hadoop核心组件——MapReduce
MapReduce基础知识
通过本模块理论结合实践的学习,让学员对能够:
(1)深刻理解MapReduce计算模型的原理和架构
(2)掌握MapReduce编程开发和技巧
MapReduce原理
MapReduce编程
YARN平台
离线分析
Hive基础知识
通过本模块理论结合实践的学习,让学员对能够:
(1)掌握数据仓库和分析工具Hive的基本架构和使用方法,能够熟练的搭建数据仓库并进行离线数据分析需求开发
(2)掌握从RDBMS到Hadoop的导入工具Sqoop的使用
(3)掌握如何使用Azkaban构建自己的工作流
Hive使用
Sqoop/Azkaban详解
实时计算
HBase详解
通过本模块理论结合实践的学习,让学员对能够:
(1)理解海量数据实时处理的基本概念和开源产品、框架
(2)掌握列式数据库HBase的概念、架构、安装部署和基本的API访问编程
(3)掌握使用HBase进行表结构设计的方法和技巧
(4)掌握实时流框架Storm的概念、架构、安装部署和编程
(5)掌握实时计算系统的基本设计理念和设计方法
(6)掌握日志收集系统Flume等的架构、安装部署
ZooKeeper详解
Storm介绍
Storm安装
Flume介绍与使用
实战项目
案例实战(离线、实时2个不同项目)
通过本模块理论结合实践的学习,让学员对能够:
(1)巩固之前学习Hadoop知识
(2)实战中提高实操技能以达到企业用人标准
(3)检验之前学习中的不足,并根据不足制定复习计划
Hadoop模块
数据可视化方向
大数据可视化技术
通过本模块理论结合实践的学习,让学员对能够:
(1)掌握前端可视化相关技术,如、R语言等技术的简单实用
(2)掌握大数据中数据可视化的基本理念和实现方法
交互式计算Spark
Scala基础编程
Spark简介和安装部署
Spark核心机制
通过本模块理论结合实践的学习,让学员对能够:
(1)掌握Scala编程技术的简单使用
(2)掌握Spark框架的概念、架构、核心机制和使用
数据挖掘方向
Mahout简介
Mahout经典算法讲解
通过本模块理论结合实践的学习,让学员对能够:
(1)通过学习Mahout了解数据挖掘、机器学习的相关算法基于Hadoop的实现
(2)理解算法并行化实现(基于Hadoop)的流程和方法