某某网站欢迎您   设为首页
  加入收藏
  联系站长
           
首页 |  新闻中心 |  客服中心在线培训课程 
站内搜索

今天是:

2026-2-20 星期五
 集成电路中心欢迎您!

左侧上广告

左侧下广告 width=
当前位置 >> 首页 >> 课程列表 >> 大数据培训课程
课程编号  658
课程名称  大数据培训课程
开课时间  即将开课
是否促销  
关注程度 共有4312人关注过此课程
◇◇ 课程详 细 介 绍 ◇◇

  课程目标:

  通过本次Hadoop培训,会对大数据离线计算、实时计算的企业级构架有清晰的理解以及对常用的成熟的大数据开源项目从原理到使用有深入的理解。

  实时计算的项目常用组合为Flume(数据采集) + Kafka(高可用高并发分布式消息队列) + spark streaming(流式计算) + hbase(分布式列式存储数据库,亿级行百万列毫秒级查询)

  离线计算项目常用组合为分布式文件存储HDFS,资源调度器、分布式计算框架MapReduce、数据仓库Hive。

  课程大纲:

  第一天

  上午

  离线计算:

  Hadoop大数据生态圈、分布式存储HDFS、资源管理

  大数据生态圈介绍

  开源相关项目说明以及每个项目的用途

  实时计算整体构架详解

  离线计算整体构架详解

  分布式文件系统HDFS是什么

  HDFS的体系结构

  HDFS高可用集群原理详解

  HDFS如何使用

  资源管理器介绍以及构架

  资源管理器核心组件详解

  资源调度器详解

  下午

  离线计算:

  Hadoop MapReduce&Hive

  分布式计算MapReduce介绍

  MapReduce整体流程

  MapReduce实例

  数据仓库工具Hive介绍

  Hive模型介绍:数据库、表、分区、高级函数

  Hive元数据介绍

  第二天

  上午

  实时计算:

  数据采集Flume、分布式消息队列Kafka

  实时计算整体构架设计

  Flume是什么以及体系结构介绍

  Flume组件介绍:agent、source、channel、sink

  Flume高可用拓扑介绍

  Kafka体系结构详解

  Kafka核心概念

  Kafka高可用高并发原理

  Kafka生产者消费者

  Flume写入kafka

  下午

  实时计算:

  spark streaming流式计算、HBase分布式列存储

  spark是什么以及体系结构

  弹性分布式数据集RDD

  spark streaming流式计算体系结构

  spark steaming读取kafka

  spark算子详解

  HBase存储数据库体系结构

  Hbase的高可用

  HBase数据模型详解

  HBase毫秒级查询



首页公司简介常见问题  
 
 
版权所有 集成电路中心  备案:沪ICP备08026168号
办公电话:4008699035 传真:021-32300767 手机:15921673576 邮箱:officeoffice@126.com 客服QQ:点击这里给我发消息
公司地址:上海市云屏路1399号26#新城金郡商务楼310室 邮编:201821
SHUHAI IC TRAINING