|
Hadoop开发实践与性能调优课程
|
|
班级规模及环境--热线:4008699035 手机:15921673576/13918613812( 微信同号) |
为了保证培训效果,增加互动环节,我们坚持小班授部份,每期报名人数限3到5人,多余人员安排到下一期进行。 |
上间和地点 |
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦 近开间(周末班/连续班/晚班):2024年12月30日......(欢迎您垂询,视教育质量为生命!) |
实验设备 |
◆:共5天,30学时 ☆注重质量☆边讲边练 ☆合格学员免费推荐工作 ★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听; 2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。 3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,曙海学员的能力得到大家的认同,受到用人单位的广泛赞誉,曙海的证书受到广泛认可。 |
部份程大纲 |
|
- 培训特色
系统的讲解Hadoop及主要周边生态的基本原理,安装,部署,维护及开发。偏重于部署维护方向,中间会对Linux,网络,服务器硬件Raid等进行系统的学习和了解。力求让学员全方位掌握Hadoop及相关的其他知识。了解Hadoop各生态的特点和应用场景。
- 目标收益
可独立完成Hadoop的部署,运维,监控及故障处理。独立完成整体Hadoop从网络到软件层面的架构设计,Hadoop及周边生态的性能优化。
- 培训对象
- 开始对Hadoop感兴趣或已使用Hadoop,希望进行性能调优或架构优化。
- 学员基础
- 需具备基本Linux操作系统安装及常规命令行操作知识。
- 课程大纲
- 主题 内容
Hadoop在云计算技术的作用和地位
- 传统大规模数据分析存在的问题
Hadoop概述
Hadoop与分布式文件系统
MapReduce的工作原理与机制
Hadoop集群剖析
Hadoop生态系统
Hadoop的行业应用案例分析
Hadoop在云计算和大数据的位置和关系
案例演示:阿里集团技术平台,Hadoop在淘宝、支付宝的作用
电商眼中的Hadoop和推荐系统。
暴风数据平台:Hadoop对于产品优化的价值。
Hadoop对于趣游、热酷等游戏公司的作用
移动大云项目(big cloud)中的Hadoop
联通使用Hadoop/Hbase解决3G详单查询问题。
- Hadoop参数调优
- 选择适合hadoop的硬件配置
Hadoop配置项优化
Hadoop配置优化 - core-site.xml
Hadoop配置优化 - HDFS
Hadoop配置优化 - hdfs-site.xml
Hadoop配置优化 - mapred-site.xml
Hadoop配置优化 - 机架感知
网络带宽参数调优
系统参数调优
配置文件管理
严格控制root权限
Java的GC模式
选择正确的JDK
hadoop作业调优
Map side tuning设置
Map side设置
Linux操作系统优化
其他配置和参数调优
core-default.xml,
hdfs-default.xml,
mapred-default.xml。
mapred-site.xml
mapred.tasktracker.map.tasks.maximum
mapred.reduce.slowstart.completed.maps
mapred.fairscheduler.preemption
mapred.jobtracker.completeuserjobs.maximum
mapred.jobtracker.update.faulty.tracker.interval
mapred.jobtracker.max.blacklist.percent
案例演示:Hadoop硬件优化
不是所有的硬件都合适拿来直接使用
安装调优的第一步服务器硬件的选型的窍门
如何选择适合业务使用的CPU
内存越大越好吗?设置合理的的内存配置
连接网络的选择和优化
高速硬盘的选择注意事项
硬盘为什么不做raid?
设置网络的注意事项
中间结果压缩对磁盘和网络的优化
机架感知,网络和磁盘IO优化作用,确定存储的具体位置,
内存参数,map/reduce槽位数的计算方法。
对磁盘和网络的优化
Java工具使用,jstack使用
Sun和open之间的区别,JIT编译器的使用
inux系统参数调优
Linux监控系统的使用
cacti,
ganglia
常用的linux排错工具lsof,strace,iostat,vmstat,netstat...
常见异常现象级处理方法
网卡流量导致连接失败
权限错误
主机名IP转换错误
NN与DN namespaceID不一致
磁盘满导致报错
Jave heap size OOM
- 精彩案例及故障解决方法解析
- 案例一:namenode被重新格式化,datanode无法连接
现象:namenode 中的namespaceID与datanode中的namespaceID不一致
案例二:硬盘损坏
现象:磁盘损坏导致datanode宕机
案例三:错误用户启动hadoop
现象:datanode启动一段时间后宕机
案例四:tasktracker重启后假死
现象:无报错,但tasktracker不工作。
案例五:jobtracker无故宕机
现象:运行过程中jobtracker宕机
案例六:datanode无法注册到namenode
现象:datanode启动后到MBean这步挂起不再继续。
案例七:tasktracker无法启动,报权限错误
现象:tasktracker报文件夹创建的权限错误后直接退出。
案例八:主机名设置错误
现象:datanode 和tasktracker无法正常工作
- Hadoop组件详解
- Hadoop HDFS 基本结构
Hadoop HDFS 副本存放策略
Hadoop NameNode 详解
Hadoop SecondaryNameNode 详解
Hadoop DataNode 详解
Hadoop JobTracker 详解
Hadoop TaskTracker 详解
案例演示:Hadoop Mapper类核心代码
Hadoop Reduce类核心代码
Hadoop 核心代码
- Hadoop安装和部署
- Hadoop系统模块组件概述
Hadoop试验集群的部署结构
Hadoop 安装依赖关系
Hadoop 生产环境的部署结构
Hadoop集群部署
Hadoop 高可用配置方法
Hadoop 集群简单测试方法
Hadoop 集群异常Debug方法
案例演示:Hadoop安装部署实验
Red hat Linux基础环境搭建
Hadoop 单机系统版本安装配置
Hadoop 集群系统版本安装和启动配置
使用 Hadoop MapReduce Streaming 快速测试系统
Hadoopcore-site,hdfs-site,mapred-site 配置详解
- Hadoop和传统数据库技术优劣势对比
- Hadoop/Hive 对比 Oracle 在构建数据仓库上的优劣势
Hadoop 如何和传统IT系统配合完成原来不可能的任务
案例演示:Apache社区版本:Cloudera 版本、MapR版本、Intel版本、Oracle、Dell、HP版本
- 编写MapReduce高级程序
- 使用 Hadoop MapReduce Streaming 编程
MapReduce流程
剖析一个MapReduce程序
基本MapReduceAPI 概念
驱动代码 Mapper、Reducer
Hadoop流
API 使用Eclipse进行快速开发
新MapReduce API
MapReduce的优化
MapReduce的任务调度
MapReduce编程实战
如何利用其他Hadoop相关技术,包括Apache Hive, Apache Pig,Sqoop和Oozie等
满足解决实际数据分析问题的高级Hadoop API
案例演示:Hadoop Streaming 和 Java MapReduce Api 差异。
MapReduce 实现数据库功能
利用Combiners来减少中间数据
编写Partitioner来优化负载平衡
直接访问Hadoop分布式文件系统(HDFS)
Hadoop的join操作
辅助排序在Reducer方的合并
定制Writables和WritableComparables
使用SequenceFiles和Avro文件保存二进制数据
创建InputFormats OutputFormats
Hadoop的二次排序
Hadoop的海量日志分析
在Map方的合并
- 精彩案例及故障解决方法解析
- 案例一:控制map & reduce个数
现象:map个数取决于split个数,如果源文件使用压缩存储,则不可分割,一个文件一个map。非压缩文件使用默认block.size进行切分。对reduce因为是中间数据,可以控制reduce数量。
案例二:压缩中间数据
现象:job中间临时数据量级大、网络IO吞吐量大。
案例三:编程细节,内存溢出
现象:编程过程中,经常遇到list、map、倒排表等大对象,如果作为局部变量,每次调用map或者reduce方法都初始化这些变量,很容易消耗掉JVM堆内存,出现内存溢出异常。
案例四:编程细节,计数&日志打印
现象: System.out.println, System.err.println等日志打印过多会严重影响job性能,counter计数也会存在同样的问题,同时也会造成本地磁盘使用量的急剧增长。
案例五: 作业调度
现象:集群上的job非常多时,会出现一些job一直等待,很长一段时间内没有开始运行。默认的任务调度器FIFO并不能满足实际工作应用。
案例六:Combiner优化
现象: map输出数据量非常大,reduce input group远小于reduce input group时,存在大量的网络IO,这些IO中的一部分数据可以在本地做完合并,然后再进行reduce操作。
- 使用Hive和Pig开发及技巧
- Hive和Pig基础
Hive的作用和原理说明
Hadoop仓库和传统数据仓库的协作关系
Hadoop/Hive仓库数据数据流
Hive 部署和安装
Hive Cli 的基本用法
HQL基本语法
使用Oozie的动机
Oozie工作流定义格式
案例演示:使用JDBC 连接Hive进行查询和分析
使用正则表达式加载数据
HQL高级语法
编写UDF函数
编写UDAF自定义函数
使用Sqoop进行数据分析
使用oozie配置工作流
phpHiveAdmin 安装和使用
|
|
|
|
|
|
* |
|
本部份程部分实验室实景 |
|
|
|
|
|
|
合作伙伴与授权机构 |
Altera全球合作培训机构 |
诺基亚Symbian公司授权培训中心 |
Atmel公司全球战略合作伙伴 |
微软全球嵌入式培训合作伙伴 |
英国ARM公司授权培训中心 |
ARM工具关键合作单位 |
|
|
|
我们培训过的企业客户评价: |
曙海的andriod系统与应用培训完全符合了我公司的要求,达到了我公司培训的目的。特别值得一提的是授部份讲师针对我们公司的开发的项目专门提供了一些很好程序的源代码,基本满足了我们的项目要求。 ——上海贝尔,李工 曙海培训DSP2000的老师,上部份思路清晰,口齿清楚,由浅入深,重点突出,培训效果是不错的, 达到了我们想要的效果,希望继续合作下去。 ——中国电子科技集团技术部主任马工 曙海的FPGA培训很好地填补了高校FPGA培训空白,不错。总之,有利于学生的发展,有利于教师的发展,有利于部份程的发展,有利于社会的发展。 ——上海电子,冯老师 曙海给我们公司提供的Dsp6000培训,符合我们项目的开发要求,解决了很多困惑我们很久的问题,与曙海的合作非常愉快。 ——公安部第三研究所,项目部负责人李先生 MTK培训-我在网上找了很久,就是找不到。在曙海居然有MTK驱动的培训,老师经验很丰富,知识面很广。下一个还想培训IPHONE苹果手机。跟他们合作很愉快,老师很有人情味,态度很和蔼。 ——台湾双扬科技,研发处经理,杨先生 曙海对我们公司的iPhone培训,实验项目很多,确实学到了东西。受益无穷啊!特别是对于那种正在开发项目的,确实是物超所值。 ——台湾欧泽科技,张工 通过参加Symbian培训,再做Symbian相关的项目感觉更加得心应手了,理论加实践的授部份方式,很有针对性,非常的适合我们。学完之后,很轻松的就完成了我们的项目。 ——IBM公司,沈经理 有曙海这样的DSP开发培训单位,是教育行业的财富,听了他们的部份,茅塞顿开。 ——上海医疗器械高等学校,罗老师
|
我们新培训过的企业客户以及培训的主要内容: |
|
一汽海马汽车DSP培训 苏州金属研究院DSP培训 南京南瑞集团技术FPGA培训 西安爱生技术集团FPGA培训,DSP培训 成都熊谷加世电气DSP培训 福斯赛诺分析仪器(苏州)FPGA培训 南京国电工程FPGA培训 北京环境特性研究所达芬奇培训 中国科微系统与信息技术研究所FPGA高级培训 重庆网视只能流技术开发达芬奇培训 无锡力芯微电子股份IC电磁兼容 河北科研究所FPGA培训 上海微小卫星工程中心DSP培训 广州航天航空POWERPC培训 桂林航天工DSP培训 江苏五维电子科技达芬奇培训 无锡步进电机自动控制技术DSP培训 江门市安利电源工程DSP培训 长江力伟股份CADENCE培训 爱普生科技(无锡)数字模拟电路 河南平高电气DSP培训 中国航天员科研训练中心A/D仿真 常州易控汽车电子WINDOWS驱动培训 南通大学DSP培训 上海集成电路研发中心达芬奇培训 北京瑞志合众科技WINDOWS驱动培训 江苏金智科技股份FPGA高级培训 中国重工第710研究所FPGA高级培训 芜湖伯特利汽车安全系统DSP培训 厦门中智能软件技术Android培训 上海科慢车辆部件系统EMC培训 中国电子科技集团第五十研究所,软件无线电培训 苏州浩克系统科技FPGA培训 上海申达自动防范系统FPGA培训 四川长虹佳华信息MTK培训 公安部第三研究所--FPGA初中高技术开发培训以及DSP达芬奇芯片视频、图像处理技术培训 上海电子信息职业技术--FPGA高级开发技术培训 上海点逸网络科技有限公司--3G手机ANDROID应用和系统开发技术培训 格科微电子有限公司--MTK应用(MMI)和驱动开发技术培训 南昌航空大学--fpga高级开发技术培训 IBM公司--3G手机ANDROID系统和应用技术开发培训 上海贝尔--3G手机ANDROID系统和应用技术开发培训 中国双飞--Vxworks应用和BSP开发技术培训
|
上海水务建设工程有限公司--Alter/XilinxFPGA应用开发技术培训 恩法半导体科技--AllegroCandencePCB仿真和信号完整性技术培训 中国计量--3G手机ANDROID应用和系统开发技术培训 冠捷科技--FPGA芯片设计技术培训 芬尼克兹节能设备--FPGA高级技术开发培训 川奇光电--3G手机ANDROID系统和应用技术开发培训 东华大学--Dsp6000系统开发技术培训 上海理工大学--FPGA高级开发技术培训 同济大学--Dsp6000图像/视频处理技术培训 上海医疗器械高等专科学校--Dsp6000图像/视频处理技术培训 中航工业无线电电子研究所--Vxworks应用和BSP开发技术培训 北京交通大学--Powerpc开发技术培训 浙江理工大学--Dsp6000图像/视频处理技术培训 台湾双阳科技股份有限公司--MTK应用(MMI)和驱动开发技术培训 滚石移动--MTK应用(MMI)和驱动开发技术培训 冠捷半导体--Linux系统开发技术培训 奥波--CortexM3+uC/OS开发技术培训 迅时通信--WinCE应用与驱动开发技术培训 海鹰医疗电子系统--DSP6000图像处理技术培训 博耀科技--Linux系统开发技术培训 华路时代信息技术--VxWorksBSP开发技术培训 台湾欧泽科技--iPhone开发技术培训 宝康电子--AllegroCandencePCB仿真和信号完整性技术培训 上海天能电子有限公司--AllegroCandencePCB仿真和信号完整性技术培训 上海亨通光电科技有限公司--andriod应用和系统移植技术培训 上海智搜文化传播有限公司--Symbian开发培训 先先信息科技有限公司--brew手机开发技术培训 鼎捷集团--MTK应用(MMI)和驱动开发技术培训 傲然科技--MTK应用(MMI)和驱动开发技术培训 中软国际--Linux系统开发技术培训 龙旗控股集团--MTK应用(MMI)和驱动开发技术培训 研祥智能股份有限公司--MTK应用(MMI)和驱动开发技术培训 罗氏诊断--Linux应用开发技术培训 西东控制集团--DSP2000应用技术及DSP2000在光伏并网发电中的应用与开发 科大讯飞--MTK应用(MMI)和驱动开发技术培训 东北农业大学--IPHONE苹果应用开发技术培训 中国电子科技集团--Dsp2000系统和应用开发技术培训 中国船舶重工集团--Dsp2000系统开发技术培训 晶方半导体--FPGA初中高技术培训 肯特智能仪器有限公司--FPGA初中高技术培训 哈尔滨大学--IPHONE苹果应用开发技术培训 昆明电器科学研究所--Dsp2000系统开发技术 奇瑞汽车股份--单片机应用开发技术培训
|
|
|
|
|