课程大纲:
Hadoop Flume 收集数据培训
Flume 可以从多个数据源获取数据,把这些数据传给远程主机(可能是一对多或流水线模型 中的多个目标),再把它们传给多个目的端。
尽管 Flume 提供了开发自定义数据源和数据目的端的编程 API,但它原本就支持许多常见的场景。
1
使用 Flume 收集数据
1.Flume核心概念agent
2.agent里面包含3个核心组件:source、channel、sink。
3.sink组件是用于把数据发送到目的地的组件,目的地包括hdfs、logger、avro、thrift、ipc、file、null、hbase、solr、自定义。
请
登录
后发表评论
新评论
全部
第1节
第2节
第3节
第4节
第5节
第6节
第7节
第8节
第9节
第10节
第11节
第12节
第13节
第14节
第15节
第16节
第17节
我的报告 / 所有报告