培训目标:
本课程结束后,受培训人员将能熟练使用Modeler软件,能够根据常见的不同种类的数据挖掘研究需要进行方案设计、数据分析、建模和报告的撰写。在培训中将安排一系列讨论会和实际数据练习,以保证学员有足够的实践机会实际操作Modeler软件。
Modeler培训课程内容:
1 统计分析方法与数据挖掘基本原理培训
课程描述
介绍数据挖掘方法论以及CRISP-DM的6个步骤
培训对象
战略规划部、市场研究部、数据分析部等相关研究人员
必要技能
统计方法基础知识、数据挖掘基本原理
培训内容
统计分析方法与数据挖掘基本原理
第一讲
如何从掌握统计方法到掌握数据挖掘
与传统的统计分析方法相比而言:
什么是数据挖掘?
数据挖掘能做什么?
数据挖掘在协助企业业务的分类、预测、聚类和模型可视化方面的特点;
数据挖掘在其他商业领域的应用,如完善客户关系管理、赢得市场营销战役;
如何从掌握统计分析方法到掌握数据挖掘?
第二讲
数据挖掘基本原理和实践操作方法论
数据挖掘的基本原理
数据挖掘实践中所要求的数据结构、衍生变量和数据转换
数据挖掘的模型建构方法、模型的评估、模型的检验和修订
目前主流的数据挖掘工具软件比较
如何在实践操作中运用CRISP-DM数据挖掘程序
如何从商业角度和数据角度了解数据挖掘解决问题的类型和思路
CRISP-DM的6个步骤以及每个步骤应该完成的工作和产生的结果
2、 Modeler软件操作基础及数据处理使用培训
培训对象
客户企业所指派的Modeler实际使用人员
涉及产品
Modeler
培训内容
Modeler软件操作基础培训
Modeler的数据处理技术
第一讲
操作概述
基础界面介绍:
Modeler 14.2所包含的功能模块
与Modeler先前版本的比较
基础操作之数据准备
读取数据文件
数据质量评估
数据处理
寻找数据中的关系
第二讲
建模概述
Modeler中所包含的数据建模概述
神经网络技术建模
决策树技术建模
模型比较与模型合并
Kohonen神经网络
关联规则
时序发现
模型的发布
第三讲
数据处理技术
合并多个数据源数据
抽取样本,选择和缓存数据
处理缺失数据
处理日期
处理时序数据
文件操作
数据聚合
附录: 通过ODBC读取数据
附录: Modeler的数据库连接
3 Modeler的高级建模
课程描述
介绍Modeler的建模技术以及Meta Modeling技术
培训对象
完成第二、三课学习的学员
必要技能
第二、三课学习的技能
培训内容
利用神经网络完成分群(Neural networks for classification)
高级规则归纳(Advanced rule induction)
聚类技术(clustering)
高级关联规则(Advanced association rules)
线性回归(Linear Regression)
逻辑回归(Logistic Regression)
浓缩数据:基本组件(Data Reduction: Principal Components)
从模型中获取数据(meta models, error modeling)