R做数据分析及挖掘培训
第一章:统计基础
第一节:描述性统计
1、集中趋势
2、离散测度
第二节:统计量及其抽样分布
1、统计量
2、分布
3、样本均值的分布与中心极限定理
4、样本比例的抽样分布
5、两个样本均值之差的抽样分布
6、关于样本方差的分布
第三节:参数估计
1、参数估计
2、一个总体参数的区间估计
3、两个总体参数的区间估计
4、估计量的求法
5、样本量的确定
第四节:假设检验
1、假设检验、个样本t检验
2、配对样本的t检验、两独立样本t检验
第五节:分类数据分析
1、分类数据与卡方统计量
2、拟合优度检验
3、列联分析、独立性检验
4、列联分析相关测量
5、线性回归
第六节:矩阵运算
1、行列式
2、矩阵及其运算
3、矩阵的初等变换与线性方程组
4、向量组的线性相关性
5、相似矩阵
6、线性空间与线性变化
第二章:R编程基础
第一节:R基本知识
1、准备、数据对象
2、运算、读写
第二节:R基本语句结构及循环
1、语句结构、创建
2、循环函数
第三节:R数据清洗
1、时间、数据清洗
2、数据清洗
第四节:文本对象处理
1、文本对象处理
2、正则表达式
第五节:R画图
1、基本绘图,图像格式
2、ggplot2
3、目前好用的扩展
第六节:R统计分析
1、参数估计
2、假设检验
第三章:R数据挖掘
第一节:线性回归,逻辑回归,梯度下降,聚类,关联规则,主成分因子分析
第二节:关联规则,决策树,神经网络,贝叶斯,支持向量机,随机森林
第四章:数据挖掘案例
第一节:如何在保险行业中使用决策树并展示其成果
第二节:如何在保险行业中使用决策树并展示其成果
第三节:如何利用客户分群实现保险行业中潜在客户的精准定位(K-means)
第四节:基于关联规则和协同过滤算法的商品个性化推荐