金融/科研数据分析师、高校师生及政策研究人员。
掌握Stata编程与数据处理,实现分析流程的自动化与可重复性。
熟练运用线性回归、面板模型及时间序列等核心计量方法。
能够独立完成从数据清洗到政策效应评估(DID/RDD)的完整建模。
Stata软件概述:Stata的版本选择与界面布局;日志文件(log)的创建与管理;do-file编辑器与命令语法结构(变量、时间变量、样本区间、权重、选项);因子变量的使用(虚拟变量、交乘项、双重差分法基础)。
数据管理与清洗:多种格式数据(Excel、CSV、TXT)的导入与导出;数据的合并(横向/纵向)与追加;变量的生成与替换;缺失值处理与异常值检测;数据集的标签与注释管理。
数据可视化:直方图、核密度图、箱线图、散点图矩阵的绘制;图形元素的定制(颜色、标题、坐标轴);统计图形的输出与导出。
描述性统计与假设检验:描述性统计量(均值、标准差、分位数)的计算;正态性检验;均值比较的T检验、方差分析;相关系数矩阵。
经典线性回归:回归分析的基本假设;regress命令的实现;回归结果的解读(系数、t值、R²、F检验);预测值与残差的的生成与检验;异方差、序列相关和多重共线性的检验与处理(稳健标准误、广义最小二乘法)。
内生性与工具变量法:内生性问题的来源与后果;工具变量的选择条件(相关性与外生性);两阶段最小二乘法(ivregress);过度识别检验与弱工具变量检验。
面板数据模型:面板数据的定义与设定;固定效应模型(FE)、随机效应模型(RE)的估计与选择(Hausman检验);时间效应、异方差和序列相关处理;动态面板模型的GMM估计。
离散选择与受限因变量模型:二元选择模型(Logit/Probit)的估计与解释(边际效应);排序选择模型;计数数据模型(泊松回归、负二项回归);Tobit模型与Heckman选择模型。
时间序列分析:时间序列的平稳性检验(单位根检验ADF);协整分析与误差修正模型(VECM);向量自回归模型(VAR);格兰杰因果检验。
政策效应评估方法:双重差分法(DID)模型设定与平行趋势检验;倾向得分匹配(PSM)的原理与实现;断点回归(RDD)的估计与带宽选择。
Stata编程与结果输出:宏(local/global)与循环(foreach, forvalues)的使用;矩阵运算(Mata);自编程序的完整过程;将结果导出至Word/Excel/LaTeX的便捷方法。
综合案例演练:从数据清洗、描述性分析、模型选择到结果解读的全流程实战(如:劳动力供给影响因素分析、金融时间序列预测、政策效应评估)。