工业大数据分析师、智能制造系统工程师、工业互联网平台开发人员、生产管理人员。
理解工业大数据的特征(多源异构、时序性强、高维度、低价值密度)。
掌握工业大数据采集、存储、处理与分析的技术栈。
能够独立完成工业数据分析项目(质量优化、设备效率分析、能耗分析)的建模与实现。
工业大数据概述:工业大数据的定义与4V特征(体量大、多样性、速度快、价值密度低);工业数据来源(设备数据、生产过程数据、质量数据、物料数据、环境数据、管理数据);工业大数据与消费大数据的区别;工业大数据在智能制造中的价值。
工业大数据技术架构:工业大数据平台的分层架构(数据采集层、数据存储层、数据处理层、数据分析层、数据应用层);边缘计算与云计算的协同;Lambda架构与Kappa架构;开源大数据生态(Hadoop、Spark、Flink)。
工业数据采集与集成:工业数据源接入技术(OPC UA、Modbus、PLC、SCADA、MES);消息队列(Kafka、RabbitMQ)在数据采集中的应用;数据集成工具(Logstash、Flume、DataX);数据同步策略(全量、增量、实时、离线)。
工业时序数据库:时序数据的特点(时间戳、结构化、写多读少);时序数据库(TSDB)的选型(InfluxDB、TDengine、TimescaleDB、Prometheus);时序数据库的数据模型(标签、字段、时间戳);时序数据库的查询语言(InfluxQL、SQL扩展)。
数据预处理与清洗:数据质量问题的类型(缺失值、异常值、重复值、不一致);缺失值处理方法(删除、填充、插值);异常值检测方法(3σ原则、箱线图、聚类);数据平滑与滤波;数据规约与采样。
特征工程:特征提取(从时序数据中提取统计特征、频域特征);特征构造(组合特征、交互特征);特征选择(过滤法、包装法、嵌入法);特征降维(PCA、t-SNE);特征重要性评估。
工业数据分析方法:统计分析(描述性统计、假设检验、相关性分析);时间序列分析(ARIMA、季节性分解);回归分析(线性回归、岭回归、Lasso回归);分类算法(逻辑回归、决策树、随机森林、XGBoost);聚类算法(K-Means、DBSCAN、层次聚类)。
设备效率分析(OEE):OEE(设备综合效率)的计算公式(可用性×性能×质量);OEE损失分析(停机损失、速度损失、缺陷损失);OEE数据的采集与计算;OEE的根因分析;OEE改善的闭环。
质量分析与SPC:质量数据的统计分析(过程能力指数Cp/Cpk);统计过程控制(SPC)的控制图(Xbar-R图、P图、U图);异常模式的识别(判异准则);质量根因分析(因果图、鱼骨图);质量预测模型。
能耗分析与优化:能耗数据的采集;能耗的构成分析(设备能耗、工序能耗);能耗基准的建立;能耗异常检测;能耗预测模型(时间序列、回归);节能措施的量化评估。
机器学习在工业中的应用:预测性维护(剩余寿命预测、故障诊断);产品质量预测(工艺参数对质量的影响);生产过程优化(参数推荐、自适应控制);视觉缺陷检测(深度学习)。
综合实战项目:面向典型工业场景(如注塑机工艺参数优化、风机能耗分析、半导体设备故障预测)的工业大数据分析项目,包含数据采集、时序数据库存储、特征工程、模型训练、结果可视化和应用建议。