预测性质量与预警——从"事后看SPC"到"事前防失控"
摘要:控制图失控后才处置,往往已产生整批不良;均值缓慢漂移可在数周内不被 3σ 规则捕获。预测性质量(Predictive Quality)在经典 SPC 之上,用 EWMA/CUSUM、多变量监控与(可选)机器学习,把报警点前移。本文给出三层预警架构、规则设计模板、两个完整演算案例,以及误报控制与组织闭环方法——帮助质量与数字化团队把"报警系统"建成"改善系统"。
一、案例:Cpk 1.4 仍遭客户投诉
某精加工供应商加工中心轴径,Cpk 长期 1.45,X̄-R 控制图"无失控点"。第 7 周客户抽检发现均值向规格上限偏移 0.012 mm,累计 4000 件在公差内但靠近 USL,客户装配干涉。
回溯:
- 单值未超 UCL,但 EWMA 图第 12 点已超预警线
- 刀具磨损呈线性趋势,每日补偿 0.002 mm,操作者未登记
- 无趋势规则(如 7 点单调上升)启用
若第 3 周触发黄色预警并换刀/补偿验证,可避免批量风险。这就是预测性质量要补的洞——不是替代 SPC,而是更早看见趋势与组合异常。
二、概念边界
2.1 预测性质量 vs 预测性维护(PdM)
| 预测性维护 PdM | 预测性质量 PdQ | |
|---|---|---|
| 目标 | 设备不停机 | 过程不出不良 |
| 典型数据 | 振动、电流、油温 | 尺寸、重量、视觉、压力、时间 |
| 行动 | 维保、换件 | 调参、换刀、加严检、停线 |
| Owner | 设备部 | 质量部+工艺 |
数据平台可共用(MES/SCADA),指标与响应流程须分开。
2.2 与 6.3 SPC、12.2 数字化的关系
- 6.3.1 控制图是基础层
- 6.3.3 SPC 数字化是采集与部署
- 12.2.2 本文——预警逻辑与运营
- 12.2.3 视觉+SPC 联动——在线 100% 数据喂给预警
三、三层预警架构(推荐落地顺序)
L1 — 经典 SPC + Western Electric 规则
适用:所有关键 CTQ,审计必认。
常用 8 条规则(节选):
- 1 点超 3σ
- 连续 9 点在中心同侧
- 连续 6 点单调增/减
- 连续 14 点交替上下
- ……
优点:可解释、可培训、客户认可
局限:对小偏移、慢漂移不敏感;单变量为主
L2 — 统计预警(强烈建议上)
| 方法 | 用途 |
|---|---|
| EWMA | 对小偏移敏感,权重近期点 |
| CUSUM | 累积偏移,适合漂移检测 |
| 多元 T²/Hotelling | 多参数同时异常(如压力+温度+尺寸) |
| Ppk 滚动趋势 | 30 批 Ppk 下滑 15% 触发橙色 |
EWMA 直觉:最近的数据权重更大——"慢慢坏"比"突然坏"更早报警。
L3 — 机器学习(试点)
- 无标签:Isolation Forest、Autoencoder 异常分
- 有标签:不良批次特征 → 分类/回归风险分
红线:
- 不得黑箱自动停线
- 须影子模式运行 1~3 个月对比 L1/L2
- 模型变更须验证与版本管理
四、演算案例 1:EWMA 提前发现漂移
轴径目标 μ₀=10.000 mm,σ 估计 0.004 mm(受控期)。
最近 10 点(mm):10.000, 10.001, 10.002, 10.003, 10.004, 10.005, 10.006, 10.007, 10.008, 10.009
- X 图:均在 UCL/LCL 内
- 规则 3(6 点单调增):触发
- EWMA(λ=0.2):第 8 点起超 2σ 预警
处置 SOP(黄色):
- 工艺工程师 2 小时内现场确认刀具/补偿
- 加严下一批 100% 关键尺寸
- 24 小时内根因与纠正(换刀周期?补偿 SOP?)
若无预警:可能再生产 2~3 天直至客户发现。
五、演算案例 2:多变量 — 注塑尺寸+重量
某塑件 重量↓ + 尺寸↓ 同时出现,单看尺寸图仍合格——实为欠注早期。
建立 T² 控制图(2 变量),第 6 模起 T² 超界 → 检查料温、射速、保压——发现料管温度偏低 5℃。
启示:关键过程应识别物理关联参数组,做多变量监控,而非 20 张单变量图各自为战。
六、预警分级与响应 SLA
| 级别 | 颜色 | 触发示例 | 响应 | SLA |
|---|---|---|---|---|
| 观察 | 黄 | EWMA 2σ、Ppk 趋势 | 工程师记录 | 24h 评估 |
| 升级 | 橙 | 规则 1+3 同时、T² 超界 | 工艺+质量联合 | 4h 处置 |
| 紧急 | 红 | 超规格、安全特性 | 停线/隔离 | 立即 |
每条预警工单字段:触发规则、CTQ、批次、责任人、处置、关闭验证、是否更新 FMEA/CP。
七、误报与漏报管理
报警疲劳是预测性质量失败首因——现场关通知 = 系统报废。
控制误报:
- 多规则 AND 组合(如 EWMA 超界 且 连续 3 点同侧)
- 死区(hysteresis):恢复须连续 N 点正常
- 换型/Startup 分段控制图——Startup 不纳入稳态规则
- 月度评审:误报率 = 关闭为"无行动"的比例,目标 <30%
控制漏报:
- 保留 L1 规则全集
- 对客诉批次做 事后回放——哪条规则应触发未触发?
- 与 10.2.1 保修数据 闭环
八、实施路线图(90 天)
第 1 月 — 基础
- 选 3 个 CTQ,MSA 合格
- 上 X̄-R 或 I-MR + WE 规则 8 条
- MES 自动采集(杜绝手工抄数)
第 2 月 — L2
- 同 CTQ 上 EWMA 或 CUSUM
- 定义黄/橙/红与 SLA
- 运行预警工单闭环
第 3 月 — 评估
- 对比:预警后停线次数、scrap 吨数、客诉
- 决定是否扩面或试点 L3
组织:质量 Owning 规则;IT Owning 管道;工艺 Owning 处置。
九、与 OEE、FPY 的联动
- 预警 → 短暂停线调整 → 计入 OEE 调整损失(7.3.1)——但总损失仍小于整批报废
- 稳态 FPY 提升 → 3.3.2 一次通过率 改善可量化
在 OEE 分析会(设备系列第 3 期)中,应单列质量预警导致的计划内微调 vs 非计划质量停线。
十、常见误区
| 误区 | 说明 |
|---|---|
| 上 AI 替代 SPC | 无稳定数据,AI 无意义 |
| 预警无处置 | 须 KPI 考核关闭率与有效性 |
| 全 CTQ 一张图 | 须按特性/设备/模具分族 |
| 忽略换型 Startup | Startup 数据污染稳态图 |
十一、小结
预测性质量 = SPC 的延伸 + 趋势敏感 + 分级响应 + 闭环改善。
好的系统:少而准、可解释、能闭环、能复盘。 从 L1+L2 做扎实,再谈 AI——这才是制造企业可复制的路径。
知识编号:12.2.2
版本:v20260528
作者:卓越质量智库
