预测性质量与预警——从"事后看SPC"到"事前防失控"

作者:卓越质量智库 发布时间:2026/6/26 阅读 25
目前评级: ★★★☆☆ 我要评级 等效 8 人评分

摘要:控制图失控后才处置,往往已产生整批不良;均值缓慢漂移可在数周内不被 3σ 规则捕获。预测性质量(Predictive Quality)在经典 SPC 之上,用 EWMA/CUSUM、多变量监控与(可选)机器学习,把报警点前移。本文给出三层预警架构、规则设计模板、两个完整演算案例,以及误报控制与组织闭环方法——帮助质量与数字化团队把"报警系统"建成"改善系统"。


一、案例:Cpk 1.4 仍遭客户投诉

某精加工供应商加工中心轴径,Cpk 长期 1.45,X̄-R 控制图"无失控点"。第 7 周客户抽检发现均值向规格上限偏移 0.012 mm,累计 4000 件在公差内但靠近 USL,客户装配干涉。

回溯:

  • 单值未超 UCL,但 EWMA 图第 12 点已超预警线
  • 刀具磨损呈线性趋势,每日补偿 0.002 mm,操作者未登记
  • 趋势规则(如 7 点单调上升)启用

若第 3 周触发黄色预警并换刀/补偿验证,可避免批量风险。这就是预测性质量要补的洞——不是替代 SPC,而是更早看见趋势与组合异常


二、概念边界

2.1 预测性质量 vs 预测性维护(PdM)

预测性维护 PdM 预测性质量 PdQ
目标 设备不停机 过程不出不良
典型数据 振动、电流、油温 尺寸、重量、视觉、压力、时间
行动 维保、换件 调参、换刀、加严检、停线
Owner 设备部 质量部+工艺

数据平台可共用(MES/SCADA),指标与响应流程须分开

2.2 与 6.3 SPC、12.2 数字化的关系

  • 6.3.1 控制图是基础层
  • 6.3.3 SPC 数字化是采集与部署
  • 12.2.2 本文——预警逻辑与运营
  • 12.2.3 视觉+SPC 联动——在线 100% 数据喂给预警

三、三层预警架构(推荐落地顺序)

L1 — 经典 SPC + Western Electric 规则

适用:所有关键 CTQ,审计必认。

常用 8 条规则(节选):

  1. 1 点超 3σ
  2. 连续 9 点在中心同侧
  3. 连续 6 点单调增/减
  4. 连续 14 点交替上下
  5. ……

优点:可解释、可培训、客户认可
局限:对小偏移、慢漂移不敏感;单变量为主

L2 — 统计预警(强烈建议上)

方法 用途
EWMA 对小偏移敏感,权重近期点
CUSUM 累积偏移,适合漂移检测
多元 T²/Hotelling 多参数同时异常(如压力+温度+尺寸)
Ppk 滚动趋势 30 批 Ppk 下滑 15% 触发橙色

EWMA 直觉:最近的数据权重更大——"慢慢坏"比"突然坏"更早报警。

L3 — 机器学习(试点)

  • 无标签:Isolation Forest、Autoencoder 异常分
  • 有标签:不良批次特征 → 分类/回归风险分

红线

  • 不得黑箱自动停线
  • 影子模式运行 1~3 个月对比 L1/L2
  • 模型变更须验证与版本管理

四、演算案例 1:EWMA 提前发现漂移

轴径目标 μ₀=10.000 mm,σ 估计 0.004 mm(受控期)。

最近 10 点(mm):10.000, 10.001, 10.002, 10.003, 10.004, 10.005, 10.006, 10.007, 10.008, 10.009

  • X 图:均在 UCL/LCL 内
  • 规则 3(6 点单调增):触发
  • EWMA(λ=0.2):第 8 点起超 2σ 预警

处置 SOP(黄色)

  1. 工艺工程师 2 小时内现场确认刀具/补偿
  2. 加严下一批 100% 关键尺寸
  3. 24 小时内根因与纠正(换刀周期?补偿 SOP?)

若无预警:可能再生产 2~3 天直至客户发现。


五、演算案例 2:多变量 — 注塑尺寸+重量

某塑件 重量↓ + 尺寸↓ 同时出现,单看尺寸图仍合格——实为欠注早期。

建立 T² 控制图(2 变量),第 6 模起 T² 超界 → 检查料温、射速、保压——发现料管温度偏低 5℃。

启示:关键过程应识别物理关联参数组,做多变量监控,而非 20 张单变量图各自为战。


六、预警分级与响应 SLA

级别 颜色 触发示例 响应 SLA
观察 EWMA 2σ、Ppk 趋势 工程师记录 24h 评估
升级 规则 1+3 同时、T² 超界 工艺+质量联合 4h 处置
紧急 超规格、安全特性 停线/隔离 立即

每条预警工单字段:触发规则、CTQ、批次、责任人、处置、关闭验证、是否更新 FMEA/CP。


七、误报与漏报管理

报警疲劳是预测性质量失败首因——现场关通知 = 系统报废。

控制误报

  • 多规则 AND 组合(如 EWMA 超界 连续 3 点同侧)
  • 死区(hysteresis):恢复须连续 N 点正常
  • 换型/Startup 分段控制图——Startup 不纳入稳态规则
  • 月度评审:误报率 = 关闭为"无行动"的比例,目标 <30%

控制漏报

  • 保留 L1 规则全集
  • 对客诉批次做 事后回放——哪条规则应触发未触发?
  • 10.2.1 保修数据 闭环

八、实施路线图(90 天)

第 1 月 — 基础

  • 选 3 个 CTQ,MSA 合格
  • 上 X̄-R 或 I-MR + WE 规则 8 条
  • MES 自动采集(杜绝手工抄数)

第 2 月 — L2

  • 同 CTQ 上 EWMA 或 CUSUM
  • 定义黄/橙/红与 SLA
  • 运行预警工单闭环

第 3 月 — 评估

  • 对比:预警后停线次数、scrap 吨数、客诉
  • 决定是否扩面或试点 L3

组织:质量 Owning 规则;IT Owning 管道;工艺 Owning 处置。


九、与 OEE、FPY 的联动

  • 预警 → 短暂停线调整 → 计入 OEE 调整损失(7.3.1)——但总损失仍小于整批报废
  • 稳态 FPY 提升 → 3.3.2 一次通过率 改善可量化

在 OEE 分析会(设备系列第 3 期)中,应单列质量预警导致的计划内微调 vs 非计划质量停线


十、常见误区

误区 说明
上 AI 替代 SPC 无稳定数据,AI 无意义
预警无处置 须 KPI 考核关闭率与有效性
全 CTQ 一张图 须按特性/设备/模具分族
忽略换型 Startup Startup 数据污染稳态图

十一、小结

预测性质量 = SPC 的延伸 + 趋势敏感 + 分级响应 + 闭环改善

好的系统:少而准、可解释、能闭环、能复盘。 从 L1+L2 做扎实,再谈 AI——这才是制造企业可复制的路径。

知识编号:12.2.2

版本:v20260528

作者:卓越质量智库