跳转到内容

制程不良趋势预警:小比例不良不再拖成批量异常

这个案例来自 制造业 场景,讲的是很多工厂都遇到过、但很容易被日报和班后汇总拖慢的一类质量问题:

不良不是突然爆出来的,而是先在某个工位、某个班次、某台设备、某个料批上,连续几次小比例抬头。

现场第一眼看,它好像还没有到停线或批量隔离的程度。
可等到质量工程师在日报里真正看见趋势时,前面几个小时甚至一整个班次的在制品已经继续往后流,最后变成返工、隔离、复检,严重时还会形成报废。

这是一个多工位连续加工的制造车间,产品要经过投料、加工、组装、在线检验、功能测试和包装等多个节点。
每个班次都会产生大量检验记录,包括:

  • 工位检验记录:例如压装、点胶、锁附、焊接、贴装、冲切等关键工位的首检、巡检和抽检结果
  • 设备运行记录:例如设备编号、模具号、治具号、温度、压力、扭矩、节拍和停机信息
  • 班次记录:白班、夜班、换班前后不同操作员和班组长的生产记录
  • 料批记录:同一供应商、同一到货批、同一仓位领出的材料批次
  • 返工隔离记录:不良品被返工、隔离、复检、让步接收或报废的过程

在这类车间里,真正让现场难受的,往往不是一次性出现 15%20% 的大比例不良。
大比例不良一出现,现场反而会很快停下来,因为谁都看得见风险。

更麻烦的是这种情况:

  • A03 工位某个压装尺寸从偶发超差变成连续偏上限
  • 夜班在 B 线同一台设备上多了几笔轻微外观划伤
  • 料批 M2408-17 上线后,功能测试不良率从 0.6% 慢慢抬到 1.4%
  • 班组长看到有返工,但觉得比例不算大,先让线继续跑
  • 质量工程师要等班后汇总,才发现这不是随机波动,而是趋势已经起来了

这类小比例不良,如果只看单点记录,常常显得不严重;但如果把工位、班次、设备、料批和检验结果放到一起看,就会发现它已经在朝批量异常方向走。

改造前,车间不是没有检验,也不是没有质量人员。
问题在于旧流程更擅长处理“已经很明显的异常”,不擅长处理“还没爆发、但趋势正在变坏的异常”。

现场通常是这样运转的:

  1. 操作员或巡检员在工位上记录不良数量和不良类型。
  2. 班组长按小时或按批次看一下当前不良,比例不高就先继续生产。
  3. 质量工程师主要看日报、班后汇总或异常单。
  4. 如果当天或某批出现明显超标,再组织返工、隔离、原因分析和改善。

这条链路看起来完整,但有一个很关键的时间差:
检验记录产生在现场,趋势判断却发生在班后。

当一个小比例不良连续抬头时,旧流程会把它拆散在不同表里:

  • 工位上只看到这半小时多了几件
  • 班组长只看到当前班次还没超过红线
  • 质量工程师只在日报里看到总数
  • 设备维护只看到设备没有停机报警
  • 仓库和物料只看到料批已经正常发出

每个岗位看到的都不是假信息,但都不够完整。
等大家终于把这些信息拼起来,前面的产品已经从异常工位流到了后段,返工隔离范围也被放大了。

flowchart TB
    A[工位产生检验记录] --> B[操作员记录不良数量和类型]
    B --> C[班组长按小时或批次查看]
    C --> D{单次不良率是否超过红线?}
    D -->|否| E[继续生产并等待班后汇总]
    D -->|是| F[通知质量工程师现场确认]
    E --> G[日报或班后汇总整理]
    G --> H[质量工程师发现某工位/班次/设备/料批不良抬头]
    H --> I[回头追溯已流转批次]
    I --> J[扩大返工、隔离和复检范围]
    F --> K[现场临时处置]
    K --> L[补录异常单和处理结果]

这条旧流程为什么容易把小问题拖成批量问题

Section titled “这条旧流程为什么容易把小问题拖成批量问题”

从项目复盘角度看,旧流程至少有五个很具体的卡点。

1. 只盯单次红线,忽略连续抬头

Section titled “1. 只盯单次红线,忽略连续抬头”

很多车间设了不良率阈值,例如某工位超过 3% 才拉异常。
但现实里,真正危险的趋势可能是:

  • 第一小时 0.5%
  • 第二小时 0.9%
  • 第三小时 1.3%
  • 第四小时 1.8%

每一小时都没超过硬红线,可趋势已经明显变坏。旧流程只看“有没有超”,不太看“是不是连续往上走”。

2. 工位、班次、设备、料批没有被及时交叉看

Section titled “2. 工位、班次、设备、料批没有被及时交叉看”

同一类不良可能不是全线发生,而是集中在某一个组合上:

  • A03 工位 + 夜班 + 2 号压装机
  • B07 测试位 + 料批 M2408-17
  • C 线白班 + 新换治具

旧流程里这些信息分散在检验表、设备点检表、领料记录和班组交接表里。
单独看都只是“小波动”,合起来才是“趋势风险”。

3. 班组长和质量工程师协同靠口头判断

Section titled “3. 班组长和质量工程师协同靠口头判断”

班组长更关注当前节拍和现场处理,质量工程师更关注不良模式和风险外溢。
旧流程里,两边经常是班组长先凭经验压住,质量工程师班后再追问:

  • 这一批什么时候开始偏的
  • 当时有没有换料
  • 是哪台设备生产的
  • 中间有没有返工
  • 已经流到哪些后段工序

问题不是两边不配合,而是共同判断的时点太晚。

小比例不良早期没有被抓住时,现场通常不会立刻隔离在制品。
等趋势确认以后,只能回头按时间、料批、设备和工位倒推影响范围。

这会带来三个损失:

  • 本来只要隔离半小时产出,最后要隔离整个班次
  • 本来只要复检某台设备产出,最后要复检整条线
  • 本来只要停某个料批,最后连相邻批次也要跟着排查

5. 复盘看到的是结果,不是趋势形成过程

Section titled “5. 复盘看到的是结果,不是趋势形成过程”

日报能告诉质量工程师“今天不良率高了”,但不一定能告诉现场:

  • 不良是从哪个时间点开始爬升的
  • 是哪个班次先出现苗头
  • 是换料后抬头,还是设备参数漂移后抬头
  • 班组长当时做了什么处置
  • 返工隔离动作有没有及时发生

没有趋势形成过程,后续改善就容易停在“加强巡检”“注意控制”这种泛化要求上。

派宝没有把这件事做成一个简单的“不良率超标报警”。
真正有效的做法,是让多智能体把检验记录、工位、班次、设备、料批和处置动作串起来,在小比例不良连续抬头时提前介入。

1. 检验记录识别智能体先把现场数据接住

Section titled “1. 检验记录识别智能体先把现场数据接住”

系统会持续接入来自现场的检验记录,包括:

  • 工位首检、巡检、抽检和全检记录
  • 不良类型、数量、判定结果和检验人员
  • 工单号、批次号、设备号、治具号和料批号
  • 返工、隔离、复检、报废等后续处理状态

这样质量工程师不再只等班后日报,而是能在数据刚产生时就看到结构化记录。

2. 趋势分析智能体盯住“小比例连续抬头”

Section titled “2. 趋势分析智能体盯住“小比例连续抬头””

趋势分析智能体不只判断有没有超过红线,而是持续观察:

  • 某工位连续几个时间窗不良率上升
  • 某班次的不良构成明显偏离历史均值
  • 某台设备的轻微缺陷连续增多
  • 某个料批上线后,同类不良在多个工位出现
  • 返工数量虽然不大,但连续占用后段人力

它更像是在盯“斜率”和“组合”,而不是只盯一个固定阈值。

3. 风险预警智能体把苗头分成不同处置等级

Section titled “3. 风险预警智能体把苗头分成不同处置等级”

不是所有抬头都要停线。
系统会结合历史数据、当前工单、客户要求和不良类型,先给出风险分层:

  • 观察级:趋势刚出现,提醒班组长加强该工位巡检
  • 确认级:连续多个时间窗抬头,提醒质量工程师现场确认
  • 围堵级:同一设备或料批关联明显,触发在制品暂缓流转和局部隔离
  • 升级级:高风险不良类型出现扩散,提醒生产主管、质量工程师和班组长共同处置

这样现场不会因为一个小波动就过度反应,也不会等到批量异常才开始反应。

4. 原因分析智能体把工位、班次、设备、料批放在一起看

Section titled “4. 原因分析智能体把工位、班次、设备、料批放在一起看”

一旦预警触发,原因分析智能体会自动拉取关联信息,例如:

  • 预警前后是否换过料批
  • 设备是否刚保养、换模、换治具或调整参数
  • 夜班和白班的不良结构是否明显不同
  • 同一操作员或同一工位是否反复出现同类问题
  • 返工后的复检结果是否仍然集中在同一缺陷

这让质量工程师到现场前,已经带着初步判断,而不是重新翻表找线索。

5. 协同处置智能体把班组长和质量工程师拉到同一条线上

Section titled “5. 协同处置智能体把班组长和质量工程师拉到同一条线上”

当系统判断需要人工确认时,会自动生成协同任务:

  • 班组长确认当前工位是否继续生产、降速观察或暂停流转
  • 质量工程师确认不良判定标准、抽样加严和隔离范围
  • 设备人员确认设备参数、治具状态和最近调整记录
  • 物料人员确认当前上线料批、替换料批和库存批次

任务不是简单发消息,而是带着工位、班次、设备、料批、检验记录和建议处置动作一起发出。
班组长和质量工程师看到的是同一条预警记录,后续判断、返工隔离和关闭结论也回到同一条记录里。

6. 隔离状态管理和留痕智能体把影响范围关住

Section titled “6. 隔离状态管理和留痕智能体把影响范围关住”

如果预警进入围堵级,系统会提示现场按影响范围处理:

  • 暂缓该工位后续流转
  • 对指定时间窗的在制品做局部隔离
  • 对同设备、同料批或同班次产出加严复检
  • 标记返工品、待判品、隔离品和已释放品状态
  • 留下班组长、质量工程师和复检人员的操作记录

这一步的价值是把隔离范围尽量做准。
早一点识别趋势,就能少隔离不相关批次,也能少放过真正高风险的那一段产出。

flowchart TB
    A[工位持续产生检验记录] --> B[检验记录识别智能体<br/>整理工位/班次/设备/料批/不良类型]
    B --> C[趋势分析智能体<br/>识别小比例连续抬头]
    C --> D{是否形成趋势风险?}
    D -->|否| E[继续观察并沉淀趋势曲线]
    D -->|是| F[风险预警智能体<br/>分层为观察级/确认级/围堵级/升级级]
    F --> G[原因分析智能体<br/>交叉比对设备、料批、班次和历史记录]
    G --> H[协同处置任务<br/>同步班组长 + 质量工程师]
    H --> I{是否需要返工隔离?}
    I -->|否| J[加严巡检并持续跟踪]
    I -->|是| K[隔离状态管理智能体<br/>锁定影响时间窗和批次范围]
    K --> L[返工/复检/释放/报废状态回写]
    J --> M[操作留痕追踪智能体记录判断和动作]
    L --> M
    M --> N[质量看板更新趋势、原因和闭环结果]

以一个 三条产线、两班倒、日均 1.8 万件产出 的零部件加工车间为例,制程检验点覆盖压装、锁附、外观和功能测试。
试运行 8 周后,最明显的变化不是不良完全消失,而是小比例不良开始更早被识别、确认和关住。

对比项改造前改造后
小比例不良抬头发现时点多数在班后日报或次日复盘通常在连续 2 到 3 个时间窗内预警
判断维度主要看单工位或单班次汇总同时交叉工位、班次、设备、料批和检验记录
班组长与质量工程师协同口头沟通多,确认口径易不一致围绕同一条预警任务协同处理
返工隔离范围常按整批、整班次扩大更容易按时间窗、设备和料批精准圈定
质量工程师追溯耗时需要翻检验表、设备记录和领料记录预警记录自动带出关联线索
批量返工发生概率小趋势容易拖成集中返工早期围堵后明显下降
复盘质量多看结果,少看形成过程能看到趋势曲线、触发原因和处置留痕

第一,发现时点提前,不是因为现场多填了表,而是系统把原本已经存在的检验记录实时串起来了。
过去这些数据也在,只是分散在工位表、设备记录、料批记录和班次汇总里,等人去看时已经晚了。

第二,误报不会大幅增加,是因为预警不是只看一个固定阈值。
派宝会把连续时间窗、历史均值、同类不良、工位特性和客户质量要求一起考虑,再把风险分成观察级、确认级、围堵级和升级级。现场可以先观察、再确认、再围堵,而不是一报警就停线。

第三,返工隔离范围变准,来自影响范围被提前锁定。
当系统能指出风险集中在 B07 测试位 + 夜班 + 3 号设备 + M2408-17 料批,质量工程师和班组长就不需要把整条线所有产出都拉回来复检。

第四,班组长和质量工程师协同变顺,关键在于两边看到的是同一条预警记录。
班组长知道现场节拍、人员和设备状态,质量工程师知道判定标准、客户风险和隔离规则。两类判断合在一条任务里,才不会变成班后互相补问。

第五,后续改善更容易落地,因为复盘不再只看到“不良率高”。
系统会保留趋势从什么时候开始、哪个工位先抬头、期间有没有换料换治具、谁做了确认、哪些产品进入返工隔离、最后如何释放或报废。

这个案例的价值,不在于把质量管理做成更复杂的报表,而在于让现场更早看见“正在形成的风险”。

1. 把质量管理从事后统计往前推

Section titled “1. 把质量管理从事后统计往前推”

日报和班后汇总仍然有价值,但它们更适合复盘,不适合拦截正在扩大的制程风险。
趋势预警把质量判断往前推到生产过程中,让小比例不良还没拖成批量异常时就被看见。

2. 让班组长不用在节拍和质量之间硬猜

Section titled “2. 让班组长不用在节拍和质量之间硬猜”

班组长最难的是现场不能动不动停,又不能放任不良继续流。
系统把风险等级、关联记录和建议动作一起给出,班组长就能更稳地决定是继续观察、加严检验、暂缓流转,还是立刻找质量工程师到场。

3. 让质量工程师少做低效追溯,多做有效判断

Section titled “3. 让质量工程师少做低效追溯,多做有效判断”

质量工程师过去大量时间花在翻记录、问班组、查设备、追料批上。
现在预警记录先把线索拉齐,质量工程师可以把时间放在判定风险、圈定隔离范围和推动原因改善上。

4. 让返工隔离从“扩大兜底”变成“精准围堵”

Section titled “4. 让返工隔离从“扩大兜底”变成“精准围堵””

越晚发现趋势,隔离范围越容易扩大。
越早把工位、班次、设备和料批组合识别出来,越能把返工、复检和隔离压在真正有风险的范围内。

5. 让改善不是一句“加强管控”

Section titled “5. 让改善不是一句“加强管控””

制程不良趋势预警把问题形成过程留下来。
后续复盘时,现场可以讨论的是具体事实:

  • 哪个工位先抬头
  • 哪台设备最相关
  • 哪个料批上线后变化明显
  • 哪个班次处置及时
  • 哪些返工隔离动作有效

这比泛泛要求“加强巡检”“提升意识”更能推动真实改善。