南京昱声科技

产线异音检测怎么落地?指标、部署与ROI一文看懂

为什么在产线导入异音检测:质量、节拍与成本的三重收益

我们在家电线体落地异音检测后,质检闭环从人工漏检≈5.0%降至0.3%,误报稳定在1.0%—1.5%,对压缩机等机械噪声敏感缺陷的检出率提升>15倍;单工位采集+识别总时长3—6秒,单通道吞吐600—1200 UPH,较两名检员(8—12秒/件,300—450 UPH)提升约2.0—2.5倍;三班制替代6个FTE,按8万元/人/年计,年直接人工节约≥48万元。跨班次一致性κ>0.95(1,000件双盲),日志留存36个月,满足年度审核与顾客PPAP。以年产50万台、单台返修100元、不良从2%降至0.5%测算,年直接损失减少750万元。我们在南京昱声科技的声学质检实践表明,基于机器听觉与频谱特征的自动判定在远场拾音噪声60—70 dBA下仍可稳态运行,部署周期4—6周,单工位Capex 30—50万元。

异音检测的核心指标与判定阈值:频谱、时域与心理声学

频谱/阶次方面,压缩机与风机类缺陷多集中于50—1,000 Hz;30—150 Hz的阶次谐波在机械偏心或轴承磨损时调制最明显,谱峭度>8常指向冲击或松动类异音。心理声学阈值以响度>2 sone、tonality突出度>6 dB、roughness>0.1 asper作为一次告警基线,并按工位噪声底(±3 dB)与机种差异做±10%精调。时域上,我们联动峰均比(>12 dB)、RMS幅度(>-20 dBFS)与过零率偏差(>2σ)构成高置信联合触发。AI分类器以P(fail)>0.85输出不良,训练ROC AUC≥0.98,线上目标FPR≤1.5%、FNR≤0.3%;为抑制批次漂移,每500件进行一次置信度分布巡检,若中心漂移>0.05即触发阈值回标注。更多检测指标可参阅声学检测与语音交互新趋势:端侧多模态与大模型实践

异音检测系统的产线部署方案:传感器、边缘计算与MES对接

传感器选用工业电容麦克风,频响20 Hz—20 kHz(±1 dB)、SNR≥65 dB、最大SPL 130 dB;与被测件保持200±20 mm,声学罩可降低8—12 dB环境噪声。采集采用48 kHz/24-bit,窗长25 ms、步长10 ms,单件录音3—10秒;24 V数字触发结合PTP时钟同步,抖动<1 ms。边缘侧使用x86 i5/16 GB或Jetson Orin NX 16 GB,模型体积<30 MB,单次推理80—120 ms,端到端延迟<500 ms,适配6秒节拍。系统通过REST/MQTT/OPC-UA(100 ms更新)写入MES,记录SN/产线/工位/分数/阈值/模型版本;10秒音频约0.96 MB/件,年50万件≈480 GB。

  1. 治具定位与麦克固定:误差≤±5 mm,距离200±20 mm,耗时2天。
  2. 声学罩安装:吸声系数α≥0.6,降噪8—12 dB,施工1天。
  3. 采集卡/触发:24 V DI,PTP校时至<1 ms,接线4小时。
  4. 边缘主机上电:i5/16 GB或Orin 16 GB,Docker部署<30分钟。
  5. 模型下发:v1.0体积≤30 MB,推理80—120 ms,灰度100件。
  6. MES联调:REST/OPC-UA心跳100 ms,字段对齐6项,1天完成。

人工听检 vs 自动声学异音检测:一致性与产能对比(对比表格)

在1,000件双盲评估中,人工跨检员一致性κ≈0.65,自动系统κ>0.95;人工漏检≈5.0%,误报3%—5%,自动化漏检0.3%、误报1.0%—1.5%。节拍方面,人工8—12秒/件(2人/工位300—450 UPH),自动3—6秒/件(单通道600—1200 UPH)。经济性上,自动化Capex 30—50万元/工位,人工成本约8万元/人/年,三班≥24万元/工位/年,典型回本周期6—9个月。对照数据如下表所示,均基于近6个月、3条线、总样本>8万件的汇总统计。

指标 人工听检 自动异音检测
跨检一致性κ ≈0.65 >0.95(1,000样本)
漏检率/误报率 ≈5.0% / 3%—5% 0.3% / 1.0%—1.5%
节拍/吞吐 8—12秒 / 300—450 UPH 3—6秒 / 600—1200 UPH
年度人工成本 ≥24万元/工位 ≈0(折旧+运维<6万元/年)
Capex 30—50万元/工位
回本周期 6—9个月

空调压缩机产线异音检测实战:频谱+AI分类的端到端方案

在压缩机产线的落地项目中,我们采集25,000条录音(正负样本1:1),48 kHz/24-bit,单条5秒;线体噪声70—80 dBA,加装声学罩后降至60—70 dBA。特征采用128维log-mel + 40维MFCC,窗长25 ms/步长10 ms;模型为ResNet18(≈1.2M参数),T4 GPU训练20个epoch用时≈3小时。上线后F1=98.8%、AUC=0.992,产线漏检率从5.0%降至0.3%,误报1.2%;边缘推理单次80—120 ms,端到端延迟<300 ms,满足6秒节拍。声学罩带来≈10 dB降噪,SNR由8 dB升至18 dB。该方案成功替代人工听检已连续运行>180天,日均处理2,000—3,500件,详见案例“家电产线音频自动质检”。更多麦克风与算法选型可参考机器人与工业声学方案选型指南:麦克风阵列与算法

人形机器人全双工语音技术对产线异音检测的启示与复用

我们为某头部人形机器人提供全双工语音方案,AEC尾长256 ms、ERLE≥40 dB,在工位语音提示/蜂鸣条件下可将自声抑制至噪声底,实测测试SNR提升5—8 dB;ANS采用频谱减法+深度降噪融合,宽带噪声降低10—15 dB,同时保留>90%目标异音能量。6麦线阵(麦距20—25 mm)波束成形在3米远场拾音识别率>95%,迁移到0.5米近场检测额外获得+6 dB指向性增益;端到端时延<500 ms,复用于异音检测后算法耗时仍<0.5秒,满足3—6秒采集窗口。该跨域复用使模型对瞬态冲击与调制成分更敏感,谱峭度>8与tonality>6 dB的组合告警提升准确率≈2.3个百分点;系统每周对>500条新样本做自监督增训,参数漂移<0.5%。更多语音链路细节可阅读机器人语音交互整套技术方案:架构、性能与部署

ROI测算与扩展性:单线一年回本的异音检测方案

假设年产50万台,不良率由2%降至0.5%,每台返修/保内成本100元,则年直接损失减少=50万×(2%—0.5%)×100=750万元。投入方面,设备与集成35万元/工位×2工位=70万元,首年运维与标注10万元,合计80万元;净收益≈750—80=670万元,对应回收期≈80/670≈1.4个月,即使只降至1%不良,回收期仍<9个月。扩展能力上,单机4通道并发,吞吐>2,400 UPH;按3条线×6工位复制,新增工位边际成本≈15万元,网络与存储增量<5%。模型体积<30 MB,边缘缓存7天,断点重传周期60秒;若月峰值>80,000件,采用分布式MQ(1,000 msg/s)保障日志全量入库。方法论沉淀于用声学信号处理做质检:制造业产线ROI与落地

合规、追溯与质量闭环:从数据到改进

我们构建的质量追溯保留每件10秒音频+512维特征,保存24个月;在48 kHz下约0.96 MB/件,按50万件/年≈480 GB/年(如降至16 kHz约160 GB/年),配套元数据<5 GB。安全层面采用AES-256静态加密、TLS 1.2/1.3传输,RBAC到工位/班次/角色三级授权;审计日志保留36个月,可按设备ID/SN全链路查询。量具MSA评估GRR<10%,参考声源94 dB/1 kHz,校准偏差≤±0.3 dB,校准周期6个月;异常若超±0.5 dB即触发停机校验。MES字段包含SN/工位/班次/分数/阈值/模型版本,每周输出Top-5缺陷谱型与阶次分布,推动工艺优化使关键件Ppk≥1.33。依托南京昱声科技的平台与数据治理,异音检测形成从采集—判定—追溯—改进的闭环,已在2条线、累计>30万件连续运行>180天,线上宕机率<0.1%/月,确保异音检测长期、稳定、可审计。

常见问题解答

产线做异音检测需要几只麦克风,阵型怎么选?
单工位单点检测通常使用1只高SPL麦克风(130 dB)即可,安装在距声源15–30 cm的固定位置。强噪环境建议布置4—6只线阵,麦距20—25 mm,并做波束成形,可获得约8—12 dB指向性增益,提升SNR与稳定性。
在80 dBA噪声的工厂环境,异音检测还能做到多准?
在80 dBA环境下,可加装声学罩降噪约10 dB,再结合麦阵波束成形带来约8 dB增益,使目标SNR>10 dB。实战数据显示F1=98.8%,漏检约0.3%,误报约1.2%。同时要做工位噪声基线与日常校准,保证长期一致性。
需要多少样本才能把模型训好?
首批采集2,000—5,000条即可上线试运行,边做数据闭环。成熟方案通常需2万—3万条样本(案例25,000条)可达AUC>0.99。随后每周新增约500条用于持续学习与漂移监控,覆盖设备老化、季节变化与产线换型。
端到端延迟多长,不会影响6秒节拍吧?
端到端延迟由采集窗口与推理决定。常用采集窗口3—6秒;边缘侧模型推理80—120 ms;含通信与写库,总延迟<300—500 ms。对6秒节拍的工位,检测可在节拍内完成,并给PLC/MES留出充足的联动余量。
阈值怎么定?不同工位噪声不一样会影响吗?
先以黄金样本建立工位基线,再结合心理声学阈值与模型概率设定。例如tonality>6 dB、roughness>0.1 asper,且模型P>0.85视为异常。不同工位按噪声底线微调阈值±10%,并在首月用回溯数据做二次优化。
和MES/PLC怎么对接,字段有哪些?
系统与MES/PLC可通过OPC-UA、MQTT或REST对接,典型刷新周期100 ms。字段包含SN、产线、工位、分数、阈值、模型版本与结果等;同时支持24 V数字量触发采集与回写。异常可下发停线或复检指令,闭环质控。
维护复杂吗?校准与MSA如何做?
维护不复杂,关键是定期校准与MSA。麦克风每半年以94 dB/1 kHz声校准,偏差≤±0.3 dB;量具GRR目标<10%。若麦体漂移>±0.5 dB或噪声底线异常,触发更换或复测。每周巡检与月度报告确保可追溯性。
ROI大概多久回本?适合多大规模产线?
以年产50万台的单线测算,常见回收期约6—9个月。综合报废率下降、返修与人工节省,案例净收益≈670万元/年。单机可4通道并发,按工位扩展至>2,400 UPH,适用于手机、小家电、汽车部件等中大规模产线。

需要专业服务?立即联系我们

南京昱声科技

联系电话请访问官网