(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211322936.7
(22)申请日 2022.10.27
(71)申请人 中钢集团马鞍山矿山研究总院股份
有限公司
地址 243000 安徽省马鞍山市经济开发区
西塘路666号
(72)发明人 华绍广 季云云 李书钦 李香梅
姚俊 裴德健
(74)专利代理 机构 马鞍山市金桥专利代理有限
公司 341 11
专利代理师 常前发 王益西
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/08(2006.01)
(54)发明名称
一种面向选冶渣场在线监测系统的时间序
列异常检测方法
(57)摘要
本发明公开了一种面向选冶渣场在线监测
系统的时间序列异常检测方法, 属于选冶渣场在
线监测技术领域。 本发明的步骤为: 从数据库中
提取数据, 填补缺失值, 删除部分相关系数较高
的原始指标, 对保留下来的指标通过特征工程构
建统计特征、 时间特征与时序特征; 所有特征进
行归一化处理, 通过无监督算法进行多数投票确
定异常标签; 对 经处理后的标签数据进行特征选
择, 通过这些重要性指标来提升无监督算法的检
测性能; 再结合行业标准修正伪标签; 最后对无
监督算法的检测结果进行加权融合, 实现了基于
少量监测项目构建统计特征、 时间特征和时序特
征, 以有监督算法辅助无监督算法进行重要特征
选取, 提高无监 督异常检测算法的性能。
权利要求书3页 说明书6页 附图3页
CN 115545115 A
2022.12.30
CN 115545115 A
1.一种面向选冶渣场在线监测系统的时间序列异常检测方法, 其特征在于, 包括以下
步骤:
S1: 提取选冶渣场在线监测系统数据集D, 所有监测项目数据采集频率为1小时, 数据集
中含有时间戳指标、 选冶渣场名称和监测项目, 构建适用于所有选冶渣场库的数据集;
S2: 根据时序数据特点确定数据处理方案: 删除数据质量差的特征、 填补缺失值、 删除
相关性系数 大于0.7的特征;
S3: 针对保留下来的特征, 将其转换为更好代表模型潜在问题的新特征, 运行多种无监
督算法, 针对每个基模型进行数据训练及异常判断, 最 终得到每个基模型的异常标签结果,
实行多数投票策略确定异常标签; 对所有特征进行归一化处理, 通过过滤法、 包裹法、 嵌入
法进行特征选择; 然后采用无监 督算法进行训练, 得到异常 分值;
S4: 结合行业标准对特定特征设定阈值, 超过阈值则设定该记录为异常, 以此修正上述
模型结果;
S5: 对多种无监 督算法的检测结果进行加权融合, 获得异常 分值;
S6: 模型上线一段时间后, 监控 模型稳定性, 以此判定是否需要重建模型;
S7: 模型结果以Restful API形式对外提供接口。
2.如权利要求1所述的一种面向选冶渣场在线监测系统的时间序列异常检测方法, 其
特征在于: 包括离线学习阶段和上线检测阶段, 其离线、 在线两个阶段对数据处理、 特征工
程的方式一 致。
3.如权利要求2所述的一种面向选冶渣场在线监测系统的时间序列异常检测方法, 其
特征在于: 离线学习阶段的步骤如下:
S1: 数据探索: 不同选冶渣场监测项目不同, 以最大集构建模型特征, 适应所有选冶渣
场监测项目; 查看数据质量, 包括数据类型、 空值记录、 缺失率、 空值记录数、 最小值、 第1百
分位、 第5百分位、 第25百分位、 第50百分位、 第75百分位、 第95百分位、 第99百分位、 最大值、
均值、 方差的统计量; 删除数据质量差的特 征, 以提供 数据质量;
S2: 数据处理: 使用前一个非空值进行填补, 删除填补后依然为空的记录; 删除相 关性
系数大于0.7的特征;
S3: 特征构建: 对保留下来的特征进行特征构建, 包括统计特征集、 时间特征集、 时序特
征集;
S4: 标签生成: 通过5种无监督算法, 计算得出各算法的异常标签, 采用多数投票策略获
得异常标签;
S5: 特征处理: 为消除指标之间的量纲影响, 需要进行数据标准化处理, 以解决数据指
标之间的可比性;
S6: 特征选择: 为提升无监督算法的检测性能, 采用包裹法、 嵌入法和过滤法的特征选
择方法;
S7: 标签修正: 结合国标中对位移、 浸润线、 降雨量、 干滩长度的指标预警要求修正伪标
签;
S8: 模型训练: 通过对5种算法得到异 常得分值, 按照0.2:0.3:0.2:0.1:0.2的系数进行
加权融合, 使用最小最大归一 化方法将异常 分值划分到[0,10 0]区间。
4.如权利要求3所述的一种面向选冶渣场在线监测系统的时间序列异常检测方法, 其权 利 要 求 书 1/3 页
2
CN 115545115 A
2特征在于: 离线学习阶段的S7中的预警监测项目如下:
1)选冶渣场位移量、 位移变化速率的正常运营值根据库特点、 工程类比、 已有监测成果
统计分析及试验研究确定, 位移的预警阈值如下表:
2)选冶渣场 堆积坝外坡浸润线埋深的红色预警值根据设计文件和现行标准确定, 橙色
预警阈值取红色预警阈值的1.1倍:
浸润线最小埋深(m)
3)选冶渣场最小安全 超高与最小干滩长度的预警值确定应符合下列规定:
选冶渣场最小安全超高与最小干滩长度的红色预警阈值根据设计文件和现行标准确
定:
坝的级别 1 2 3 4 5
最小安全 超高 1.5 1.0 0.7 0.5 0.4
最小干滩长度 150 100 70 50 40
最小安全超高的橙色预警阈值取红色预警阈值的1.2倍~1.5倍, 最小干滩长度的橙色
预警阈值取红色预警國值的1.1倍~1.4 倍;
最小安全 超高和最小干滩长度中任一个达 到预警阈值应预警;
4)降水量预警阈值按下表确定:
5.如权利要求2所述的一种面向选冶渣场在线监测系统的时间序列异常检测方法, 其
特征在于, 上线异常检测阶段的步骤如下:
S1: 保存数据处理、 特征工程、 模型训练结果: 使用pickle保存离线下数据处理、 特征工
程、 模型训练的结果, 供 上线后以Restful API接口形式提供在线异常检测;
S2: 监控模型稳定性: 使用稳定度指标PSI量化评估离线样本与在线样本的分布差异,权 利 要 求 书 2/3 页
3
CN 115545115 A
3
专利 一种面向选冶渣场在线监测系统的时间序列异常检测方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:45上传分享