(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210738850.6
(22)申请日 2022.06.27
(71)申请人 山东华科信息技 术有限公司
地址 250101 山东省济南市高新区齐 鲁软
件园C座A408
申请人 北京华清未来能源技 术研究院有限
公司
北京华清智汇能源技 术有限公司
(72)发明人 杨会轩 苏明 李欣 刘金会
(74)专利代理 机构 济南诚智商标专利事务所有
限公司 3710 5
专利代理师 黄晓燕
(51)Int.Cl.
G06F 16/2455(2019.01)
G06F 16/27(2019.01)G06F 16/28(2019.01)
(54)发明名称
一种分布式能源异常数据的筛选方法及系
统
(57)摘要
本发明提供了一种分布式能源异常数据的
筛选方法及系统, 方法包括对分布式能源的原始
数据进行数据类型转换, 将处于预设范围之外的
数据剔除; 在转换后的数据中加入预设因素, 形
成光伏数据集; 在满足第一预设影响因素时, 通
过光伏功率的均值和标准差, 筛选数据集中的异
常数据; 在满足第二预设影响因素时, 将数据集
中的标量数据进行分区, 并对每个 分区进行聚类
运算, 在合并后的聚类结果不满足理想值时, 修
改聚类参数, 根据理想值对应的聚类结果, 筛选
异常数据。 本发 明对于分布式能源 数据中的异常
数据经多次筛选, 结果准确; 且在对海量数据进
行分析时, 通过对数据进行分区分别进行聚类运
算, 且节省成本, 提高了聚类的准确性。
权利要求书2页 说明书6页 附图3页
CN 115292361 A
2022.11.04
CN 115292361 A
1.一种分布式能源异常数据的筛 选方法, 其特 征是, 所述筛 选方法包括以下步骤:
对分布式能源的原 始数据进行 数据类型转换, 将处于预设范围之外的数据剔除;
在转换后的数据中加入预设因素, 形成光伏数据集, 对数据集内的数据进行归一化处
理, 形成标量;
在满足第一预设影响因素时, 通过光伏功率的均值和标准差, 筛选数据集中的异常数
据;
在满足第二预设影响因素时, 将数据集中的标量数据进行分区, 并对每个分区进行聚
类运算, 在合并后的聚类结果不满足理想值时, 修改聚类参数, 根据理想值对应的聚类结
果, 筛选异常数据。
2.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述转换后的数据
类型为jso n格式或DataFrame格式。
3.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述预设因素包括
温度、 光照强度和经纬度信息 。
4.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述通过光伏功率
的均值和标准差, 筛 选数据集中的异常数据具体为:
计算数据集中数据的光伏功率平均值和标准差, 计算光伏功率均值 ±3×标准差, 计算
结果范围之外的数据为异常数据。
5.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述对每个分区进
行聚类运 算的具体过程 为:
S41,获取 数据集中对象个数n和邻域中数据对象数目阈值Mi nPts;
S42,从数据集中任选一个数据对象点p;
S43,以选取的数据对象点p为核心点, 基于预设半径Eps, 计算从p点密度可达的数据对
象点, 形成一个簇;
S44,重复步骤S42和步骤S43的操作, 直至数据集内所有的点被选为核心点, 并进行密
度可达运 算, 分别得到一个簇 。
6.根据权利要求5所述分布式能源异常数据的筛选方法, 其特征是, 所述 聚类运算过程
中, 若选取的对象数据点p在预设半径Eps内含有的数据对象点的数量小于MinPts, 且落在
核心点的邻域内, 则p设置为 边界点。
7.根据权利要求5所述分布式能源异常数据的筛选方法, 其特征是, 所述理想值的确定
具体为:
其中
表示类间距离 差距阵的迹,
表示类内距离差矩阵的迹, z是整 个数据集的均值, zj是第j
个簇cj的均值, N代 表聚类个数, K代 表当前的类, C H(K)值越大, 聚类效果越好。
8.根据权利要求7所述分布式能源异常数据的筛选方法, 其特征是, 所述半径Eps的计
算过程为:权 利 要 求 书 1/2 页
2
CN 115292361 A
2随机选择所在分区内的一 点, 计算该点与分区内其 他点的距离;
将计算的距离值从小到大排序, 得到距离数组D;
计算距离数组D中相邻数据的差值, 形成差值数组subtract, 将差值数组中的数据按有
小到大的顺序排序, 并为差值数组中的每个数据建立索引, 其中差值数组中最大值Smax的
索引为k, 记为dk, 将Smax设置为Eps。
9.根据权利要求8所述分布式能源异常数据的筛选方法, 其特征是, 所述修改聚类参数
具体为:
将预设半径Eps的值取索引dk‑1对应的差值数组中的数据。
10.一种分布式能源异常数据的筛 选系统, 其特 征是, 所述系统包括:
数据类型转换模块, 对分布式能源的原始数据进行数据类型转换, 将处于预设范围之
外的数据剔除;
数据预处理模块, 在转换后的数据中加入预设因素, 形成光伏数据集, 对数据集内的数
据进行归一 化处理, 形成标量;
第一异常数据识别模块, 在满足第 一预设影响因素时, 通过光伏功率的均值和标准差,
筛选数据集中的异常数据;
第二异常数据识别模块, 在满足第二预设影响因素时, 将数据集中的标量数据进行分
区, 并对每个分区进行聚类运算, 在合并后的聚类结果不满足理想值时, 修改聚类参数, 根
据理想值对应的聚类结果, 筛 选异常数据。权 利 要 求 书 2/2 页
3
CN 115292361 A
3
专利 一种分布式能源异常数据的筛选方法及系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:09:10上传分享