(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210738850.6 (22)申请日 2022.06.27 (71)申请人 山东华科信息技 术有限公司 地址 250101 山东省济南市高新区齐 鲁软 件园C座A408 申请人 北京华清未来能源技 术研究院有限 公司  北京华清智汇能源技 术有限公司 (72)发明人 杨会轩 苏明 李欣 刘金会  (74)专利代理 机构 济南诚智商标专利事务所有 限公司 3710 5 专利代理师 黄晓燕 (51)Int.Cl. G06F 16/2455(2019.01) G06F 16/27(2019.01)G06F 16/28(2019.01) (54)发明名称 一种分布式能源异常数据的筛选方法及系 统 (57)摘要 本发明提供了一种分布式能源异常数据的 筛选方法及系统, 方法包括对分布式能源的原始 数据进行数据类型转换, 将处于预设范围之外的 数据剔除; 在转换后的数据中加入预设因素, 形 成光伏数据集; 在满足第一预设影响因素时, 通 过光伏功率的均值和标准差, 筛选数据集中的异 常数据; 在满足第二预设影响因素时, 将数据集 中的标量数据进行分区, 并对每个 分区进行聚类 运算, 在合并后的聚类结果不满足理想值时, 修 改聚类参数, 根据理想值对应的聚类结果, 筛选 异常数据。 本发 明对于分布式能源 数据中的异常 数据经多次筛选, 结果准确; 且在对海量数据进 行分析时, 通过对数据进行分区分别进行聚类运 算, 且节省成本, 提高了聚类的准确性。 权利要求书2页 说明书6页 附图3页 CN 115292361 A 2022.11.04 CN 115292361 A 1.一种分布式能源异常数据的筛 选方法, 其特 征是, 所述筛 选方法包括以下步骤: 对分布式能源的原 始数据进行 数据类型转换, 将处于预设范围之外的数据剔除; 在转换后的数据中加入预设因素, 形成光伏数据集, 对数据集内的数据进行归一化处 理, 形成标量; 在满足第一预设影响因素时, 通过光伏功率的均值和标准差, 筛选数据集中的异常数 据; 在满足第二预设影响因素时, 将数据集中的标量数据进行分区, 并对每个分区进行聚 类运算, 在合并后的聚类结果不满足理想值时, 修改聚类参数, 根据理想值对应的聚类结 果, 筛选异常数据。 2.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述转换后的数据 类型为jso n格式或DataFrame格式。 3.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述预设因素包括 温度、 光照强度和经纬度信息 。 4.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述通过光伏功率 的均值和标准差, 筛 选数据集中的异常数据具体为: 计算数据集中数据的光伏功率平均值和标准差, 计算光伏功率均值 ±3×标准差, 计算 结果范围之外的数据为异常数据。 5.根据权利要求1所述分布式能源异常数据的筛选方法, 其特征是, 所述对每个分区进 行聚类运 算的具体过程 为: S41,获取 数据集中对象个数n和邻域中数据对象数目阈值Mi nPts; S42,从数据集中任选一个数据对象点p; S43,以选取的数据对象点p为核心点, 基于预设半径Eps, 计算从p点密度可达的数据对 象点, 形成一个簇; S44,重复步骤S42和步骤S43的操作, 直至数据集内所有的点被选为核心点, 并进行密 度可达运 算, 分别得到一个簇 。 6.根据权利要求5所述分布式能源异常数据的筛选方法, 其特征是, 所述 聚类运算过程 中, 若选取的对象数据点p在预设半径Eps内含有的数据对象点的数量小于MinPts, 且落在 核心点的邻域内, 则p设置为 边界点。 7.根据权利要求5所述分布式能源异常数据的筛选方法, 其特征是, 所述理想值的确定 具体为: 其中 表示类间距离 差距阵的迹, 表示类内距离差矩阵的迹, z是整 个数据集的均值, zj是第j 个簇cj的均值, N代 表聚类个数, K代 表当前的类, C H(K)值越大, 聚类效果越好。 8.根据权利要求7所述分布式能源异常数据的筛选方法, 其特征是, 所述半径Eps的计 算过程为:权 利 要 求 书 1/2 页 2 CN 115292361 A 2随机选择所在分区内的一 点, 计算该点与分区内其 他点的距离; 将计算的距离值从小到大排序, 得到距离数组D; 计算距离数组D中相邻数据的差值, 形成差值数组subtract, 将差值数组中的数据按有 小到大的顺序排序, 并为差值数组中的每个数据建立索引, 其中差值数组中最大值Smax的 索引为k, 记为dk, 将Smax设置为Eps。 9.根据权利要求8所述分布式能源异常数据的筛选方法, 其特征是, 所述修改聚类参数 具体为: 将预设半径Eps的值取索引dk‑1对应的差值数组中的数据。 10.一种分布式能源异常数据的筛 选系统, 其特 征是, 所述系统包括: 数据类型转换模块, 对分布式能源的原始数据进行数据类型转换, 将处于预设范围之 外的数据剔除; 数据预处理模块, 在转换后的数据中加入预设因素, 形成光伏数据集, 对数据集内的数 据进行归一 化处理, 形成标量; 第一异常数据识别模块, 在满足第 一预设影响因素时, 通过光伏功率的均值和标准差, 筛选数据集中的异常数据; 第二异常数据识别模块, 在满足第二预设影响因素时, 将数据集中的标量数据进行分 区, 并对每个分区进行聚类运算, 在合并后的聚类结果不满足理想值时, 修改聚类参数, 根 据理想值对应的聚类结果, 筛 选异常数据。权 利 要 求 书 2/2 页 3 CN 115292361 A 3

.PDF文档 专利 一种分布式能源异常数据的筛选方法及系统

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种分布式能源异常数据的筛选方法及系统 第 1 页 专利 一种分布式能源异常数据的筛选方法及系统 第 2 页 专利 一种分布式能源异常数据的筛选方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:09:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。