(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210934927.7
(22)申请日 2022.08.05
(71)申请人 国网湖北省电力有限公司电力科 学
研究院
地址 430077 湖北省武汉市洪山区徐 东大
街227号
申请人 国网湖北省电力有限公司
国家电网有限公司
许继集团有限公司
(72)发明人 柳丹 冀肖彤 罗恒 胡畔
谭道军 夏勇军 王伟 邓万婷
陈孝明 江克证 熊平 肖繁
康逸群 叶畅 曹侃 蔡萱
何宇航
(74)专利代理 机构 武汉楚天专利事务所 421 13
专利代理师 孔敏(51)Int.Cl.
G06F 16/35(2019.01)
G06F 16/36(2019.01)
G06N 3/04(2006.01)
G06Q 50/06(2012.01)
H02J 13/00(2006.01)
(54)发明名称
风电场多 源异构数据处 理方法及装置
(57)摘要
一种风电场多源异构数据处理方法及 装置,
该方法包括: 获取包含风电场主电气设备运行信
息的多源异构数据; 从多源异构数据中提取风电
场主电气设备运行信息集合; 对风电场主电气设
备运行信息集合进行标注, 生成训练样本集合;
通过训练样本集合训练GAN ‑LSTM网络和RNN ‑
LSTM网络, 将GAN ‑LSTM网络和RNN ‑LSTM网络融
合; 将采集的实时风电场主电气设备运行信息输
入GAN‑LSTM网络、 RNN ‑LSTM网络和融合后的网
络, 得到诊断结果; 根据诊断结果确定对风电场
主电气设备的诊断。 本发明能从多源异构数据中
准确地提取出风电场主电气设备运行信息集合,
通过特有的神经网络模型及训练方法提高诊断
的精准性和智能性。
权利要求书4页 说明书17页 附图5页
CN 115391523 A
2022.11.25
CN 115391523 A
1.一种风电场多源异构数据处 理方法, 其特 征在于: 包括如下步骤:
获取包含风电场主电气设备运行信息的多源异构数据;
从所述多源异构数据中提取风电场主电气设备运行信息集 合;
对所述风电场主电气设备运行信息集 合进行标注, 生成训练样本集 合;
通过所述训练样本集合分别训练GAN ‑LSTM网络和RNN ‑LSTM网络, 并将GAN ‑LSTM网络和
RNN‑LSTM网络进行融合, 得到融合后的网络;
将采集到的实时风电场主电气设备运行信息分别输入GAN ‑LSTM网络、 RNN ‑LSTM网络和
融合后的网络, 分别得到一个诊断结果;
根据所述诊断结果确定对风电场主电气设备的诊断。
2.如权利要求1所述的风电场多源异构数据处理方法, 其特征在于: 从所述多源异构数
据中提取风电场主电气设备运行信息集 合采用多源异构数据提取 方法, 具体包括:
步骤2.1、 定义风电场主电气设备运行信 息的数据结构, 数据结构由信息元素和信息元
素的具体元素属性组成, 信息元素包括定位信息元素、 类型信息元素和时间信息元素, 定位
信息元素表征风电场主电气设备的位置表示, 类型信息元素表征风电场主电气设备所发生
的事件, 时间信息元 素表征事 件的起止时间;
步骤2.1、 将在描述风电场主电气设备运行信 息过程中起关键作用的词 汇作为特征词,
根据这些词汇在多源异构数据中起到的语法作用, 定义用于填充风电场主电气设备运行信
息元素属性的特 征词类型, 并按特 征词类型构建专业词库;
步骤2.3、 基于步骤2.1定义的风电场主电气设备运行信息的数据结构和步骤2.2定义
的特征词类型, 结合多源异构数据中描述风电场主电气设备发生的事件的语法结构特征和
句法结构特 征, 制定基本提取模式, 通过规则对基本提取模式进行扩展, 得到提取模式库;
步骤2.4、 将采集的多源异构数据作为输入文本, 对输入文本进行预处理, 得到输入文
本的词汇序列;
步骤2.5、 利用步骤2.2的专业词库识别步骤2.4所得词 汇序列中出现的特征词, 并按照
特征词在输入文本中的先后顺序记录特征词的类型, 生成输入文本的特征词类型序列, 通
过判断风电场主电气设备运行信息元素属 性所需的特征词类型是否完整对输入文本进行
过滤;
步骤2.6、 对输入文本断句, 根据断句得到的句子集合, 将步骤2.5所得输入文本的特征
词类型序列分割成与句子集合对应的特征词类型序列集合, 利用动态 时间弯曲DTW距离度
量该特征词类型序列集合中各特征词类型序列与提取模式库中各提取模式的特征词类型
序列的相似度, 选择相似度最高且小于给定阈值的提取模式作为该句子的匹配提取模式;
步骤2.7、 遍历输入文本的句子集合, 若句子集合中的句子在步骤2.6取得匹配提取模
式, 则根据该匹配提取模式的元素属性序列将该句子中的特征词填充至对应的风电场主电
气设备运行信息元素属 性, 生成该句 子对应的风电场主电气设备运行信息, 得到输入文本
已提取定位信息元 素和类型信息元 素的风电场主电气设备运行信息集 合;
步骤2.8、 根据多源异构数据中对时间的不同表达形式, 制定提取年、 月、 日、 时、 分、 秒
时间要素数值的正则表达式集合, 结合判断规则利用该正则表达式集合从输入文本中提取
时间要素数值, 将这些时间要 素数值组合成事件开始时间元素属性和事件 结束时间元素属
性, 得到风电场主电气设备运行信息的时间信息元 素;权 利 要 求 书 1/4 页
2
CN 115391523 A
2步骤2.9、 将步骤2.8提取的时间信息元素填充至步骤2.7得到的风电场主电气设备运
行信息集合中, 得到风电场主电气设备运行信息元素完整的风电场主电气设备运行信息集
合。
3.如权利要求2所述的风电场多源异构数据处理方法, 其特征在于: 所述提取模式包括
特征词类型序列和元素属性序列两个部 分; 特征词类型序列是在多源异构数据中描述事件
时所用特征词的类型的先后顺序排列, 提取模式中特征词类型序列的功能是判断多源异构
数据能否与该提取模式匹配; 元素属 性序列与特征词类型序列长度相同, 元素属 性序列中
的序列项是特征词类型序列中相同位置序列项在风电场主电气设备运行信息中对应的元
素属性, 元素属性序列的功能是将多源异构数据出现的特征词映射至风电场主电气设备运
行信息对应的元 素属性中。
4.如权利要求2所述的风电场多源异构数据处理方法, 其特征在于: 步骤2.4的预处理
包括删除输入文本中的重复信息和对输入文本作中文分词。
5.如权利要求2所述的风电场多源异构数据处理方法, 其特征在于: 步骤2.7中的遍历
完成后, 判断所得风电场主电气设备运行信息的定位信息元素的属性和类型信息元素的属
性是否完整, 如果不完整, 则利用补充规则对风电场主电气设备运行信息缺失的定位信息
元素的属性或类型信息元 素的属性进行填补。
6.如权利要求2所述的风电场多源异构数据处理方法, 其特征在于: 将采集到的实时风
电场主电气设备运行信息分别输入GAN ‑LSTM网络、 RNN ‑LSTM网络和融合后的网络, 分别得
到第一诊断结果、 第二诊断结果和第三诊断结果; 根据所述诊断结果确定对风电场主电气
设备的诊断, 具体包括:
1)若第一诊断结果、 第二诊断结果和第三诊断结果完全相同, 则根据任一个诊断结果
确定故障设备及其所在位置;
2)若第一诊断结果、 第二诊断结果和第三诊断结果不完全相同, 根据各种诊断结果中
故障设备 所在位置的关系, 确定故障设备及其 位置;
3)若第一诊断结果、 第二诊断结果和第三诊断结果完全不相同, 则返回执行获取包含
风电场主电气设备运行信息的多源异构数据的步骤。
7.一种风电场多源异构数据处 理装置, 其特 征在于, 包括:
多源异构数据获取模块, 用于获取包 含风电场主电气设备运行信息的多源异构数据;
信息提取模块, 用于从所述多源异构数据中提取风电场主电气设备运行信息集 合;
训练样本生成模块, 用于对所述风电场主电气设备运行信息集合进行标注, 生成训练
样本集合;
网络训练及融合模块, 用于通过所述训练样本集合分别训练GAN ‑LSTM网络和RNN ‑LSTM
网络, 并将GAN ‑LSTM网络和RN N‑LSTM网络进行融合, 得到融合后的网络;
诊断模块, 用于将采集到的实时风电场主电气设备运行信息分别输入GAN ‑LSTM网络、
RNN‑LSTM网络和融合后的网络, 分别 得到一个诊断结果, 根据所述诊断结果确 定对风电场
主电气设备的诊断。
8.如权利要求7 所述的风电场多源异构数据处 理装置, 其特 征在于:
信息提取模块从所述多源异构数据中提取风电场主电气设备运行信息集合, 具体包
括:权 利 要 求 书 2/4 页
3
CN 115391523 A
3
专利 风电场多源异构数据处理方法及装置
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:44:48上传分享