(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211082212.X
(22)申请日 2022.09.06
(71)申请人 南京邮电大 学
地址 210037 江苏省南京市 鼓楼区新模范
马路66号
(72)发明人 高辉 王倩倩 杨璐彤
(74)专利代理 机构 南京纵横知识产权代理有限
公司 32224
专利代理师 董建林
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 40/295(2020.01)
G06F 40/284(2020.01)
G06N 3/04(2006.01)
(54)发明名称
一种电力物联网标准知识图谱构建方法及
装置
(57)摘要
本发明公开了一种电力物联网标准知识图
谱构建方法及装置, 包括获取电力物联网标准文
本集, 对所述标准文本集进行预处理; 通过预先
构建的词向量模型对预处理后的标准文本集进
行半监督形式的实体之间的层级关系抽取和实
体识别; 通过映射学习的方法将抽取的实体之间
的层级关系映射到预先构建的初步的知识图谱
中; 基于图神经网络自动学习实体和实体属性关
系之间的特征, 将图结构和节点特征自然地结合
起来训练分类器, 对图谱待分类节 点进行半监督
分类, 构建电力物联网标准知识图谱, 本发明构
建了一个完整的电力物联网标准知识图, 且提高
了知识图谱构建准确率和模型效率。
权利要求书2页 说明书8页 附图1页
CN 115329101 A
2022.11.11
CN 115329101 A
1.一种电力物联网标准知识图谱构建方法, 其特 征在于, 包括:
获取电力物联网标准文本集, 对所述标准文本集进行 预处理;
通过预先构建的词向量模型对预处理后的标准文本集进行半监督形式的实体之间的
层级关系抽取和实体识别;
通过映射学习的方法将抽取的实体之间的层级关系映射到预先构建的初步的知识图
谱中;
基于图神经网络自动学习实体和实体属性关系之间的特征, 将图结构和节点特征自然
地结合起来训练分类器, 对图谱待分类节点进行半监督分类, 构建电力物联网标准知识图
谱。
2.根据权利要求1所述的电力物联网标准知识图谱构建方法, 其特征在于: 所述对所述
标准文本集进 行预处理包括: 对标准文本集进 行分词、 标注、 命名、 实体识别、 合并以及语料
格式转换处 理。
3.根据权利要求2所述的电力物联网标准知识图谱构建方法, 其特征在于, 所述对所述
标准文本集进行 预处理包括如下流 程:
将电力物联网标准文本数据保存到数据库中, 并且把这个数据库中的所有数据直接转
化为结构化形式数据;
根据电力物联网标准知识图谱的需要, 抽取电力物联网标准实体间、 实体与属性间、 以
及属性之间的关系, 形成实体、 属性与关系三元组;
选取电力物联网标准文档 中的简短的语句为单位, 再对所选取的实体进行标注, 接着
扫描之前步骤中已经处 理过的文档, 最终得到含俩个以上实体领域的全部句子 。
4.根据权利要求1所述的电力物联网标准知识图谱构建方法, 其特征在于, 所述通过预
先构建的词向量模型对预处理后的标准文本集进行半监督形式的实体之间的层级关系抽
取和实体识别, 包括:
构建词向量模型, 通过Sk ip‑gram模型训练词向量模型;
对电力物联网标准实体间关系, 采用single ‑pass聚类方法生成得到后面所要依据的
种子集抽取模式, 每抽一次种子集会得到新一类层级之间关系的集合, 与此同时, 形成了3
种标准的上 下文特征向量;
一个新簇等同于一个实例, 算法的输入量是电力物联网标准关系实例列表, 接着计算
得出任一实例in对应的每个聚类簇Clj的相似度, 称为相似度阈值TSim, 若阈值TSim不大于所
有的相似度, 将该种子实例 in加入到对应聚类簇中, 若阈值TSim大于或等于所有的相似度,
就创建一个新的聚类簇 Cm,继续浏览种子集关系实例集,
种子实例集in和聚类簇Clj之间的相似度计算公式为Sim(in,Clj), 再计算in和聚类簇
Clj中所有的种子实例的相似度, 如果大部分相似度值大于阈值TSim, 则返回其中的最大值,
否则返回0, 两个实例间的相似度计算公式如下:
Sim=(Sn,Sj)=α·cos(BEFi,BEFj)+β·cos(BETi,BETj)+γ·cos(AFTi,AFTj)
(1)
其中, α、 β 、 γ是向量的权重, BEF是第一个实体前词, BET是两个实体间 的词, AFT是第二
个实体后的词;
输入电力物联网标准实例, 输出关系模式。权 利 要 求 书 1/2 页
2
CN 115329101 A
25.根据权利要求 4所述的电力物联网标准知识图谱构建方法, 其特 征在于,
对所有的模式进行打分, 对模式进行打分主要是根据抽选出的电力物联网标准实例的
关系, 打分等级分为P、 N、 U; 当所选的电力物联网标准实体之间的关系等同于种子集中, 那
么就说明是积极的, 就加入到集合P 中; 若所选的电力物联网标准实例关系不同于种子集,
则说明是消极的, 就加入到集合N中; 若所抽选的电力物联网标准实例关系有的在种子集
里, 而有的不完全相同即未知, 则可以加入集 合U中;
模式P的置信度具体 计算如下式所示:
其中, Wn和Wm分别对应N和U的权 重,
模式的置信度权 重计算公式如下:
其中, ξ 是抽取 标准实例i的模式,Ci是标准实例i对应的上 下文。
6.根据权利要求1所述的电力物联网标准知识图谱构建方法, 其特征在于, 所述对图谱
待分类节点进 行半监督分类, 构建电力物联网标准知识图谱, 包括: 将构建的初步电力物联
网标准知识图谱输入到图卷积层, 再从初步的电力物联网标准知识图谱直接将所有节点的
特征信息提取出来, 接着输入到特征提取层, 训练关系三元 组分类器, 得到电力物联网标准
知识图谱节点的完整的特 征信息。
7.根据权利 要求1所述的电力物联网标准知识图谱构 建方法, 其特征在于, 使用p y2neo
库将基于层次分析法、 词向量和图神经网络的关系三元 组存储到Neo4j图形数据库中, 利用
开源可视化库E charts完成电力物联网标准知识图谱的构建。
8.一种电力物联网标准知识图谱构建装置, 其特 征在于, 包括:
预处理单元, 用于获取电力物联网标准文本集, 对所述标准文本集进行 预处理;
层级关系抽取单元, 用于通过预先构建的词向量模型对预处理后的标准文本集进行半
监督形式的实体之间的层级关系抽取和实体识别;
映射单元, 用于通过映射学习的方法将抽取的实体之间的层级关系映射到预先构建的
初步的知识图谱中;
图谱构建单元, 用于基于 图神经网络自动学习实体和实体属性关系之间的特征, 将图
结构和节点特征自然地结合起来训练分类器, 对图谱待分类节点进行半监督分类, 构建电
力物联网标准知识图谱。
9.一种电力物联网标准知识图谱构建装置, 其特 征在于: 包括处 理器及存 储介质;
所述存储介质用于存 储指令;
所述处理器用于根据所述指令进行操作以执行根据权利要求1~7任一项所述方法的
步骤。
10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于: 该程序被处理器
执行时实现权利要求1~7任一项所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 115329101 A
3
专利 一种电力物联网标准知识图谱构建方法及装置
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:40:22上传分享