(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210929367.6
(22)申请日 2022.08.03
(65)同一申请的已公布的文献号
申请公布号 CN 114996483 A
(43)申请公布日 2022.09.02
(73)专利权人 国网浙江省电力有限公司信息通
信分公司
地址 310007 浙江省杭州市西湖区黄龙路8
号641室
专利权人 国网浙江省电力有限公司
南瑞集团有限公司
联想(北京)有限公司
(72)发明人 蒋炜 魏晓菁 王红凯 冯珺
赵帅 王艺丹 张烨华 徐弢
陈文健 (74)专利代理 机构 杭州华鼎知识产权代理事务
所(普通合伙) 33217
专利代理师 魏亮
(51)Int.Cl.
G06F 16/36(2019.01)
G06K 9/62(2022.01)
(56)对比文件
CN 114817575 A,202 2.07.29
CN 113821636 A,2021.12.21
CN 114612071 A,202 2.06.10
US 2008225751 A1,20 08.09.18
李忠坤. 《基 于文本的实体关系抽取以及知
识图谱的表示推理方法研究》 . 《CNKI》 .2019,第
1-5页.
审查员 张文明
(54)发明名称
基于变分自编码器的事理图谱的数据处理
方法
(57)摘要
本发明公开了一种基于变分自编码器的事
理图谱的数据处理方法, 包括: 获取第一事理图
谱中每个事理节点的数据维度, 根据数据维度对
所有的事理节点进行归类得到多个第一事理节
点集合; 根据每个第一事理节 点集合的数据维度
确定相对应的变 分自编码器, 对第一事理节点集
合内每个事理节点的事理数据 依次编码处理, 得
到多个编码集合数据; 基于变分自编码器的解码
单元, 对相应数据维度的编码集合数据进行解码
处理得到多个第二事理节点集合; 提取每个第二
事理节点集合中的事理数据, 根据事理数据、 每
个事理节点对应的节点标签进行事理图谱的重
组得到第二事理图谱。 本发明可以降低数据信息
损失量, 并高效的实现事理图谱中的数据的迁
移。
权利要求书3页 说明书10页 附图1页
CN 114996483 B
2022.10.21
CN 114996483 B
1.基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于, 包括:
S1, 对第一事理图谱中每个事理节点添加对应的节点标签, 根据每个事理节点的连接
关系得到相对应的节点连接信息;
S2, 获取第一事理图谱中每个事理节点的数据维度, 根据所述数据维度对所有的事理
节点进行归类得到多个第一事理节点 集合;
S3, 根据每个第一事理节点集合的数据维度确定相对应的变分自编码器, 根据所述变
分自编码器的编码单元, 对第一事理节点集合内每个事理节点的事理数据依 次编码处理,
得到多个编码集 合数据;
S4, 在判断将多个编码集合数据迁移至目标空间后, 基于变分自编码器的解码单元, 对
相应数据维度的编码集 合数据进行解码处 理得到多个第二事理节点 集合;
S5, 提取每个第二事理节点集合中的事理数据, 根据所述事理数据、 每个事理节点对应
的节点标签进行事理图谱的重组得到第二事理图谱。
2.根据权利要求1所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述S1包括:
在所述第一事理图谱中随机选择一个事理节点作为起始点, 以所述起始点开始, 为每
个事理节点添加对应的节点标签;
在对每个事理节点添加节点标签时, 确定每个事理节点所对应的连接关系, 得到每个
事理节点相对应的节点连接信息;
统计每个事理节点的节点标签、 节点连接信息生成节点对应表。
3.根据权利要求2所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述S2包括:
获取每个事理节点所对应数据的数据种类, 所述数据种类为文字数据、 图像数据、 音频
数据以及视频 数据中的至少一种;
根据每个事理节点对应数据的数据种类确定相应事理节点的数据维度, 所述数据维度
中具有至少一个种类维度信息, 所述种类维度信息为文字维度信息、 图维度信息、 音频维度
信息以及视频维度信息中的至少一种;
对种类维度信 息的数量和维度类型完全相同的事理节点进行归类, 得到第 一事理节点
集合。
4.根据权利要求3所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述S3包括:
提取每个第一事理节点 集合的所有数据维度得到编码维度信息;
将所述编码 维度信息与预先设置的编码器选择表进行比对, 得到相对应的变分自编码
器, 所述编码器选择表中具有每 个编码维度信息与变分自编码器的对应关系;
基于所述变分 自编码器的编码单元, 对具有相应编码 维度信息的第一事理节点集合进
行编码处 理, 得到相对应的编码集 合数据。
5.根据权利要求 4所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述将所述编码 维度信息与预先设置的编码器选择表进行比对, 得到相对应的变分 自
编码器, 所述编码器选择表中具有每 个编码维度信息与变分自编码器的对应关系, 包括:
若判断编码器选择表中不存在与进行比对的编码 维度信息对应的变分 自编码器, 则将权 利 要 求 书 1/3 页
2
CN 114996483 B
2进行比对的编码维度信息作为差异维度信息;
将所述差异维度信息与编码器选择表中预设的编码维度信息进行一次比对;
若判断差异维度信 息被其中一个预设的编码 维度信息完全包含, 则将所述预设的编码
维度信息对应的变分自编码器, 作为进行比对的编码维度信息的变分自编码器。
6.根据权利要求5所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述将所述编码 维度信息与预先设置的编码器选择表进行比对, 得到相对应的变分 自
编码器, 所述编码器选择表中具有每 个编码维度信息与变分自编码器的对应关系, 包括:
若判断差异维度信 息没有被任意一个预设的编码 维度信息完全包含, 则计算所述差异
维度信息与每一个预设的编码维度信息的相似度得到相似度系数;
将与差异维度信 息相似度系数最高的预设的编码 维度信息对应的变分 自编码器, 作为
进行比对的编码维度信息的变分自编码器。
7.根据权利要求6所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述若判断差异维度信 息没有被任意一个预设的编码 维度信息完全包含, 则计算所述
差异维度信息与每一个预设的编码维度信息的相似度得到相似度系数, 包括:
确定所述差异维度信息中种类维度信息的数量得到第一维度数量;
确定每个预设的编码维度信息中种类维度信息的数量得到第二维度数量;
确定所述差异维度信 息和预设的编码 维度信息中相同种类维度信 息的数量, 得到相同
维度数量;
根据所述第一维度数量、 第二维度数量以及相同维度数量进行计算, 得到差异维度信
息与每一个预设的编码维度信息的相似度, 并根据所述相似度得到相似度系 数, 通过以下
公式计算相似度系数,
其中,
为相似度系数,
为相同维度数量,
为第一维度数量,
为第一计
算权重,
为第二维度数量,
为第二计算权 重。
8.根据权利要求 4所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述S4包括:
在判断将多个编码集合数据迁移至目标空间后, 根据每个编码集合数据的编码维度信
息, 依次确定每 个编码集 合数据所对应的变分自编码器;
根据每个变分 自编码器的解码单元对相应的编码集合数据依次进行解码处理, 得到多
个第二事理节点 集合。
9.根据权利要求8所述的基于变分自编码器的事理图谱的数据处 理方法, 其特 征在于,
所述S5包括:
在判断所有编码集合数据分别被解码处理得到多个相对应的第 二事理节点集合后, 依
次获取每 个事理节点对应的节点标签、 节点连接信息;
在目标空间内建立多个存储单元, 根据每个事理节点对应的节点标签对每个存储单元
进行标记;
将每个事理节点的事理数据分别保存至具有相同节点标签的存储单元内, 建立所述存权 利 要 求 书 2/3 页
3
CN 114996483 B
3
专利 基于变分自编码器的事理图谱的数据处理方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:42:22上传分享