(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210051806.8
(22)申请日 2022.01.17
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 王鹏 祝恒书 董政 姚开春
秦川
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
代理人 章愫 刘芳
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/242(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)
(54)发明名称
对象关系网络的构建方法、 装置和电子设备
(57)摘要
本公开提供了一种对象关系网络的构建方
法、 装置和电子设备, 涉及深度神经网络、 深度学
习等人工智 能技术领域。 具体实现方案为: 通过
提取多个对象各自对应的文本内容中的关键词,
得到各对象对应的关键词; 并根据对象对应的关
键词, 确定多个对象之间的相似度; 再根据多个
对象之间的相似度, 构建多个对象之间的对象关
系网络。 鉴于通过多个对象之间的相似度, 构建
的对象关系网络可以准确地描述对象之间的关
系紧密程度, 因此, 通过构建的对象关系网络可
以有效地多个对象进行 管理。
权利要求书4页 说明书14页 附图6页
CN 114416990 A
2022.04.29
CN 114416990 A
1.一种对象关系网络的构建方法, 包括:
提取多个对象各自对应的文本内容中的关键词, 得到各对象对应的关键词;
根据所述对象对应的关键词, 确定所述多个对象之间的相似度;
根据所述多个对象之间的相似度, 构建所述多个对象之间的对象关系网络 。
2.根据权利要求1所述的方法, 其中, 所述提取多个对象各自对应的文本内容中的关键
词, 得到各对象对应的关键词, 包括:
将所述对象对应的文本内容输入至关键词提取模型中, 通过所述关键词提取模型中的
分词模型, 得到多个组合词汇各自对应的向量表征;
将所述多个组合词汇各自对应的向量表征, 输入至所述关键词提取模型中的分类模型
中, 得到所述对象对应的关键词。
3.根据权利要求2所述的方法, 其中, 所述通过所述关键词提取模型中的分词模型, 得
到多个组合词汇各自对应的向量表征, 包括:
通过所述分词模型提取 所述文本内容中的多个分词;
根据所述分词对应的词嵌入向量和词性向量, 确定所述分词对应的向量表征;
根据所述分词对应的向量表征, 确定所述多个组合词 汇各自对应的向量表征; 其中, 所
述多个组合词汇是由多个相邻分词构成的。
4.根据权利要求1 ‑3任一项所述的方法, 其中, 所述多个对象包括第一对象和第二对
象, 根据所述对象对应的关键词, 确定所述第一对象和所述第二对象之间的相似度, 包括:
根据所述第 一对象和所述第 二对象各自对应的关键词, 确定所述第 一对象和所述第 二
对象对应的交集关键词和并集关键词;
根据所述第 一对象对应的关键词确定所述第 一对象对应的第 一向量表征, 及根据 所述
第二对象对应的关键词确定所述第二对象对应的第二向量表征;
根据所述交集关键词、 所述并集关键词、 所述第 一向量表征以及所述第 二向量表征, 确
定所述第一对象和所述第二对象之间的相似度。
5.根据权利要求4所述的方法, 其中, 所述根据 所述交集关键词、 所述并集关键词、 所述
第一向量表征以及所述第二向量表征, 确定所述第一对 象和所述第二对 象之间的相似度,
包括:
根据所述交集关键词的数量与所述并集关键词的数量的比值, 确定所述第 一对象和所
述第二对象之间的第一相似度;
根据所述第 一向量表征和所述第 二向量表征, 确定所述第 一对象和所述第 二对象之间
的第二相似度;
根据所述第一相似度和所述第二相似度, 确定第一对象和所述第二对象之间的相似
度。
6.根据权利要求1 ‑5任一项所述的方法, 其中, 所述根据所述多个对象之间的相似度,
构建所述多个对象之间的对象关系网络, 包括:
根据所述多个对象之间的相似度, 从所述多个对象中确定目标对象; 其中, 所述目标对
象对应的相似度大于预设阈值;
确定所述目标对象对应的中心度; 其中, 所述中心度用于指示所述目标对象在待生成
的对象关系网络中的位置;权 利 要 求 书 1/4 页
2
CN 114416990 A
2根据所述目标对象对应的中心度, 构建所述对象关系网络 。
7.根据权利要求6所述的方法, 其中, 所述根据所述目标对象对应的中心度, 构建所述
对象关系网络, 包括:
对所述目标对象进行聚类, 得到多个聚类结果; 其中, 不同聚类结果中的目标对象在所
述待生成的对象关系网络中的节点标识不同;
根据所述目标对象对应的中心度和节点标识, 构建所述对象关系网络 。
8.一种分类模型的训练方法, 包括:
获取多个样本组合分词; 其中, 各样本组合分词对应有标签, 所述标签用于指示样本组
合分词是否为关键词;
将多个样本组合分词对应的样本向量表征输入至初始分类模型中, 得到所述各样本组
合分词对应的预测结果; 其中, 预测结果用于指示样本组合分词是否为关键词;
根据所述样本组合分词对应的预测结果和标签, 更新所述初始分类模型的网络参数。
9.根据权利要求8所述的方法, 其中, 所述根据所述样本组合分词对应的预测结果和标
签, 更新所述初始分类模型的网络参数, 包括:
根据所述样本组合分词对应的预测结果和标签, 构造所述样本组合分词对应的损失函
数;
根据所述样本组合分词对应的损失函数, 更新所述初始分类模型的网络参数。
10.一种对象关系网络的构建装置, 包括:
提取单元, 用于提取多个对象各自对应的文本内容中的关键词, 得到各对象对应的关
键词;
确定单元, 用于根据所述对象对应的关键词, 确定所述多个对象之间的相似度;
构建单元, 用于根据所述多个对象之间的相似度, 构建所述多个对象之间的对象关系
网络。
11.根据权利要求10所述的装置, 其中, 所述提取单元包括第 一提取模块和第 二提取模
块;
所述第一提取模块, 用于将所述对象对应的文本内容输入至关键词提取模型中, 通过
所述关键词提取模型中的分词模型, 得到多个组合词汇各自对应的向量表征;
所述第二提取模块, 用于将所述多个组合词汇各自对应的向量表征, 输入至所述关键
词提取模型中的分类模型中, 得到所述对象对应的关键词。
12.根据权利要求11所述的装置, 其中, 所述第一提取模块包括第一提取子模块、 第二
提取子模块以及第三 提取子模块;
所述第一 提取子模块, 用于通过 所述分词模型提取 所述文本内容中的多个分词;
所述第二提取子模块, 用于根据所述分词对应的词嵌入向量和词性向量, 确定所述分
词对应的向量表征;
所述第三提取子模块, 用于根据所述分词对应的向量表征, 确定所述多个组合词汇各
自对应的向量表征; 其中, 所述多个组合词汇是由多个相邻分词构成的。
13.根据权利要求10 ‑12任一项所述的装置, 其中, 所述多个对象包括第一对象和第二
对象, 所述确定单 元包括第一确定模块、 第二确定模块以及第三确定模块;
所述第一确定模块, 用于根据所述第一对象和所述第二对象各自对应的关键词, 确定权 利 要 求 书 2/4 页
3
CN 114416990 A
3
专利 对象关系网络的构建方法、装置和电子设备
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:53上传分享