(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211006520.4 (22)申请日 2022.08.22 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 徐艳丽 郝碧波 谷志广 吴恒  孙宁 倪渊 谢国彤  (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 王妍 (51)Int.Cl. G16H 70/00(2018.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) (54)发明名称 一种知识图谱构建方法、 装置、 存储介质及 电子设备 (57)摘要 本申请公开了一种知识图谱构建方法、 装 置、 存储介质及电子设备, 其中方法包括: 获取各 药学数据库对应的若干药学有关的文本数据; 从 各所述文本数据中进行医疗实体关系提取, 获得 与各所述文本数据对应的若干第一医疗实体关 系; 至少对各所述第一医疗实体关系进行整合, 得到目标医疗实体 关系; 基于各所述目标医疗实 体关系构建知识图谱。 本申请中的知识图谱构建 方法将各个药学数据库中的相同实体关系整合 在一起, 得到一个知识体系全面的药学知识图 谱, 提高了知识图谱构建的效率。 权利要求书2页 说明书9页 附图3页 CN 115359922 A 2022.11.18 CN 115359922 A 1.一种知识图谱构建方法, 其特 征在于, 包括: 获取各药学数据库对应的若干药 学有关的文本数据; 从各所述文本数据中进行医疗实体关系提取, 获得与 各所述文本数据对应的若干第 一 医疗实体关系; 至少对各 所述第一医疗实体关系进行整合, 得到目标医疗实体关系; 基于各所述目标医疗实体关系构建知识图谱。 2.如权利要求1所述的方法, 其特征在于, 所述第一医疗实体关系包括: 化合物与化合 物的关系、 化合物与靶点蛋白质的关系、 靶点蛋白质与疾病的关系、 化合物与疾病的关系、 化合物与副作用的关系、 基因与基因的关系、 基因与通路的关系、 基因与疾病的关系、 疾病 与症状的关系中的一种或几种。 3.如权利要求1所述的方法, 其特征在于, 所述方法还包括: 获得若干第二医疗实体关 系, 具体包括: 基于目标疾病, 获得与所述目标疾病有关的各病理实体; 基于各所述病理实体的描述语句, 获得与所述病理实体对应的若干描述词汇; 基于各所述描述词汇, 遍历预定的文献获得包含所述描述词汇和基因实体的描述语 句, 以得到各所述第二医疗实体关系, 其中所述第二医疗实体关系包括: 若干病理实体和基 因实体的关系; 所述至少对各 所述第一医疗实体关系进行整合, 得到目标实体关系, 具体包括: 分别对各所述第 一医疗实体关系和各所述第 二医疗实体关系 进行整合, 得到目标医疗 实体关系。 4.如权利要求1所述的方法, 其特征在于, 所述从各所述文本数据中进行医疗实体关系 提取, 获得与各 所述文本数据对应的第一医疗实体关系, 具体包括: 基于待构建的医疗实体关系, 从与 所述待构建的医疗实体关系 对应的药学数据库中获 取与所述待构建的医疗实体关系有关的文本数据; 所述待构建医疗实体关系为第一医疗实 体与第二医疗实体的映射关系; 在各所述文本数据中对第 一医疗实体、 第 二医疗实体以及第 一医疗实体与第 二医疗实 体的关系进行信息提取, 获得 各所述文本数据对应的初始医疗实体关系; 对各所述初始医疗实体关系进行去重处 理, 得到所述第一医疗实体关系。 5.如权利要求3所述的方法, 其特征在于, 所述分别对各所述第 一医疗实体关系和各所 述第二医疗实体关系进行整合, 得到目标医疗实体关系, 具体包括: 获取同一目标医疗实体在各个非目标 数据库中的第一序列号 值; 获取所述目标医疗实体在目标 数据库的第二序列号 值; 基于所述第 二序列号值更新所述第 一序列号值, 并对更新序列号后的各所述第 一实体 关系和各 所述第二医疗实体关系进行重组, 得到所述目标实体关系。 6.如权利要求3所述的方法, 其特征在于, 所述基于各所述描述词汇, 遍历预定的文献 获得包含所述描述词汇和基因实体的描述语句, 以得到各所述第二医疗实体关系, 具体包 括: 基于所述描述词汇, 采用预设的自然语言处理技术从预定的文献中获取描述词汇与基 因实体的描述语句;权 利 要 求 书 1/2 页 2 CN 115359922 A 2对所述描述词汇与基因实体的描述语句进行审核, 得到各所述病理实体与 所述基因实 体对应的第二实体关系。 7.一种知识图谱构建装置, 其特 征在于, 包括: 获取模块: 用于获取 各药学数据库对应的若干药 学有关的文本数据; 提取模块: 用于从各所述文本数据中进行医疗实体关系提取, 获得与各所述文本数据 对应的若干第一医疗实体关系; 整合模块: 用于 至少对各 所述第一医疗实体关系进行整合, 得到目标医疗实体关系; 构建模块: 用于基于各 所述目标医疗实体关系构建知识图谱。 8.如权利要求7所述的知识图谱构建装置, 其特征在于, 所述提取模块具体用于提取所 述第一医疗实体关系, 所述第一医疗实体关系包括: 药物与药物的关系、 药物与靶点的关 系、 靶点与疾病的关系、 药物与疾病的关系、 药物与副作用的关系、 基因与基因的关系、 基因 与通路的关系 、 基因与疾病的关系 、 疾病与症状的关系中的一种或几种。 9.一种存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算机程序被处 理器执行时实现上述权利要求1 ‑7任一项所述知识图谱构建方法的步骤。 10.一种电子设备, 其特征在于, 至少包括存储器、 处理器, 所述存储器上存储有计算机 程序, 所述处理器在执行所述存储器上 的计算机程序时实现上述权利要求1 ‑7任一项所述 知识图谱构建方法的步骤。权 利 要 求 书 2/2 页 3 CN 115359922 A 3

.PDF文档 专利 一种知识图谱构建方法、装置、存储介质及电子设备

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种知识图谱构建方法、装置、存储介质及电子设备 第 1 页 专利 一种知识图谱构建方法、装置、存储介质及电子设备 第 2 页 专利 一种知识图谱构建方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:40:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。