文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211006520.4 (22)申请日 2022.08.22 (71)申请人 平安科技 (深圳) 有限公司 地址 518000 广东省深圳市福田街道福安 社区益田路5 033号平安金融 中心23楼 (72)发明人 徐艳丽 郝碧波 谷志广 吴恒 孙宁 倪渊 谢国彤 (74)专利代理 机构 北京中强智尚知识产权代理 有限公司 1 1448 专利代理师 王妍 (51)Int.Cl. G16H 70/00(2018.01) G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/295(2020.01) (54)发明名称 一种知识图谱构建方法、 装置、 存储介质及 电子设备 (57)摘要 本申请公开了一种知识图谱构建方法、 装 置、 存储介质及电子设备, 其中方法包括: 获取各 药学数据库对应的若干药学有关的文本数据; 从 各所述文本数据中进行医疗实体关系提取, 获得 与各所述文本数据对应的若干第一医疗实体关 系; 至少对各所述第一医疗实体关系进行整合, 得到目标医疗实体 关系; 基于各所述目标医疗实 体关系构建知识图谱。 本申请中的知识图谱构建 方法将各个药学数据库中的相同实体关系整合 在一起, 得到一个知识体系全面的药学知识图 谱, 提高了知识图谱构建的效率。 权利要求书2页 说明书9页 附图3页 CN 115359922 A 2022.11.18 CN 115359922 A 1.一种知识图谱构建方法, 其特 征在于, 包括: 获取各药学数据库对应的若干药 学有关的文本数据; 从各所述文本数据中进行医疗实体关系提取, 获得与 各所述文本数据对应的若干第 一 医疗实体关系; 至少对各 所述第一医疗实体关系进行整合, 得到目标医疗实体关系; 基于各所述目标医疗实体关系构建知识图谱。 2.如权利要求1所述的方法, 其特征在于, 所述第一医疗实体关系包括: 化合物与化合 物的关系、 化合物与靶点蛋白质的关系、 靶点蛋白质与疾病的关系、 化合物与疾病的关系、 化合物与副作用的关系、 基因与基因的关系、 基因与通路的关系、 基因与疾病的关系、 疾病 与症状的关系中的一种或几种。 3.如权利要求1所述的方法, 其特征在于, 所述方法还包括: 获得若干第二医疗实体关 系, 具体包括: 基于目标疾病, 获得与所述目标疾病有关的各病理实体; 基于各所述病理实体的描述语句, 获得与所述病理实体对应的若干描述词汇; 基于各所述描述词汇, 遍历预定的文献获得包含所述描述词汇和基因实体的描述语 句, 以得到各所述第二医疗实体关系, 其中所述第二医疗实体关系包括: 若干病理实体和基 因实体的关系; 所述至少对各 所述第一医疗实体关系进行整合, 得到目标实体关系, 具体包括: 分别对各所述第 一医疗实体关系和各所述第 二医疗实体关系 进行整合, 得到目标医疗 实体关系。 4.如权利要求1所述的方法, 其特征在于, 所述从各所述文本数据中进行医疗实体关系 提取, 获得与各 所述文本数据对应的第一医疗实体关系, 具体包括: 基于待构建的医疗实体关系, 从与 所述待构建的医疗实体关系 对应的药学数据库中获 取与所述待构建的医疗实体关系有关的文本数据; 所述待构建医疗实体关系为第一医疗实 体与第二医疗实体的映射关系; 在各所述文本数据中对第 一医疗实体、 第 二医疗实体以及第 一医疗实体与第 二医疗实 体的关系进行信息提取, 获得 各所述文本数据对应的初始医疗实体关系; 对各所述初始医疗实体关系进行去重处 理, 得到所述第一医疗实体关系。 5.如权利要求3所述的方法, 其特征在于, 所述分别对各所述第 一医疗实体关系和各所 述第二医疗实体关系进行整合, 得到目标医疗实体关系, 具体包括: 获取同一目标医疗实体在各个非目标 数据库中的第一序列号 值; 获取所述目标医疗实体在目标 数据库的第二序列号 值; 基于所述第 二序列号值更新所述第 一序列号值, 并对更新序列号后的各所述第 一实体 关系和各 所述第二医疗实体关系进行重组, 得到所述目标实体关系。 6.如权利要求3所述的方法, 其特征在于, 所述基于各所述描述词汇, 遍历预定的文献 获得包含所述描述词汇和基因实体的描述语句, 以得到各所述第二医疗实体关系, 具体包 括: 基于所述描述词汇, 采用预设的自然语言处理技术从预定的文献中获取描述词汇与基 因实体的描述语句;权 利 要 求 书 1/2 页 2 CN 115359922 A 2对所述描述词汇与基因实体的描述语句进行审核, 得到各所述病理实体与 所述基因实 体对应的第二实体关系。 7.一种知识图谱构建装置, 其特 征在于, 包括: 获取模块: 用于获取 各药学数据库对应的若干药 学有关的文本数据; 提取模块: 用于从各所述文本数据中进行医疗实体关系提取, 获得与各所述文本数据 对应的若干第一医疗实体关系; 整合模块: 用于 至少对各 所述第一医疗实体关系进行整合, 得到目标医疗实体关系; 构建模块: 用于基于各 所述目标医疗实体关系构建知识图谱。 8.如权利要求7所述的知识图谱构建装置, 其特征在于, 所述提取模块具体用于提取所 述第一医疗实体关系, 所述第一医疗实体关系包括: 药物与药物的关系、 药物与靶点的关 系、 靶点与疾病的关系、 药物与疾病的关系、 药物与副作用的关系、 基因与基因的关系、 基因 与通路的关系 、 基因与疾病的关系 、 疾病与症状的关系中的一种或几种。 9.一种存储介质, 其特征在于, 所述存储介质存储有计算机程序, 所述计算机程序被处 理器执行时实现上述权利要求1 ‑7任一项所述知识图谱构建方法的步骤。 10.一种电子设备, 其特征在于, 至少包括存储器、 处理器, 所述存储器上存储有计算机 程序, 所述处理器在执行所述存储器上 的计算机程序时实现上述权利要求1 ‑7任一项所述 知识图谱构建方法的步骤。权 利 要 求 书 2/2 页 3 CN 115359922 A 3
专利 一种知识图谱构建方法、装置、存储介质及电子设备
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-17 23:40:31
上传分享
举报
下载
原文档
(473.2 KB)
分享
友情链接
NB-T 10876-2021 水电工程建设征地移民安置规划设计规范.pdf
GB-T 34975-2017 信息安全技术 移动智能终端应用软件安全技术要求和测试评价方法.pdf
贵州省大数据安全保障条例.pdf
GM-T 0044.2-2016 SM9标识密码算法 第2部分:数字签名算法.pdf
GB-T 17903.1-2024 信息技术 安全技术 抗抵赖 第1部分:概述.pdf
IPC-A-610 电子组件的可接受性.pdf
GB-T 37655-2019 光伏与建筑一体化发电系统验收规范.pdf
腾讯安全 物联网汽车安全.pdf
GB-T 39155-2020 金属和合金的腐蚀 海港设施的阴极保护.pdf
DB41-T 1787-2019 加油站“边卸边加”技术规范 河南省.pdf
GB-T 42416-2023 M100车用甲醇燃料.pdf
T-CI 038—2023 污泥脱水调理剂.pdf
SN-T 5415.4-2022 输“一带一路”沿线国家产品安全项目检验指南 纺织品 第4部分:东南亚.pdf
高耗能特种设备节能监督管理办法.pdf
GB-T 19828-2018 食盐定点生产企业质量管理技术规范.pdf
JR-T0072-2020 金融行业网络安全等级保护测评指南.pdf
GB-T 20258.4-2019 基础地理信息要素数据字典 第4部分:1∶250 000 1∶500 000 1∶1 000 000 比例尺.pdf
T-CSA -TR008—2019 类太阳光LED术语定义及相关问题研究.pdf
GB-T 41773-2022 信息安全技术 步态识别数据安全要求.pdf
GB-T 42582-2023 信息安全技术 移动互联网应用程序(App)个人信息安全测评规范.pdf
1
/
3
15
评价文档
赞助2元 点击下载(473.2 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。