(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211130075.2 (22)申请日 2022.09.16 (71)申请人 西南医科 大学附属医院 地址 646000 四川省 泸州市太平街25号 (72)发明人 李光荣 刘靳波 冯佳 何文伟  (74)专利代理 机构 成都知都云专利代理事务所 (普通合伙) 51306 专利代理师 饶振浪 (51)Int.Cl. G16H 15/00(2018.01) G06F 16/36(2019.01) G06F 40/279(2020.01) G06F 16/28(2019.01) G06F 16/215(2019.01) G06K 9/62(2022.01) (54)发明名称 基于临床检验医学大数据的医学检验报告 分析系统及方法 (57)摘要 本发明属于医学检验技术领域, 公开了一种 基于临床检验医学大数据的医学检验报告分析 系统及方法, 系统包括人机交互单元、 报告预处 理单元、 知识图谱构建单元、 数据库单元、 实体识 别单元以及报告分析单元。 方法包括如下步骤: 基于临床检验医学大数据更新公共知识图谱; 接 收用户的用户关注数据和上传的医学检验报告 文件, 并对医学检验报告文件进行预处理; 对医 学检验报告数据进行实体识别; 构建并存储个人 知识图谱; 提取个人知 识图谱对用户的报告实体 数据进行分析, 向人机交互单元返回报告实体数 据和对应的报告分析结果。 本发 明解决了现有技 术存在的医学检验报告的信息量庞大、 患者时间 成本投入大、 分析困难以及医疗成本投入大的问 题。 权利要求书3页 说明书7页 附图1页 CN 115472256 A 2022.12.13 CN 115472256 A 1.一种基于临床检验医学大数据的医学检验报告分析系统, 其特征在于: 包括人机交 互单元、 报告预处理单元、 知识图谱构建单元、 数据库单元、 实体识别单元以及报告分析单 元, 所述的数据库单元分别与人机交互单元、 报告预处理单元、 知识图谱构建单元、 实体识 别单元以及报告分析单元连接, 所述的知识图谱构建单元连接有外部的临床 检验医学数据 库; 人机交互单元, 用于根据用户信息对用户进行登录和验证, 连接数据库单元中对应的 用户数据库, 接收用户的用户关注数据和上传的医学检验报告文件并存储至对应的用户数 据库, 医学检验报告文件包括图像类型的医学检验报告文件和文字类型的医学检验报告文 件, 提取用户的报告实体数据和对应的报告分析 结果; 报告预处理单元, 用于对医学检验报告文件进行预处理, 包括对图像类型的医学检验 报告文件进 行格式转换、 图像处理以及文字识别, 得到医学检验报告 数据, 将文字类型的医 学检验报告文件直接转化成医学检验报告数据, 并将医学检验报告数据存储至数据库单 元; 知识图谱构建单元, 用于采集临床检验医学大数据构建或更新公共知识图谱, 并根据 用户关注数据使用带权路径学习方法对公共知识图谱进行优化, 构建并存储个人知识图 谱; 数据库单元, 根据不同的用户信息设置有用户数据库, 用户数据库用于存储用户关注 数据、 医学检验报告文件、 医学检验报告 数据、 报告实体数据、 报告分析结果、 个人知识图谱 以及报告分析 数据, 并设置有公共知识图谱数据库, 用于存 储公共知识图谱; 实体识别单元, 用于对医学检验报告数据进行实体识别, 得到并存储对应的报告实体 数据; 报告分析单元, 用于提取个人知识图谱对用户的报告实体数据进行分析, 得到并存储 对应的报告分析 结果。 2.根据权利要求1所述的基于临床检验医学大数据的医学检验报告分析系统, 其特征 在于: 所述的知识图谱构建单元包括依次连接的数据采集模块、 知识抽取模块、 知识融合模 块、 知识加工模块以及图谱优化模块, 所述的数据采集模块与外部的临床检验医学数据库 连接, 所述的知识加工模块和图谱 优化模块均 与数据库单 元连接。 3.根据权利要求2所述的基于临床检验医学大数据的医学检验报告分析系统, 其特征 在于: 所述的实体识别单元设置有实体识别模型, 所述的实体识别模型采用BERT ‑BiLSTM‑ CRF算法建立, 所述的实体识别模 型包括依次连接的BERT模块、 BiLSTM模块以及CRF模块, 所 述的BERT模块和CRF模块均 与数据库单 元连接。 4.根据权利要求3所述的基于临床检验医学大数据的医学检验报告分析系统, 其特征 在于: 所述的报告 预处理单元包括文本处理模块, 依次连接的格式转换模块、 图像处理模块 以及文字识别模块, 所述的文本处理模块、 格式转换模块以及文字识别模块均与数据库单 元连接。 5.根据权利要求4所述的基于临床检验医学大数据的医学检验报告分析系统, 其特征 在于: 所述的文字识别模块设置有文字识别模型, 所述的文字识别模型采用VGGNet ‑16‑ CTPN‑DMDAN‑seq2seq算法建立, 所述的文字识别模型包括依次连接的VGGNet ‑16子模块、 CTPN子模块、 DMDAN子模块以及seq2seq子模块。权 利 要 求 书 1/3 页 2 CN 115472256 A 26.一种基于临床检验医学大数据的医学检验报告分析方法, 基于如权利要求5所述的 医学检验报告分析系统, 其特 征在于: 包括如下步骤: 基于临床检验医学 大数据更新公共知识图谱; 接收用户的用户关注数据和上传的医学检验报告文件, 并对医学检验报告文件进行预 处理, 得到用户的医学检验报告数据; 对医学检验报告数据进行实体识别, 得到并存 储对应的报告实体数据; 根据用户关注数据使用带权路径学习方法对公共知识图谱进行优化, 构建并存储个人 知识图谱; 提取个人知识图谱对用户的报告实体数据进行分析, 向人机交互单元返回报告实体数 据和对应的报告分析 结果。 7.根据权利要求6所述的基于临床检验医学大数据的医学检验报告分析方法, 其特征 在于: 基于临床检验医学 大数据更新公共知识图谱, 包括如下步骤: 采集外部的临床检验医学数据库存储的结构化数据、 半结构化数据以及非结构化数 据, 并对采集到的数据进行清洗, 得到清洗后数据; 采集外部的第三方知识库中的外 部知识图谱; 对清洗后数据进行实体抽取、 关系抽取以及属性抽取, 得到初始素 材数据; 根据外部知识图谱对知识图谱材料数据进行知识融合, 并进行共指消解、 实体消歧、 实 体对齐以及 知识合并, 得到融合素 材数据; 提取外部知识图谱或历史的公共知识图谱进行知识推理, 得到已知的知识关系, 结合 已知的知识关系对融合素材数据进行质量评价, 剔除质量低于预设阈值的融合素材数据, 更新公共知识图谱。 8.根据权利要求7所述的基于临床检验医学大数据的医学检验报告分析方法, 其特征 在于: 对医学检验报告数据进行实体识别, 包括如下步骤: 提取医学检验报告数据中语义信息和字符特 征, 得到由连续字向量构成的初始序列; 提取初始序列的上 下文特征信息, 得到由连续词向量构成的最终序列; 根据学习特征矩阵转移概率对最终序列的相邻词向量的标签进行约束, 得到由优化后 词向量构成的最优序列, 即报告实体数据, 所述的优化后词向量为医学检验报告数据的实 体。 9.根据权利要求8所述的基于临床检验医学大数据的医学检验报告分析方法, 其特征 在于: 所述的用户关注数据为用户关注的实体、 关系或属性; 根据用户关注数据使用带权路径学习方法对公共知识图谱进行优化, 包括如下步骤: 将公共知识图谱中包 含用户关注的全部的实体、 关系或属性的路径设置为 最高权重; 将公共知识图谱中包含用户关注的部分的实体、 关系或属性的路径设置为中、 低级权 重; 将公共知识图谱中不包含用户关注的实体、 关系或属性的路径进行删除, 得到并存储 个人知识图谱。 10.根据权利要求9所述的基于临床检验医学大数据的医学检验报告分析方法, 其特征 在于: 提取个人知识图谱 对用户的报告实体数据进行分析, 包括如下步骤: 根据报告实体数据中的实体匹配个人知识图谱中的实体, 得到匹配的实体及对应的所权 利 要 求 书 2/3 页 3 CN 115472256 A 3

.PDF文档 专利 基于临床检验医学大数据的医学检验报告分析系统及方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于临床检验医学大数据的医学检验报告分析系统及方法 第 1 页 专利 基于临床检验医学大数据的医学检验报告分析系统及方法 第 2 页 专利 基于临床检验医学大数据的医学检验报告分析系统及方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:42:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。