standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210836255.6 (22)申请日 2022.07.15 (71)申请人 生命奇点 (北京) 科技有限公司 地址 100080 北京市海淀区苏州街3号6层 603 (72)发明人 安西平 徐辉  (74)专利代理 机构 北京工信联合知识产权代理 有限公司 1 1266 专利代理师 傅婷 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/215(2019.01) G06F 21/62(2013.01) G16H 50/70(2018.01) (54)发明名称 数据治理方法、 装置及计算机存 储介质 (57)摘要 一种数据治理方法及装置, 该方法包括: 获 取初始医疗 数据; 基于所述初始医疗 数据进行数 据建模及转模; 将建模及转模后的数据进行标准 化; 根据标准化后的数据, 构建患者主索引; 对构 建索引后的数据进行清洗; 对清洗后的数据进行 脱敏化处理; 对脱敏后的数据进行质控, 得到治 理结果。 通过本发明实施例提供的方法及装置, 解决了现有数据治理人工依 赖性强、 效率低以及 治理模块单一的问题, 无需人工可 以实现多源、 异构、 海量医疗数据有序且有效地治理, 提高了 医疗工作的效率及准确性, 降低了人力成本, 为 后续医疗数据的利用和挖掘提供了数据支撑 。 权利要求书2页 说明书20页 附图5页 CN 115391332 A 2022.11.25 CN 115391332 A 1.一种数据治理方法, 其特 征在于, 所述方法包括: 获取初始医疗数据; 基于所述初始医疗数据进行 数据建模及转模; 将建模及转模后的数据进行 标准化; 根据标准 化后的数据, 构建患者主索引; 对构建索引后的数据进行清洗; 对清洗后的数据进行脱敏化处 理; 对脱敏后的数据进行质控, 得到治理结果。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述初始医疗数据进行数据建模 及转模, 包括: 基于所述初始医疗数据生成D DL语句, 建立库表字段, 得到目标 数据模型; 将原有数据模型转成所述目标 数据模型。 3.根据权利要求1所述的方法, 其特征在于, 所述将建模及转模后的数据进行标准化, 包括: 根据预设标准, 将建模及转模后的数据进行 标准化映射。 4.根据权利要求1所述的方法, 其特征在于, 所述根据标准化后的数据, 构建患者主索 引, 包括: 从标准化后的数据中提取患者基本信息, 基于所述患者基本信息, 将同一患者的多业 务ID的关联, 并进行统一编号, 生成主索引号。 5.根据权利要求1所述的方法, 其特 征在于, 所述对构建索引后的数据进行清洗, 包括: 根据预设清洗规则, 对构建索引后的数据进行清洗, 并对清洗过程中不符合规则的数 据进行修 正。 6.根据权利要求1所述的方法, 其特征在于, 所述对清洗后的数据进行脱敏化处理, 包 括: 根据预设的敏感数据特征, 利用敏感数据信息库和分词系统, 识别清洗后的数据中包 含的敏感信息, 并采用脱敏算法对所述敏感信息进行脱敏。 7.根据权利要求6所述的方法, 其特征在于, 所述对脱敏后的数据进行质控, 得到治理 结果, 包括: 根据预设质控规则, 对脱敏后的数据进行核查及校正。 8.一种数据治理装置, 其特 征在于, 所述装置包括: 数据获取 单元, 用于获取初始医疗数据; 数据建模及转模单 元, 用于基于所述初始医疗数据进行 数据建模及转模; 数据标准 化单元, 用于将建模及转模后的数据进行 标准化; 索引构建单 元, 用于根据标准 化后的数据, 构建患者主索引; 数据清洗单 元, 用于对构建索引后的数据进行清洗; 数据脱敏 单元, 用于对清洗后的数据进行脱敏化处 理; 数据质控单 元, 用于对脱敏后的数据进行质控, 得到治理结果。 9.根据权利要求8所述的装置, 其特 征在于, 所述数据建模及转模单 元, 还用于: 基于所述初始医疗数据生成D DL语句, 建立库表字段, 得到目标 数据模型;权 利 要 求 书 1/2 页 2 CN 115391332 A 2将原有数据模型转成所述目标 数据模型。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时, 实现权利要求1 ‑7任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115391332 A 3

PDF文档 专利 数据治理方法、装置及计算机存储介质

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 数据治理方法、装置及计算机存储介质 第 1 页 专利 数据治理方法、装置及计算机存储介质 第 2 页 专利 数据治理方法、装置及计算机存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。