standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210836255.6 (22)申请日 2022.07.15 (71)申请人 生命奇点 (北京) 科技有限公司 地址 100080 北京市海淀区苏州街3号6层 603 (72)发明人 安西平 徐辉 (74)专利代理 机构 北京工信联合知识产权代理 有限公司 1 1266 专利代理师 傅婷 (51)Int.Cl. G06F 16/22(2019.01) G06F 16/215(2019.01) G06F 21/62(2013.01) G16H 50/70(2018.01) (54)发明名称 数据治理方法、 装置及计算机存 储介质 (57)摘要 一种数据治理方法及装置, 该方法包括: 获 取初始医疗 数据; 基于所述初始医疗 数据进行数 据建模及转模; 将建模及转模后的数据进行标准 化; 根据标准化后的数据, 构建患者主索引; 对构 建索引后的数据进行清洗; 对清洗后的数据进行 脱敏化处理; 对脱敏后的数据进行质控, 得到治 理结果。 通过本发明实施例提供的方法及装置, 解决了现有数据治理人工依 赖性强、 效率低以及 治理模块单一的问题, 无需人工可 以实现多源、 异构、 海量医疗数据有序且有效地治理, 提高了 医疗工作的效率及准确性, 降低了人力成本, 为 后续医疗数据的利用和挖掘提供了数据支撑 。 权利要求书2页 说明书20页 附图5页 CN 115391332 A 2022.11.25 CN 115391332 A 1.一种数据治理方法, 其特 征在于, 所述方法包括: 获取初始医疗数据; 基于所述初始医疗数据进行 数据建模及转模; 将建模及转模后的数据进行 标准化; 根据标准 化后的数据, 构建患者主索引; 对构建索引后的数据进行清洗; 对清洗后的数据进行脱敏化处 理; 对脱敏后的数据进行质控, 得到治理结果。 2.根据权利要求1所述的方法, 其特征在于, 所述基于所述初始医疗数据进行数据建模 及转模, 包括: 基于所述初始医疗数据生成D DL语句, 建立库表字段, 得到目标 数据模型; 将原有数据模型转成所述目标 数据模型。 3.根据权利要求1所述的方法, 其特征在于, 所述将建模及转模后的数据进行标准化, 包括: 根据预设标准, 将建模及转模后的数据进行 标准化映射。 4.根据权利要求1所述的方法, 其特征在于, 所述根据标准化后的数据, 构建患者主索 引, 包括: 从标准化后的数据中提取患者基本信息, 基于所述患者基本信息, 将同一患者的多业 务ID的关联, 并进行统一编号, 生成主索引号。 5.根据权利要求1所述的方法, 其特 征在于, 所述对构建索引后的数据进行清洗, 包括: 根据预设清洗规则, 对构建索引后的数据进行清洗, 并对清洗过程中不符合规则的数 据进行修 正。 6.根据权利要求1所述的方法, 其特征在于, 所述对清洗后的数据进行脱敏化处理, 包 括: 根据预设的敏感数据特征, 利用敏感数据信息库和分词系统, 识别清洗后的数据中包 含的敏感信息, 并采用脱敏算法对所述敏感信息进行脱敏。 7.根据权利要求6所述的方法, 其特征在于, 所述对脱敏后的数据进行质控, 得到治理 结果, 包括: 根据预设质控规则, 对脱敏后的数据进行核查及校正。 8.一种数据治理装置, 其特 征在于, 所述装置包括: 数据获取 单元, 用于获取初始医疗数据; 数据建模及转模单 元, 用于基于所述初始医疗数据进行 数据建模及转模; 数据标准 化单元, 用于将建模及转模后的数据进行 标准化; 索引构建单 元, 用于根据标准 化后的数据, 构建患者主索引; 数据清洗单 元, 用于对构建索引后的数据进行清洗; 数据脱敏 单元, 用于对清洗后的数据进行脱敏化处 理; 数据质控单 元, 用于对脱敏后的数据进行质控, 得到治理结果。 9.根据权利要求8所述的装置, 其特 征在于, 所述数据建模及转模单 元, 还用于: 基于所述初始医疗数据生成D DL语句, 建立库表字段, 得到目标 数据模型;权 利 要 求 书 1/2 页 2 CN 115391332 A 2将原有数据模型转成所述目标 数据模型。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时, 实现权利要求1 ‑7任一所述的方法。权 利 要 求 书 2/2 页 3 CN 115391332 A 3
专利 数据治理方法、装置及计算机存储介质
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:34:57
上传分享
举报
下载
原文档
(2.3 MB)
分享
友情链接
GB-T 23011-2022 信息化和工业化融合 数字化转型 价值效益参考模型.pdf
商用密码检测机构管理办法(征求意见稿).pdf
GB-T 13734-2008 耳穴名称与定位.pdf
HJ 91.1-2019 污水监测技术规范.pdf
GB-T 32182-2015 轨道交通用铝及铝合金板材.pdf
工商银行 2021网络金融黑产研究报告.pdf
国家能源局综合司 关于印发2021年电力安全监管重点任务的通知.pdf
GB-T 35673-2017 工业通信网络 网络和系统安全 系统安全要求和安全等级.pdf
T-CI 032—2022 矿山酸性污染全过程控制与治理技术指南.pdf
GB-T 30902-2014 无机化工产品 杂质元素的测定 电感耦合等离子体发射光谱法(ICP-OES).pdf
GB-T 25068.4-2022 信息技术 安全技术 网络安全 第4部分:使用安全网关的网间通信安全保护.pdf
GB-T 6901-2017 硅质耐火材料化学分析方法.pdf
GB-T 22033-2017 信息技术 嵌入式系统术语.pdf
GB-T 36341.1-2018 信息技术 形状建模信息表示 第1部分:框架和基本组件.pdf
GB-T 28537-2012 高压开关设备和控制设备中六氟化硫(SF6)的使用和处理.pdf
GB-T 20822-2007 固液法白酒.pdf
GM-T 0068-2019 开放的第三方资源授权协议框架.pdf
GB-T 20274.1-2023 信息安全技术 信息系统安全保障评估框架 第1部分:简介和一般模型.pdf
GB-T 42717-2023 电化学储能电站并网性能评价方法.pdf
GB-T 7699-2022 苎麻.pdf
1
/
28
评价文档
赞助2.5元 点击下载(2.3 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。