standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211027781.4 (22)申请日 2022.08.25 (71)申请人 上海市儿童医院 地址 200062 上海市普陀区泸定路3 55号 申请人 上海蓬海涞讯数据技 术有限公司 (72)发明人 于广军 马诗诗 王志刚  (74)专利代理 机构 上海专利商标事务所有限公 司 31100 专利代理师 陶玉龙 (51)Int.Cl. G06F 21/62(2013.01) G06F 21/60(2013.01) G16H 10/60(2018.01) (54)发明名称 一种医院数据隐私保护方法及装置 (57)摘要 本发明涉及医疗 数据隐私处理技术领域, 更 具体的说, 涉及一种医院数据隐私保护方法及装 置。 本方法包括: 步骤S1、 将需要共享的医疗数据 中的隐私数据进行选择并标记, 标记隐私数据中 的可识别符、 特殊病种和病人特殊身份; 步骤S2、 将标记后的数据, 根据使用场景进行分类集合, 形成公用数据集、 有限数据集和可识别数据集; 步骤S3、 分别对公用数据集、 有限数据集和可识 别数据集进行不同程度的隐私数据保护处理; 步 骤S4、 将处理后的公用数据集、 有限数据集和可 识别数据集应用于不同的使用场景。 本发明通过 针对不同的应用场景将数据库的数据去标识化, 有效降低数据隐私泄露的可能性, 保障数据共享 价值可用, 提升数据共享应用的安全性和操作 性。 权利要求书2页 说明书10页 附图3页 CN 115270190 A 2022.11.01 CN 115270190 A 1.一种医院数据隐私保护方法, 其特 征在于, 包括以下步骤: 步骤S1、 将需要共享的医疗数据中的隐私数据进行选择并标记, 标记隐私数据中的可 识别符、 特殊病 种和病人 特殊身份; 步骤S2、 将步骤S1中标记后的数据, 根据使用场景进行分类集合, 形成公用数据集、 有 限数据集和可识别数据集; 步骤S3、 分别对公用数据集、 有限数据集和可识别数据集进行不同程度的隐私数据保 护处理; 对公用数据集中的数据进行去标记化处理, 对处理后的数据进行重实别测试以判断隐 私数据关联度是否满足要求; 对有限数据集中的标记数据进行加密和泛化, 同时将数据密级 进行区分标注; 步骤S4、 将步骤S3处理后的公用数据集、 有限数据集和可识别数据集应用于不同的使 用场景。 2.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S1中隐私数据 的可识别符包 含证件信息、 账户信息、 生物 识别信息及身体部分图片信息; 所述步骤S1中隐私数据的特殊病种包含性生殖相关疾病、 传染性疾病、 心理疾病、 恶性 肿瘤、 遗传性疾病 、 肛门疾病 、 罕见病及其 他不治之症; 所述步骤S1中隐私数据的病人 特殊身份包 含孕产妇 和恶性肿瘤患者。 3.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S2中的使用场 景包括科研院所、 医院和患者; 所述步骤S4进一 步包括: 将步骤S3处理后的公用数据集用于科研研究应用场景, 将步骤S3处理后的有限数据集 用于医院调阅场景, 将可识别数据集用于患者使用场景。 4.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S3的去标记化 处理, 进一步包括: 去除识别符, 年龄泛化; 诊断计数小于第一计数值的资料做隐私化处 理; 删除姓名、 住院号、 电话、 出院日期和出院诊断信息; 插入患者序号列; 年龄泛化 为年龄段; 转归结果以特定数字代替; 单个计数小于预设数量的诊断科室以特殊符号的科室进行代替。 5.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S3对处理后的 数据进行重实别测试, 进一 步包括: 将去标记化前的隐私数据记为X={x1,x2,....xn}; 将去标记后的隐私数据记为Y={y1,y2,...yn}; 根据相似度对比公式进行相似度对比, 对应的表达式为:权 利 要 求 书 1/2 页 2 CN 115270190 A 2其中, pi为第i个去标记化前的隐私数据与其去标记后的隐私数据的相似度, n为隐私数 据总数量; 当有任一项相似度pi小于预设阈值, 则认为处理后的医疗数据隐私数据和处理前的医 疗数据隐私数据关联度不满足要求, 重新进行去标记化处 理。 6.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S3 中对标记数 据进行加密, 进一 步包括对标记数据按照数据密级和颗粒度进行区分标注; 所述数据密级根据可识别符、 特殊病 种和病人 特殊身份进行区分定义; 所述颗粒度根据不同详细程度资料的隐私级别进行分类, 包括概要级资料、 摘要级资 料和详细级资料: 所述概要级资料为医院数据的部分名称概要; 所述摘要 级资料为小结报告类材 料; 所述详细级资料为详细病例类材 料。 7.根据权利要求3所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中将步骤S3 处理后的有限数据集用于医院调阅场景, 进一 步包括: 通过将医生的科室、 职称、 诊疗组与数据密级、 颗粒度进行匹配, 设置医生调阅数据的 权限。 8.根据权利要求3所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中, 将步骤 S3处理后的公用数据集用于科研 研究应用场景, 进一 步包括: 对于不同数据密级的隐私数据通过不同传递方式进行 数据传输 。 9.根据权利要求3所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中, 将步骤 S3处理后将可识别数据集用于患者使用场景, 进一 步包括: 患者输入相关身份信息, 使用可识别数据集, 查询与患者自身相关的健康医疗信息 。 10.根据权利要求9所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中, 患者输 入相关身份信息, 进一 步还包括: 注册身份信息, 关联实名制手机号信息, 设置账号密码; 所述步骤S4中, 查询与患者自身相关的健康医疗信息, 进一 步还包括: 对可查询信息进行内容限制; 对可查询信息进行时间限制; 对可查询信息进行操作权限的限制。 11.一种医院数据隐私保护装置, 包括: 存储器, 用于存 储可由处 理器执行的指令; 处理器, 用于执 行所述指令以实现如权利要求1 ‑10任一项所述的方法。 12.一种计算机可读介质, 其上存储有计算机指令, 其中当计算机指令被处理器执行 时, 执行如权利要求1 ‑10任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115270190 A 3

PDF文档 专利 一种医院数据隐私保护方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种医院数据隐私保护方法及装置 第 1 页 专利 一种医院数据隐私保护方法及装置 第 2 页 专利 一种医院数据隐私保护方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:30上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。