(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211027781.4
(22)申请日 2022.08.25
(71)申请人 上海市儿童医院
地址 200062 上海市普陀区泸定路3 55号
申请人 上海蓬海涞讯数据技 术有限公司
(72)发明人 于广军 马诗诗 王志刚
(74)专利代理 机构 上海专利商标事务所有限公
司 31100
专利代理师 陶玉龙
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 21/60(2013.01)
G16H 10/60(2018.01)
(54)发明名称
一种医院数据隐私保护方法及装置
(57)摘要
本发明涉及医疗 数据隐私处理技术领域, 更
具体的说, 涉及一种医院数据隐私保护方法及装
置。 本方法包括: 步骤S1、 将需要共享的医疗数据
中的隐私数据进行选择并标记, 标记隐私数据中
的可识别符、 特殊病种和病人特殊身份; 步骤S2、
将标记后的数据, 根据使用场景进行分类集合,
形成公用数据集、 有限数据集和可识别数据集;
步骤S3、 分别对公用数据集、 有限数据集和可识
别数据集进行不同程度的隐私数据保护处理; 步
骤S4、 将处理后的公用数据集、 有限数据集和可
识别数据集应用于不同的使用场景。 本发明通过
针对不同的应用场景将数据库的数据去标识化,
有效降低数据隐私泄露的可能性, 保障数据共享
价值可用, 提升数据共享应用的安全性和操作
性。
权利要求书2页 说明书10页 附图3页
CN 115270190 A
2022.11.01
CN 115270190 A
1.一种医院数据隐私保护方法, 其特 征在于, 包括以下步骤:
步骤S1、 将需要共享的医疗数据中的隐私数据进行选择并标记, 标记隐私数据中的可
识别符、 特殊病 种和病人 特殊身份;
步骤S2、 将步骤S1中标记后的数据, 根据使用场景进行分类集合, 形成公用数据集、 有
限数据集和可识别数据集;
步骤S3、 分别对公用数据集、 有限数据集和可识别数据集进行不同程度的隐私数据保
护处理;
对公用数据集中的数据进行去标记化处理, 对处理后的数据进行重实别测试以判断隐
私数据关联度是否满足要求;
对有限数据集中的标记数据进行加密和泛化, 同时将数据密级 进行区分标注;
步骤S4、 将步骤S3处理后的公用数据集、 有限数据集和可识别数据集应用于不同的使
用场景。
2.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S1中隐私数据
的可识别符包 含证件信息、 账户信息、 生物 识别信息及身体部分图片信息;
所述步骤S1中隐私数据的特殊病种包含性生殖相关疾病、 传染性疾病、 心理疾病、 恶性
肿瘤、 遗传性疾病 、 肛门疾病 、 罕见病及其 他不治之症;
所述步骤S1中隐私数据的病人 特殊身份包 含孕产妇 和恶性肿瘤患者。
3.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S2中的使用场
景包括科研院所、 医院和患者;
所述步骤S4进一 步包括:
将步骤S3处理后的公用数据集用于科研研究应用场景, 将步骤S3处理后的有限数据集
用于医院调阅场景, 将可识别数据集用于患者使用场景。
4.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S3的去标记化
处理, 进一步包括:
去除识别符, 年龄泛化;
诊断计数小于第一计数值的资料做隐私化处 理;
删除姓名、 住院号、 电话、 出院日期和出院诊断信息;
插入患者序号列;
年龄泛化 为年龄段;
转归结果以特定数字代替;
单个计数小于预设数量的诊断科室以特殊符号的科室进行代替。
5.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S3对处理后的
数据进行重实别测试, 进一 步包括:
将去标记化前的隐私数据记为X={x1,x2,....xn};
将去标记后的隐私数据记为Y={y1,y2,...yn};
根据相似度对比公式进行相似度对比, 对应的表达式为:权 利 要 求 书 1/2 页
2
CN 115270190 A
2其中, pi为第i个去标记化前的隐私数据与其去标记后的隐私数据的相似度, n为隐私数
据总数量;
当有任一项相似度pi小于预设阈值, 则认为处理后的医疗数据隐私数据和处理前的医
疗数据隐私数据关联度不满足要求, 重新进行去标记化处 理。
6.根据权利要求1所述的医院数据隐私保护方法, 其特征在于, 所述步骤S3 中对标记数
据进行加密, 进一 步包括对标记数据按照数据密级和颗粒度进行区分标注;
所述数据密级根据可识别符、 特殊病 种和病人 特殊身份进行区分定义;
所述颗粒度根据不同详细程度资料的隐私级别进行分类, 包括概要级资料、 摘要级资
料和详细级资料:
所述概要级资料为医院数据的部分名称概要;
所述摘要 级资料为小结报告类材 料;
所述详细级资料为详细病例类材 料。
7.根据权利要求3所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中将步骤S3
处理后的有限数据集用于医院调阅场景, 进一 步包括:
通过将医生的科室、 职称、 诊疗组与数据密级、 颗粒度进行匹配, 设置医生调阅数据的
权限。
8.根据权利要求3所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中, 将步骤
S3处理后的公用数据集用于科研 研究应用场景, 进一 步包括:
对于不同数据密级的隐私数据通过不同传递方式进行 数据传输 。
9.根据权利要求3所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中, 将步骤
S3处理后将可识别数据集用于患者使用场景, 进一 步包括:
患者输入相关身份信息, 使用可识别数据集, 查询与患者自身相关的健康医疗信息 。
10.根据权利要求9所述的医院数据隐私保护方法, 其特征在于, 所述步骤S4中, 患者输
入相关身份信息, 进一 步还包括: 注册身份信息, 关联实名制手机号信息, 设置账号密码;
所述步骤S4中, 查询与患者自身相关的健康医疗信息, 进一 步还包括:
对可查询信息进行内容限制;
对可查询信息进行时间限制;
对可查询信息进行操作权限的限制。
11.一种医院数据隐私保护装置, 包括:
存储器, 用于存 储可由处 理器执行的指令;
处理器, 用于执 行所述指令以实现如权利要求1 ‑10任一项所述的方法。
12.一种计算机可读介质, 其上存储有计算机指令, 其中当计算机指令被处理器执行
时, 执行如权利要求1 ‑10任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115270190 A
3
专利 一种医院数据隐私保护方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:30上传分享