(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211058546.3
(22)申请日 2022.08.31
(71)申请人 杭州锘崴信息科技有限公司
地址 310059 浙江省杭州市滨江区浦沿街
道东信大道6 6号4号楼521
(72)发明人 王海宁 孙琪 王爽 郑灏 王帅
李帜
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 杨文娟 臧建明
(51)Int.Cl.
G16B 50/40(2019.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
(54)发明名称
基于可信执行环境的医疗隐私数据安全分
析方法及装置
(57)摘要
本申请提供一种基于可信执行环境的医疗
隐私数据安全分析方法及装置, 涉及数据安全领
域, 该方法包括: 在可信执行环境中, 确定 数据提
供方提供的样本序列中的目标位点处所包含的
信息, 根据该信息, 生成样 本序列的编码数据集,
编码数据集中包括有样本序列中每个目标位点
对应的编码结果, 获取数据查询方提供至可信执
行环境中的查询数据集, 其中包括数据查询方提
供的查询序列中每个目标位点对应的编码结果,
通过隐私计算和同态加密技术, 将编码数据集和
查询数据集中相同目标位点对应的编码结果进
行对比, 计算得到对比结果, 并基于对比结果分
析确定样本序列与查询序列的来源是否存在关
联。 该方案可 以保障数据安全, 避免数据查询时
出现隐私数据泄 露。
权利要求书3页 说明书13页 附图7页
CN 115458064 A
2022.12.09
CN 115458064 A
1.一种基于可信执 行环境的医疗隐私数据安全分析 方法, 其特 征在于, 包括:
在可信执行环境中, 确定数据提供方提供的样本序列中的目标位点处所包含的信息,
所述数据提供 方提供有至少一个样本序列, 每 个样本序列包括有至少一个目标位 点;
在可信执行环境中, 根据所述样本序列中每个目标位点处所包含的信息, 生成所述样
本序列的编 码数据集, 所述编 码数据集中包括有 所述样本序列中每个目标位点对应的编码
结果;
获取数据查询方提供至可信执行环境中的查询数据集, 所述查询数据集包括所述数据
查询方提供的查询序列中每 个目标位 点对应的编码结果;
在可信执行环境中, 将所述编码数据集和所述查询数据集中相同目标位点对应的编码
结果进行对比, 计算得到对比结果, 所述对比结果用于表征所述查询数据集与所述编码数
据集的相似概 率值;
根据所述对比结果, 分析确定所述样本序列 与所述查询序列的来源是否存在关联。
2.根据权利要求1所述的方法, 其特征在于, 所述根据所述样本序列中每个目标位点处
所包含的信息, 生成所述样本序列的编码数据集, 包括:
在所述样本序列的每个目标位点处所包含的信 息中确定出第 一信息和第二信息, 所述
第一信息来源于第一对象或通过所述第一对象随机突变得到, 所述第二信息来源于第二对
象或通过 所述第二对象随机突变得到;
根据所述样本序列中的每个目标位点的第 一信息和所述第 二信息, 确定所述样本序列
中的每个目标位点对应的编码结果, 所述编码结果为第一编码或第二编码, 所述第一编码
用于表征所述第一信息来源于所述第一对象且所述第二信息来源于所述第二对象, 所述第
二编码用于表征所述第一信息通过所述第一对象随机突变得到和/或所述第二信息通过所
述第二对象随机突变得到;
根据所述样本序列中每个目标位点对应的编码结果, 生成所述样本序列的编码数据
集。
3.根据权利要求1所述的方法, 其特征在于, 所述在可信执行环境中, 将所述编码数据
集和所述 查询数据集中相同目标位 点对应的编码结果进行对比, 计算得到对比结果, 包括:
将每个样本序列的编码数据集中所有目标位点对应的编码结果求和, 得到每个样本序
列的编码数据集的编码总和;
将所述查询数据集中每个目标位点对应的编码结果求和, 得到所述查询序列的查询数
据集的编码总和;
在所有样本序列中查询得到编码数据集的编码总和与所述查询序列的查询数据集的
编码总和的差值小于预设阈值的样本序列, 作为目标样本序列;
在可信执行环境中, 将所述目标样本序列的编码数据集和所述查询数据集中相同目标
位点对应的编码结果进行对比, 计算得到所述对比结果。
4.根据权利要求3所述的方法, 其特征在于, 所述将所述目标样本序列的编码数据集和
所述查询数据集中相同目标位 点对应的编码结果进行对比, 计算得到所述对比结果, 包括:
将所述目标样本序列的编码数据集和所述查询数据集中相同目标位点对应的编码结
果对比;
若所述目标样本序列的编码数据集和所述查询数据集中相同目标位点对应的编码结权 利 要 求 书 1/3 页
2
CN 115458064 A
2果相同, 则确定所述相同目标位 点对应的为第一结果;
若所述目标样本序列的编码数据集和所述查询数据集中相同目标位点对应的编码结
果不相同, 则确定所述相同目标位点对应的为第二结果, 所述第一结果与所述第二结果的
取值不相同;
根据每个相同目标位 点对应的第一结果或第二结果, 计算得到所述对比结果。
5.根据权利要求4所述的方法, 其特征在于, 所述根据每个相同目标位点对应的第 一结
果或第二结果, 计算得到所述对比结果, 包括:
确定对应为第一结果的相同目标位点的数量和对应为第二结果的相同目标位点的数
量;
根据对应为第一结果的相同目标位点的数量和对应为第二结果的相同目标位点的数
量, 计算对应为第一结果的相同目标位 点或对应为第二结果的相同目标位 点的数量占比;
将所述数量占比作为所述对比结果。
6.根据权利要求5所述的方法, 其特征在于, 所述根据所述对比结果, 分析确定所述样
本序列与所述查询序列的来源是否存在关联, 包括:
将所述数量占比分别与预设第 一阈值和预设第 二阈值进行对比, 所述预设第 一阈值小
于所述预设第二阈值;
若所述数量占比小于或等于所述预设第 一阈值, 则确定所述样本序列与所述查询序列
来源于互不关联的两个不同对象;
若所述数量占比大于所述预设第 一阈值且小于所述预设第 二阈值, 则确定所述样本序
列与所述查询序列来源于存在关联的两个不同对象;
若所述数量占比等于或大于所述预设第 二阈值, 则确定所述样本序列和所述查询序列
来源于同一个对象。
7.根据权利要求1 ‑6任一项所述的方法, 其特 征在于, 所述方法还 包括:
若所述样本序列与 所述查询序列的来源存在 关联, 则从所述数据提供方获取所述样本
序列的样本标识信息并输出。
8.根据权利要求1 ‑6任一项所述的方法, 其特征在于, 所述样本序列和所述查询序列均
为脱氧核糖核酸序列, 所述方法包括:
获取所述脱氧核糖核酸序列中单核酸多态性所处的位 点, 作为所述目标位 点。
9.一种基于可信执 行环境的医疗隐私数据安全分析装置, 其特 征在于, 包括:
信息确定模块, 用于在可信执行环境中, 确定数据提供方提供的样本序列中的目标位
点处所包含的信息, 所述数据提供方提供有至少一个样本序列, 每个样本序列包括有至少
一个目标位 点;
数据生成模块, 用于在可信执行环境中, 根据所述样本序列中每个目标位点处所包含
的信息, 生成所述样本序列的编码数据集, 所述编码数据集中包括有所述样本序列中每个
目标位点对应的编码结果;
数据获取模块, 用于获取数据查询方提供至可信执行环境中的查询数据集, 所述查询
数据集包括所述数据查询方提供的查询序列中每 个目标位 点对应的编码结果;
数据对比模块, 用于在可信执行环境中, 将所述编码数据集和所述查询数据集中相同
目标位点对应的编码结果进行对比, 计算得到对比结果, 所述对比结果用于表征所述查询权 利 要 求 书 2/3 页
3
CN 115458064 A
3
专利 基于可信执行环境的医疗隐私数据安全分析方法及装置
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:27上传分享