(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210844308.9
(22)申请日 2022.07.19
(71)申请人 山东省计算中心 (国家超 级计算济
南中心)
地址 250014 山东省济南市历下区科院路
19号
(72)发明人 王连海 孟令云 徐淑奖
(74)专利代理 机构 济南圣达知识产权代理有限
公司 372 21
专利代理师 李琳
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 21/64(2013.01)
G06F 21/60(2013.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于联邦学习的医疗数据共享与隐私
保护方法和系统
(57)摘要
本发明属于数据安全 领域, 提供了一种基于
联邦学习的医疗数据共享与隐私保护方法和系
统, 本发明保证医院数据不离开本地的情况下进
行联合训练; 模 型训练的中间梯度加密并基于区
块链的数据资源发布; 通过智能合约在基于SGX
可信执行环 境中进行模型中间梯度解密并聚合;
SGX将聚合的新全局模 型上传到智能合约进行判
断是否满足收敛条件, 从而决定是否继续迭代训
练; 智能合约在新全局模型满足收敛条件下将模
型发送给数据需求方, 否则继续迭代进行联合训
练; 在保证各个医院医疗数据安全和隐私安全的
同时, 实现聚合过程的安全保护, 防止中间梯度
泄露隐私, 从而高效的实现数据共享。
权利要求书2页 说明书7页 附图2页
CN 114996762 A
2022.09.02
CN 114996762 A
1.一种基于联邦学习的医疗数据共享与隐私保护方法, 其特 征在于, 包括如下步骤:
接收数据需求方选定的初始化机器学习模型, 并交给安全审查智能合约进行合规性审
核, 审查通过后继续执 行; 否则, 返回安全校验不 通过;
存储医院节点上传的模型信息并发布;
调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文, 并验证
其是否满足收敛条件, 若不满足则开启新一轮的联邦学习迭代, 若满足收敛条件, 则将训练
完成的机器学习模型保存到区块链。
2.根据权利要求1所述的一种基于联邦学习的医疗数据共享与隐私保护方法, 其特征
在于, 所述医院节 点上传的模型信息包括中间梯度密 文、 密文哈希值、 模型密 文和模型密 文
哈希值。
3.根据权利要求1所述的一种基于联邦学习的医疗数据共享与隐私保护方法, 其特征
在于, 所述调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文的
过程包括:
通过链下合约接收模型梯度密文和密文哈希值;
对模型梯度密文取哈希值, 将其从区块链下载的模型梯度密文 哈希做对比, 若两者有
差别, 则终止程序并反馈到区块链, 若 无差别, 则转使用自身私钥解密加密后的模型梯度密
钥, 获取模型梯度;
使用获取的模型梯度聚合 生成新的全局模型;
审核新的全局模型是否达到收敛条件; 若模型达到收敛条件, 则使用数据需求方的公
钥加密数据, 若未达 到则使用各个医院公钥加密, 然后对 模型密文取哈希;
将新的全局模型密文、 密文哈希值和模型 是否收敛的结果上传到区块链, 并发布数据。
4.一种基于联邦学习的医疗数据共享与隐私保护方法, 其特 征在于, 包括如下步骤:
选定初始化机器学习模型并将其交给安全审查智能合约进行合 规性审核;
通过审查后将初始化机器学习 模型采用各个医院的公钥加密, 并对模型密文取哈希后
上传至区块链;
调用模型训练智能合约进行机器学习模型训练;
调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;
将训练完成的机器学习 模型密文哈希值和从区块链下载的模型密文哈希值进行对比,
对模型的完整性进行 校验;
采用私钥对进行完整性校验后的模型的密文 进行解密, 获取模型。
5.一种基于联邦学习的医疗数据共享与隐私保护方法, 其特 征在于, 包括如下步骤:
调用数据查询智能合约获取 数据需求方的初始化机器学习模型;
使用本地数据进行 联邦学习对初始化机器学习模型进行训练, 得到模型梯度;
将模型梯度使用SGX的公钥进行加密, 生成梯度密文;
对梯度密文取哈希值, 获取模型梯度密文的哈希值;
将模型梯度密文和密文哈希值上传到区块链, 进行发布。
6.一种基于联邦学习的医疗数据共享与隐私保护系统, 其特 征在于, 包括:
合规性审核模块, 被配置为: 接收数据需求方选定的初始化机器学习模型, 并交给安全
审查智能合约进行合 规性审核, 审查 通过后继续执 行; 否则, 返回安全校验不 通过;权 利 要 求 书 1/2 页
2
CN 114996762 A
2信息获取模块, 被 配置为: 存 储医院节点上传的模型信息并发布;
部署节点梯度模块, 被配置为: 调用模型训练智能合约将模型信息采用SGX进行处理得
到新的全局模型密文, 并验证其是否满足收敛条件, 若不满足则开启新一轮的联邦学习迭
代, 若满足收敛 条件, 则将训练完成的机器学习模型保存到区块链。
7.根据权利要求6所述的一种基于联邦学习的医疗数据共享与隐私保护系统, 其特征
在于, 所述医院节 点上传的模型信息包括中间梯度密 文、 密文哈希值、 模型密 文和模型密 文
哈希值。
8.根据权利要求6所述的一种基于联邦学习的医疗数据共享与隐私保护系统, 其特征
在于, 所述调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文的
过程包括:
通过链下合约接收模型梯度密文和密文哈希值;
对模型梯度密文取哈希值, 将其从区块链下载的模型梯度密文 哈希做对比, 若两者有
差别, 则终止程序并反馈到区块链, 若 无差别, 则转使用自身私钥解密加密后的模型梯度密
钥, 获取模型梯度;
使用获取的模型梯度聚合 生成新的全局模型;
审核新的全局模型是否达到收敛条件; 若模型达到收敛条件, 则使用数据需求方的公
钥加密数据, 若未达 到则使用各个医院公钥加密, 然后对 模型密文取哈希;
将新的全局模型密文、 密文哈希值和模型 是否收敛的结果上传到区块链, 并发布数据。
9.一种基于联邦学习的医疗数据共享与隐私保护系统, 其特 征在于, 包括:
模型选定模块, 被配置为: 选定初始化机器学习模型并将其交给安全审查智能合约进
行合规性审核;
模型加密模块, 被配置为: 通过审查后将初始化机器学习模型采用各个医院的公钥加
密, 并对模型密文取哈希后上传至区块链;
模型训练模块, 被 配置为: 调用模型训练智能合约进行机器学习模型训练;
模型获取模块, 被配置为: 调用数据查询智能合约获取训练完成的机器学习模型的密
文和密文哈希值;
将训练完成的机器学习 模型密文哈希值和从区块链下载的模型密文哈希值进行对比,
对模型的完整性进行 校验;
采用私钥对进行完整性校验后的模型的密文 进行解密, 获取模型。
10.一种基于联邦学习的医疗数据共享与隐私保护系统, 其特 征在于, 包括:
数据查询模块, 被配置为: 调用数据查询智能合约获取数据需求方的初始化机器学习
模型;
本地训练模块, 被配置为: 使用本地数据进行联邦学习对初始化机器学习模型进行训
练, 得到模型梯度;
模型加密模块, 被配置为: 将模型梯度使用SGX的公钥进行加密, 生成梯度密文; 对梯度
密文取哈希值, 获取模型梯度密文的哈希值; 将模 型梯度密 文和密文哈希值上传到区块链,
进行发布。权 利 要 求 书 2/2 页
3
CN 114996762 A
3
专利 一种基于联邦学习的医疗数据共享与隐私保护方法和系统
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:55上传分享