standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210880056.5 (22)申请日 2022.07.25 (71)申请人 重庆邮电大 学 地址 400065 重庆市南岸区黄桷垭崇文路2 号 (72)发明人 王汝言 景忠源 吴大鹏 杨志刚  张普宁  (74)专利代理 机构 北京同恒源知识产权代理有 限公司 1 1275 专利代理师 方钟苑 (51)Int.Cl. G06F 21/60(2013.01) G06F 21/62(2013.01) G06N 3/08(2006.01) G06N 20/00(2019.01) (54)发明名称 一种工业互联网数据的安全处 理方法 (57)摘要 本发明涉及一种工业互联网数据的安全处 理方法, 属于工业互联网数据处理领域。 该方法 包括: 工厂和协作方以ElGamal加密算法生成一 对秘钥; 协约方初始化模型参数, 并将其与公钥 上传在区块链上; 工厂从区块链下载初始模型和 协作方公钥, 训练模型并使用差分隐私算法提取 模型参数; 工厂加密模型参数并存储在IPFS中获 得哈希值; 加密哈希值将其与工厂公钥加到区块 链上; 协作方通过哈希值在IPFS中检索模型参数 来训练全局模型, 利用SK来加密模型参数并将其 存储在IPFS, 加密IPFS哈希值, 利用工厂公钥加 密SK, 将结果添加区块链上; 工厂收到当前全局 模型参数进行更新。 本发明解决了工业互联网系 统中机器学习的隐私和信任问题。 权利要求书2页 说明书5页 附图2页 CN 115238288 A 2022.10.25 CN 115238288 A 1.一种工业互联网数据的安全处 理方法, 其特 征在于, 该 方法具体包括以下步骤: S1: 工厂和协作方生成一对秘钥; 然后协作方初始化模型参数w0, 并将模型参数w0与其 公钥上传到区块链上; S2: 每个工厂从区块链上下载初始化模型参数w0和协作方的公钥, 使用特定 数量的本地 数据样本训练一个深度神经网络模型; 训练完成后用差分隐私算法对模型进行处理, 生成 局部差分隐私机器学习模型, 之后工厂提取模型参数; S3: 工厂使用协作方的公钥对模型参数进行加密, 然后将加密的模型参数存储在IPFS 中, 并获得唯一的IPFS哈希 值; 然后同样使用协作方的公钥加密IPFS哈希 值, 借助于智能合 约将其与工厂公钥打包添加到区块链上; 工厂通知协作方, 当前一轮的本地模型训练完成; S4: 协作方利用私钥解密, 通过其公钥加密IPFS哈希值, 用IPFS的哈希值在IPFS中检索 获得相应的加密模型参数, 解密后进行全局模型的训练并提取模型参数; S5: 利用由协作方生产的对称密钥SK来加密模型参数并将其存储在IPFS, 之后会被赋 予一个IPFS哈希 值, 利用SK加密IPFS哈希 值, 同时利用各工厂的公钥分别加密SK, 将加密结 果添加区块链上, 通知工厂本轮聚合结束; S6: 工厂在收到协作方通知当前联邦周期结束后, 检索加密的全局模型参数, 利用其私 钥解密获得SK, 利用SK解密加密的IPFS哈希 值, 用IPFS哈希 值检索模型参数; 工厂使用更新 后的模型参数进行局部训练, 开始下一轮联合训练, 并在预定义的联合轮数中重复所有步 骤。 2.根据权利要求1所述的工业互联网数据的安全处理方法, 其特征在于, 步骤S1中, 工 厂和协作方以ElGamal加密算法生成一对秘钥; 所述ElGamal加密算法是一个基于迪菲 ‑赫 尔曼密钥交换的非对称加密算法。 3.根据权利要求1所述的工业互联网数据的安全处理方法, 其特征在于, 步骤S2具体包 括: 工厂使用特定数量的本地数据样本训练一个深度神经网络; 从服务器获得最新的模型 参数, 从1到批量数量 的批量序号b, 计算批梯度gk(b), 本地更新模型参数: 其中η表示学习率, wt表示当前的模型参数, Dk表示第k个协作方所拥有 的数据集, M表示指定的客户更新是使用的mi ni‑batch的大小; 在训练过程中, 在SGD计算中实现基于差分隐私的神经网络训练, 通过最小化经验损失 函数 来训练模型参数; 在SGD的每一 步, 计算梯度, 对于采样子集, 剪切每 个梯度的范 数 计算平均值, 向平均噪声梯度的相反方向迈出一步进行梯度下降反向传播完成训练最 后输出模型。 4.根据权利要求3所述的工业互联网数据的安全处理方法, 其特征在于, 步骤S4具体包 括: 假设有K个参与 方在一个联邦学习系统中, Dk表示第k个参与方所拥有的数据集, Pk表示 位于参与方k的数据点的索引集; 设nk表示Pk的基数, 假设有第k个参与方有个nk数据点, 总 共有K个参与方时, 协作方对收到的模型参数进行聚合, 即对收到的模型参数进行加权平 均: 权 利 要 求 书 1/2 页 2 CN 115238288 A 2更新模型参数: 其中, 其中 表示在给定的模型参数w上对样本(xi,yi)进行预测所得到的损失 结果, xi和yi分别表示第i个训练数据点及其相关的标签; η表示学习率, n表示训练数据的数 量; 协作方检查损失函数是否收敛或者是否达到最大训练轮次; 若 是, 则协作方给各参与方 发信号, 使其全部停止模型训练。 5.根据权利要求1所述的工业互联网数据的安全处理方法, 其特征在于, 步骤S6中, 工 厂更新后的模型参数进行加密、 存 储和上传。权 利 要 求 书 2/2 页 3 CN 115238288 A 3

PDF文档 专利 一种工业互联网数据的安全处理方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种工业互联网数据的安全处理方法 第 1 页 专利 一种工业互联网数据的安全处理方法 第 2 页 专利 一种工业互联网数据的安全处理方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。