standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210874478.1 (22)申请日 2022.07.21 (71)申请人 江苏刺掌信息科技有限公司 地址 212009 江苏省镇江市新区经十五路 99号16号楼 A302 (72)发明人 徐焱 王伟 冯琬云  (51)Int.Cl. G06F 21/62(2013.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 标签差分隐私深度学习的启发式审计体系 与方法 (57)摘要 本发明涉及网络安全与隐私计算领域, 尤其 涉及面向标签差分隐私深度学习的启发式审计 体系与方法。 首先, 生成器G生成相差T对样本标 签的数据集 其次, 黑盒模型M分别使用 数据集D0和D1(T)进行训练, 并得到模型输出f0=M (D0)和f1=M(D1(T))。 再然后, 鉴别器D将 拆分为T对相邻数据集 并通过观察黑盒 模型输出 fd, 一次性进行T轮猜谜游戏。 最后统计 器S根据猜谜结果获得结果输出概率, 由此度量 得隐私预算下界εLB。 本发明依据标签差分隐私 的独有特点, 将蒙特卡罗重复实验集成在启发式 审计体系 中, 实现了一次模型训练, 重复猜谜游 戏的目的, 在保证审计效用的同时, 有效的降低 了审计耗时。 权利要求书2页 说明书5页 附图2页 CN 115391815 A 2022.11.25 CN 115391815 A 1.标签差分隐私深度学习的启发式审计方法, 其特 征在于: 包括 步骤1: 生成T ‑相邻数据集 步骤2: 黑盒模型M分别使用数据集D0和D1(T)进行训练, 得到模型输出f0, f1; 步骤3: 在f0, f1中随机选择一个模型输出fd, 并依据fd, 样本对(xi,yi), (xi,yi′), 猜测训 练集下标d值, 猜测结果记作d ′, 总计猜测T轮; 步骤4: 根据T轮猜谜结果d和d ′, 统计得FN和FP; 步骤5: 将所 得FN和FP带入公式 得到满足( εTH, δ )‑Label DP的算法真实隐私预算 εP区间为( εLB, εTH)。 2.标签差分隐私深度 学习的启发式审计体系, 其特征在于: 包括四个模块: 生成器G、 模 型训练、 鉴别器D和统计 器S, 每个模块执 行权利要求1中不同的步骤; 生成器G: 负责执 行步骤1, 生成两个相差T对样本标签的数据集 模型训练: 负责执行步骤2, 分别利用数据集D0, D1(T)训练黑盒模型M, 得到模型输出f0, f1; 鉴别器D: 负责执行步骤3, 已知样本对(xi,yi), (xi,yi′)及模型输出f0, f1, 一次性进行T 轮猜谜游戏; 统计器S: 负责执行步骤4、 5, 根据T轮猜谜结果d和d ′, 统计FN值和FP值, 并由此度量隐 私预算下界εLB, 得到真实隐私预算区间为 εP∈( εLB, εTH)。 3.根据权利要求1所述的标签差分隐私深度 学习的启发式审计方法, 其特征在于: 步骤 3具体为: 在每轮游戏开始前, 从f0和f1中随机选择一个模型输出fd进行猜谜游戏, d表示谜 底, 即训练模型的数据集下标; 而后将样本对(xi,yi′), (xi,yi′)换算为相邻数据集 并根据Dd、 D1‑d、 fd, 猜测d值是0还是1, 猜测结果记作d ′。 4.根据权利要求3所述的标签差分隐私深度 学习的启发式审计方法, 其特征在于: 步骤 1具体为: 步骤1‑1: 已知一个数据集D0和黑盒模型M, 并将M关于D0的模型函数f0作为标签投毒过 程的先验知识; 步骤1‑2: 随机选择T对目标样本(xi,yi)T进行标签投毒, T值 一般不得小于10 00; 步骤1‑3: 令恶意标签(yi′)T为预测向量f0((xi)T)中概率最小的类, 并令恶意标签(yi′)T 代替标签(yi)T可得数据集D1(T)。 5.根据权利要求1所述的标签差分隐私深度 学习的启发式审计方法, 其特征在于: 步骤 3具体为: 步骤3‑1: 鉴别器D训练基于影子模型的成员推理模型Attacker0, Attacker1作为猜谜判 断依据; Attacker0以D0为影子训练集, D1(T)为影子测试集, Attacker1反之; 假设已知fd和样 本为(x,y), 则Attackerd可以根据预测向量fd(x)和真实标签y, 可以得到该样本(x,y)属于 数据集Dd的可能性。 步骤3‑2: 鉴别器D根据样本对(xi,yi), (xi,yi′)及模型输出f0, f1, 一次性进行T轮猜谜 游戏。 6.根据权利要求5所述的标签差分隐私深度学习的启发式审计方法, 其特 征在于:权 利 要 求 书 1/2 页 2 CN 115391815 A 2每轮猜谜游戏过程如下: S1: 初始化谜题, 从f0, f1中随机选择一个fd作为谜题; S2: 将(xi,yi)和(xi,yi′)的预测向量fd(x)和真实标签y分别输入Attackerd模型, 得到 关于样本是否属于数据集Dd的预测向量Attackerd(fd(xi),yi), Attackerd(fd(xi),yi′), 并 令输出中概 率最大的类分别为a0和a1; S3: a0, a1有四种排列组合可能: 若a0="in", a1="out", 则认为样本(xi,yi)属于数据集 Dd, d′=0; 若a0="out", a1="in", 则认为样本(xi,yi′)属于Dd, d′=1; 若a0, a1都等于"out", 则认为两个样本均不属于Dd, 放弃判断, d ′=⊥; 若a0, a1都等于"in", 则认为两个样本均可 能属于数据集Dd, 则比较样本在"in"  分量上的概率大小, 若a0的概率更大则认为d ′=0, 反 之d′=1。权 利 要 求 书 2/2 页 3 CN 115391815 A 3

PDF文档 专利 标签差分隐私深度学习的启发式审计体系与方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 标签差分隐私深度学习的启发式审计体系与方法 第 1 页 专利 标签差分隐私深度学习的启发式审计体系与方法 第 2 页 专利 标签差分隐私深度学习的启发式审计体系与方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:53上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。