standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210787996.X (22)申请日 2022.07.04 (71)申请人 北京邮电大 学 地址 100876 北京市海淀区西土城路10号 (72)发明人 程祥 苏森 张朋飞  (74)专利代理 机构 北京风雅颂专利代理有限公 司 11403 专利代理师 李莎 (51)Int.Cl. G06F 21/62(2013.01) G06N 5/04(2006.01) G06F 16/215(2019.01) (54)发明名称 一种满足本地差分隐私的真值发现方法和 电子设备 (57)摘要 本申请提供一种满足本地差分隐私的真值 发现方法和电子设备包括: 发布多个 真值发现任 务, 并根据所述多个任务生成指示矩阵; 根据所 述指示矩 阵和所述多个任务的阈值范围以及隐 私预算确定对 所述指示矩阵的采样比例; 根据所 述采样比例对所述指示矩 阵进行两阶段随机采 样并生成索引矩 阵后将所述索引矩 阵发送至多 个用户端口; 所述多个用户端口对 所述索引矩阵 内的数据进行加噪处理得到加噪数据; 计算所述 多个用户端口的权重后根据所述加噪数据和所 述权重对未被采样到的数据进行推断统计; 根据 所述加噪数据和所述推断统计得到的剩余数据 值得到每个采样任务的真值。 本申请通过两阶段 随机采样以及多可客户端口赋予不同的权重, 最 终得到每个采样任务的真值。 权利要求书3页 说明书11页 附图3页 CN 115329368 A 2022.11.11 CN 115329368 A 1.一种满足本地差分隐私的真值发现方法, 其特 征在于, 包括: 发布多个真值发现任务, 并根据所述多个真值发现任务 生成指示矩阵; 根据所述指示矩阵和所述多个任务的阈值范围以及隐私预算确定对所述指示矩阵的 采样比例; 根据所述采样比例对所述指示矩阵进行两阶段随机采样, 得到随机采样数据; 根据所述随机采样数据生成索引矩阵, 并将所述索引矩阵发送至多个用户端口; 接收所述多个用户端口对所述索引矩阵内的数据进行加噪处 理而得到的加噪数据; 基于所述加噪数据计算所述多个用户端口的权重, 并根据 所述加噪数据和所述权重对 所述指示矩阵中未被采样到的数据进行推断统计; 根据所述加噪数据和所述推断统计得到的剩余数据值, 得到每 个采样任务的真值。 2.根据权利要求1所述的方法, 其特征在于, 根据所述多个真值发现任务生成指示矩 阵, 包括: 将所述多个真值发现任务分配给 所述多个客户端口; 根据所述多个客户端口与所述多个真值发现任务的对应关系建立所述指示矩阵。 3.根据权利要求1所述的方法, 其特征在于, 所述根据所述指示矩阵和所述多个任务的 阈值范围以及隐私预算确定对所述指示矩阵的采样比例表示 为: 其中, M表示所述多个用户端口, N表示所述多个真值处理任务, Ms表示所述多个用户端 口所处理的所述多个真值发现任务的集合, dom(n)表示所述阈值范围, ε表示所述隐私预 算, Num表示所述多个用户端口所完成的所述多个真值发现任务的总数量。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述采样比例对所述指示矩阵进行两 阶段随机采样, 包括: 确定第一采样比例, 并根据所述第一采样比例对所述指示矩阵进行第一次随机采样; 确定第二采样比例, 并根据所述第二采样比例对所述指示矩阵进行第二次随机采样, 其中, 所述第二次随机采样的数据不完全与所述第一次随机采样的数据相同。 5.根据权利要求4所述的方法, 其特征在于, 所述第 一采样比例可在小于所述采样比例 的范围内进行随机设置, 所述第二采样比例表示 为: 其中, γ1表示为所述第一采样比例, γ2表示为所述第二采样比例。 6.根据权利要求4所述的方法, 其特征在于, 所述根据所述随机采样数据生成索引矩权 利 要 求 书 1/3 页 2 CN 115329368 A 2阵, 包括: 根据所述第一次随机采样的数据生成第一次采样数据集 合; 根据所述第二次随机采样的数据生成第二次采样数据集 合; 根据所述第一次采样数据集 合和所述第二次采样数据集 合建立所述索引矩阵。 7.根据权利要求5所述的方法, 其特 征在于, 所述加噪数据是采用以下 方法得到的: 所述多个用户端口对所述索引矩阵内的数据注入规模为 的噪音, 其中, 对所述索引矩阵进行加噪处 理得到所述加噪数据。 8.根据权利要求7所述的方法, 其特征在于, 基于所述加噪数据计算所述多个用户端口 的权重, 并根据所述加噪数据和所述权重对所述指示矩阵中未被采样到的数据进 行推断统 计, 包括: 基于所述加噪数据计算所述多个用户端口的权重, 并根据 所述权重的集合得出所述权 重的加权矩阵; 根据所述加权矩阵与所述加噪数据对所述指示矩阵中未被采样到的数据进行推断统 计; 其中, 所述权 重和所述加权矩阵表示 为: 其中, ws表示为所述权重, d( ·)可用欧式距离来度量偏差, U为所述多个用户端口的表 示向量, V为所述多个真值发现任务的表示向量, W为所述多个用户端口的权重集合, β 为矩 阵分解的超参数(设置为1即可)。 9.根据权利要求8所述的方法, 其特征在于, 根据 所述加噪数据和所述推断统计得到的 剩余数据值, 得到每 个采样任务的真值, 包括: 根据推断统计得出的未被采样到的数据, 并结合所述加噪数据进行计算直至收敛, 得 到所述每 个采样任务的真值, 其中所述计算的过程表示 为: 权 利 要 求 书 2/3 页 3 CN 115329368 A 3

PDF文档 专利 一种满足本地差分隐私的真值发现方法和电子设备

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种满足本地差分隐私的真值发现方法和电子设备 第 1 页 专利 一种满足本地差分隐私的真值发现方法和电子设备 第 2 页 专利 一种满足本地差分隐私的真值发现方法和电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:35:05上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。