(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210751534.2
(22)申请日 2022.06.29
(71)申请人 云南电网有限责任公司信息中心
地址 650000 云南省昆明市拓东路73号
(72)发明人 毛正雄 李辉 黄祖源 田园
陆光前 耿贞伟 张航 保富
原野
(74)专利代理 机构 西安通大专利代理有限责任
公司 6120 0
专利代理师 张宇鸽
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06N 20/00(2019.01)G06F 17/18(2006.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
H04L 9/08(2006.01)
(54)发明名称
基于纵向联邦逻辑回归的企业电费缴纳风
险预测方法及系统
(57)摘要
本发明公开了一种基于纵向联邦逻辑回归
的企业电费缴纳风险预测方法及系统, 利用秘密
共享技术保护了电网和工信局联合风险预测时
的数据隐私安全, 并实现了集中式训练级别的模
型效用性。 通过使用秘密共享技术取代同态加密
技术, 有效降低了整体的计算复杂度与高昂的通
信成本, 并可满足实际场景中处理大体量数据的
需求。 通过使用秘密共享技术取代差分隐私技
术, 可有效提升模型精准度, 并满足实际风险预
测场景中的精准预测。
权利要求书4页 说明书10页 附图2页
CN 115392531 A
2022.11.25
CN 115392531 A
1.基于纵向联邦 逻辑回归的企业电费缴纳风险预测方法, 其特 征在于, 包括:
步骤1、 样本对齐; 输入预测模型训练所需的数据集, 并调用加密隐私求交协议进行数
据的ID求交和对齐;
步骤2、 参数初始化; 初始化预测模型, 最大迭代次数T, 学习率α, 学习终止条件和 纵向
逻辑回归 模型的模型参数θA和 θB;
步骤3、 秘密份额安全交互; 基于纵向逻辑回归模型的模型参数、 样本对齐后的数据, 获
取逻辑回归模型 的中间参数; 基于逻辑回归模型 的中间参数和生成随机秘密份额, 获取中
间参数秘密份额和数据标签秘密份额;
步骤4、 计算模型损失; 基于 中间数据秘密份额和数据 标签秘密份额计算共享误差的秘
密份额;
步骤5、 计算梯度信息; 基于共享 误差的秘密份 计算模型误差, 并计算模型梯度信息;
步骤6、 更新模型参数; 利用模型梯度信息及 初始化设置的学习率更新模型参数;
步骤7、 完成模型训练; 迭代步骤3至步骤7, 直至达到学习中止条件或给定的最大迭代
次数T, 完成训练。
2.根据权利要求1所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法, 其特
征在于, 所述步骤1、 步骤3、 步骤4、 步骤5和 到步骤6为发起方和参与方共同参与的工作; 所
述步骤2为发起方 单独参与的工作。
3.根据权利要求2所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法, 其特
征在于, 所述采集输入预测模型训练所需的数据集, 并调用加密隐私求交协议进行数据的
ID求交和对齐; 具体为:
发起方与参与方输入预测模型训练所需的数据集(XA,Y)、 XB, 并调用加密隐私 求交协议
进行数据ID的求交和对齐, 确定双方数据中可以用来进 行模型训练的交集部 分并形成ID一
一对齐的联合数据表, 此时双方 的交集数据仍然分别存储在各自的本地空间, 分别表示为
(X′A,Y′)、 X′B。
4.根据权利要求3所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法, 其特
征在于, 所述随机秘密份额为参与方和发起方随机 生成; 发起方生成随机秘密份额
参与
方生成随机 秘密份额
5.根据权利要求4所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法, 其特
征在于, 所述基于纵向逻辑回归模型的模型参数、 样本对齐后的数据, 获取逻辑回归模型的
中间参数; 基于逻辑回归模型 的中间参数和生成随机秘密份额, 获取中间参数秘密份额和
数据标签秘密份额; 具体为:
发起方基于样本对齐后的己方数据(X ′A,Y′)中的数据X ′A计算逻辑回归模型 的中间参
数uA, 并计算应属于参与方的中间参数秘密份额<uA>B、 应属于发起方的中间参数秘密份额<
uA>A, 基于样本对齐后的己方数据(X ′A,Y′)中的标签数据y ′计算应属于参与方的数据标签
秘密份额<Y′>B, 以及应属于发起 方的数据标签秘密份 额<Y′>A, 并将秘密份 额<uA>B、 <Y′>B发
送给参与方; 参与方基于样本对齐后的己方数据 X′B计算逻辑回归模型的中间参数uB, 计算
发起方的中间参数秘密份额为<uB>A, 参与方的秘密份额<uB>B, 并将秘密份额<uB>A发送发起
方。权 利 要 求 书 1/4 页
2
CN 115392531 A
26.根据权利要求5所述的基于纵向联邦逻辑回归的企业电费缴纳风险预测方法, 其特
征在于, 所述 步骤3的具体为推到过程 为:
步骤3.1、 建立纵向逻辑回归损失函数的优化问题
其中, θ∈Rn为模型参数, n为模型参数的维度, 同时为数据的特征维度, xi表示数据集X ′
∈Rm×n中第i个数据样本, X ′表示联合数据表XA′||X′B, m为交集数据的样本数目, yi为xi对应
的标签;
对数似然函数为
l( θ; xi; yi)=log(1+exp(yiθTxi))
假设发起方和参与方分别持有各自特征对应的模型参数
和
其中
nA为发起方模型参数θA的维度, nB为参与方模型参数θB的维度, 满足nA+nB=n, θ=θA||θB, ||
表示矩阵或向量的拼接;
将逻辑回归算法与加性秘密共享 技术相结合, 其中l og(1+e‑z)的Taylor展开形式:
基于此得到以上优化问题的二阶近似:
其中θT表示参数向量θ 的转置;
发起方的优化问题为:
参与方的优化问题为:
其中,
和
分别表示发起方和参与方模型参数θA和θB的转
置;
步骤3.2、 使用梯度下降法求解步骤3.1中的优化问题, 计算中间数据以便后续求解模
型参数;
发起方计算中间参数
为与参与方进行协作计算模型梯度, 将中间参数uA拆
分为两个秘密份额; 其中, 属于发起方的秘密份额为
属于参与方的秘密
份额
权 利 要 求 书 2/4 页
3
CN 115392531 A
3
专利 基于纵向联邦逻辑回归的企业电费缴纳风险预测方法及系统
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:35:09上传分享