(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210912390.4
(22)申请日 2022.07.29
(71)申请人 中国工商银行股份有限公司
地址 100140 北京市西城区复兴门内大街
55号
(72)发明人 邹泳彤 李俊杰 周润坤 胡琳
(74)专利代理 机构 华进联合专利商标代理有限
公司 44224
专利代理师 李志健
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 21/60(2013.01)
G06K 9/62(2022.01)
G06N 3/02(2006.01)
(54)发明名称
数据处理方法、 装置、 设备、 存 储介质和产品
(57)摘要
本申请涉及一种数据处理方法、 装置、 计算
机设备、 存储介质和产品, 可用于信息安全领域,
该方法包括: 客户端在获取账户的账户数据后,
可以基于账户数据确定账户的至少一个业务事
件对应的业务特征; 然后可以针对每个业务事
件, 对业务事件对应的各个业务特征进行统计,
并基于统计结果确定账户数据的统计特征; 还基
于统计特征和各业务事件对应的业务特征, 得到
账户数据特征, 并对账户数据特征进行本地差分
保护处理, 得到处理后的账户数据特征; 最后, 客
户端可以将处理后的账户数据特征发送到服务
端, 以供服务端对处理后的账户数据特征进行分
析, 得到分析结果。 采用本方法能够降低账户数
据泄露的风险。
权利要求书3页 说明书21页 附图3页
CN 115048675 A
2022.09.13
CN 115048675 A
1.一种数据处 理方法, 其特 征在于, 所述方法包括:
获取账户的账户数据, 并基于所述账户数据确定所述账户的至少一个业务事件对应的
业务特征;
针对每个业务事件, 对所述业务事件对应的各个业务特征进行统计, 并基于统计结果
确定所述账户数据的统计特 征;
基于所述统计特征和各业务事件对应的业务特征, 得到账户数据特征, 并对所述账户
数据特征进行本地差分保护处 理, 得到处 理后的账户数据特 征;
将处理后的账户数据 特征发送到服务端, 以供所述服务端对所述处理后的账户数据 特
征进行分析, 得到分析 结果。
2.根据权利要求1所述的方法, 其特征在于, 所述基于所述账户数据确定所述账户的至
少一个业 务事件对应的业 务特征的步骤, 包括:
获取所述业务事件的事件类型;
确定所述业务事件的统计周期, 并基于所述账户数据, 获取每个统计周期内所述业务
事件在各个事 件类型下的事件描述信息;
基于每个统计周期内所述业务事件在各个事件类型下的事件描述信 息, 确定业务事件
的业务特征。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述账户数据, 获取每个统计周
期内所述 业务事件在各个事 件类型下的事件描述信息, 包括:
针对每个统计周期内所述事件类型的事件的发生情况, 获取与 所述发生情况对应的事
件指示标识;
根据所述事件类型在各个统计周期的事件指示标识生成数组, 并将所述数组作为所述
事件类型下的事件描述信息 。
4.根据权利要求1所述的方法, 其特征在于, 所述对所述业务事件对应的各个业务特征
进行统计, 并基于统计结果确定所述账户数据的统计特 征, 包括:
对所述业务事件对应的各个业 务特征进行统计, 得到多个统计指标 下的统计结果;
获取每个统计指标的证据权 重;
根据所述证据权重获取每个统计指标的信息值, 以及, 获取任意两个统计指标之间的
相关性;
从所述多个统计指标中获取所述信息值和所述相关性满足预设筛选条件的目标统计
指标, 并将所述目标统计指标的统计结果作为所述账户数据的账户数据的统计特 征。
5.根据权利要求1所述的方法, 其特征在于, 所述账户数据 特征的数据类型包括二元离
散型数据、 多 元离散型数据、 连续型数据中的至少一种; 所述对所述账户数据特征进 行本地
差分保护处 理, 得到处 理后的账户数据特 征, 包括:
若所述账户数据 特征的数据类型为二元离散型数据, 则根据预设的保护预算因子确定
扰动概率, 并根据扰动概 率调整所述账户数据特 征;
若所述账户数据 特征的数据类型为多元离散型数据, 则获取所述账户数据特征的回答
类型, 根据预设的保护预算因子和所述账户数据特征 的回答类型确定扰动概率, 并根据扰
动概率调整所述账户数据特 征;
若所述账户数据特征的数据类型为连续型数据, 则获取所述账户数据特征的离散范权 利 要 求 书 1/3 页
2
CN 115048675 A
2围, 根据所述账户数据特征和所述离散范围确定扰动概率, 并根据扰动概率调整所述账户
数据特征。
6.根据权利要求5所述的方法, 其特征在于, 所述根据预设的保护预算因子和所述账户
数据特征的回答类型确定扰动概 率的步骤, 包括:
若所述账户数据 特征是业务事件对应的业务特征, 获取所述账户数据 特征对应事件类
型的事件的发生频率;
根据所述保护预算因子、 所述账户数据特征的回答类型、 所述发生频率, 确定扰动概
率。
7.一种数据处 理方法, 其特 征在于, 所述方法包括:
接收客户端发送 的处理后的账户数据特征, 所述客户端用于获取账户的账户数据, 并
基于所述账户数据确定所述账户的至少一个业务事件对应的业务特征; 针对每个业务事
件, 对所述业务事件对应的各个业务特征进行统计, 并基于统计结果确定所述账户数据的
账户数据 统计特征; 基于账户数据 统计特征和 业务事件对应的业务特征, 得到账户数据特
征, 并对所述账户数据特 征进行本地差分保护处 理, 得到处 理后的账户数据特 征;
对所述处 理后的账户数据特 征进行分析, 得到分析 结果。
8.根据权利要求7所述的方法, 其特征在于, 所述对所述处理后的账户数据特征进行分
析, 得到分析 结果的步骤, 包括:
获取针对同一个业 务事件的处理后的账户数据特 征;
对所述同一个业务事件的处理后的账户数据 特征进行求和, 并基于扰动 概率和求和结
果对同一个业务事件的处理后的账户数据特征进行校正, 得到校正后的账户数据特征; 所
述扰动概 率为所述客户端对所述账户数据特 征进行本地差分保护处 理时采用的概 率;
从所述校正后的账户数据特征中获取多个目标账户数据 特征, 并对所述多个目标账户
数据特征进行分析, 得到分析 结果。
9.根据权利要求8所述的方法, 其特征在于, 所述对所述多个目标账户数据特征进行分
析, 得到分析 结果, 包括:
对所述多个目标账户数据特征进行划分, 得到多个特征集合; 每个特征集合中的各目
标账户数据特 征为同一 业务任务下 各业务事件的目标 账户数据特 征;
针对每个特征集合, 将所述特征集合中的各目标账户数据 特征输入至所述特征集合对
应的训练好的问答子模型, 得到问答结果; 其中, 各个问答子模型输出的问答结果针对同一
问题;
根据多个问答结果, 确定每种问答结果对应的数量;
根据每种问答结果对应的数量获取所述问题的目标问答结果, 并基于所述问答结果得
到分析结果。
10.根据权利要求9所述的方法, 其特征在于, 所述根据多个问答结果, 确定每种问答结
果对应的数量, 包括:
根据多个问答结果, 确定每种问答结果对应的初始数量;
确定初始数量 最多的两种问答结果, 并计算所述两种问答结果的初始数量的差值;
根据所述差值确定噪声值, 并基于所述噪声值对多种问答结果中的至少一种问答结果
的初始数量进 行调整, 并根据调整 结果得到多种问答结果对应的数量; 其中, 所述噪声值小权 利 要 求 书 2/3 页
3
CN 115048675 A
3
专利 数据处理方法、装置、设备、存储介质和产品
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:46上传分享