(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210773627.5
(22)申请日 2022.07.01
(71)申请人 深圳致星科技有限公司
地址 518000 广东省深圳市南 山区粤海街
道大冲社区深南大道9676号大冲商务
中心 (一期) 2栋 3号楼18C -1
(72)发明人 赵荣 薛新江
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
专利代理师 冯艳莲
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 16/9536(2019.01)
G06F 21/62(2013.01)
(54)发明名称
多方协作场景 下的数据推荐方法及装置
(57)摘要
本申请提供多方协作场景下的数据推荐方
法及装置, 其中方法包括: 数据源方发布的合作
数据集中的每个数据集合通过该数据集合的标
签特征以及所述标签特征对应的至少一个业务
主题与一个或多个应用场景相关联。 当接收到来
自数据应用方的数据需求信息, 该数据需求信息
用于指示数据推荐需要满足的应用场景、 业务主
题或标签特征中的一项或多项的组合, 数据源 方
可根据各个数据集合与数据应用方的数据需求
信息之间的关联程度的得分, 确定一个或多个推
荐数据集合, 并将推荐数据集合的信息发送给数
据应用方。 该方法可以提高多方协作场景下数据
推荐的精确性, 例如在多 方协作执行隐私计算任
务或联邦学习任务时进行更精准的隐私数据推
荐。
权利要求书4页 说明书21页 附图4页
CN 115080858 A
2022.09.20
CN 115080858 A
1.一种多方协作场景下的数据推荐方法, 其特征在于, 所述方法应用于数据源方, 所述
方法包括:
接收来自数据应用方的数据需求信 息, 所述数据需求信 息用于指示数据推荐需要满足
的应用场景、 业 务主题或标签特 征中的一项或多 项的组合;
根据合作数据集中的各个数据集合与所述数据需求信 息的关联程度的得分, 确定一个
或多个推荐数据集合; 其中, 所述合作数据集中的每个数据集合通过该数据集合的标签特
征以及所述标签特 征对应的至少一个业 务主题与一个或多个 应用场景相关联;
将所述一个或多个 推荐数据集 合的信息发送给 所述数据应用方。
2.根据权利要求1所述的方法, 其特征在于, 所述数据需求信 息包括一个或多个应用组
主题, 每个应用组主题对应一个 应用场景;
所述方法还 包括:
针对所述合作 数据集中的每个数据集合, 计算所述数据集合与 所述数据需求信 息中的
各个应用组主题的关联程度的得分, 并将所述数据集合分别对应所述各个应用组主题的关
联程度的得分之和, 确定为所述数据集 合与所述数据需求信息的关联程度的得分。
3.根据权利要求2所述的方法, 其特征在于, 当第 一应用组主题仅用于指示数据推荐需
要满足第一应用场景, 所述第一应用组主题为所述 一个或多个 应用组主题之一;
所述数据集 合与所述第一应用组主题的关联程度的得分等于:
所述数据集合经过该数据集合的标签特征、 所述标签特征对应的业务主题到达所述第
一应用场景的路径个数。
4.根据权利要求2所述的方法, 其特征在于, 当第 一应用组主题用于指示数据推荐需要
满足第一应用场景和 第一业务主题的组合, 所述第一应用组主题为所述一个或多个应用组
主题之一;
所述数据集 合与所述第一应用组主题的关联程度的得分等于:
所述数据集合经过该数据集合的标签特征、 所述第 一业务主题到达所述第 一应用场景
的路径个数; 或者,
所述数据集合经过该数据集合的标签特征到达所述第 一业务主题的路径个数, 与 所述
数据集合经过该数据集合的标签特征以及所述标签特征对应的业务主题到达所述第一应
用场景的路径个数之和。
5.根据权利要求2所述的方法, 其特征在于, 当第 一应用组主题用于指示数据推荐需要
满足第一应用场景、 第一业务主题和第一标签特征 的组合, 所述第一应用组主题为所述一
个或多个 应用组主题之一;
所述数据集 合与所述第一应用组主题的关联程度的得分等于:
所述数据集合经过所述第 一标签特征、 所述第 一业务主题到达所述第 一应用场景的路
径个数; 或者,
所述数据集合到达所述第 一标签特征的路径个数, 与 所述数据集合经过该数据集合的
标签特征到达所述第一业务主题的路径个数、 所述数据集合经过该数据集合的标签特征及
所述标签特 征对应的业 务主题到 达所述第一应用场景的路径个数之和。
6.根据权利要求1所述的方法, 其特征在于, 所述将所述一个或多个推荐数据集合的信
息发送给 所述数据应用方, 包括:权 利 要 求 书 1/4 页
2
CN 115080858 A
2将所述一个或多个推荐数据集合的数据集合标识和每个所述推荐数据集合与所述数
据需求信息的关联程度的得分, 发送给 所述数据应用方。
7.根据权利要求1至 6中任一项所述的方法, 其特 征在于, 所述方法还 包括:
获取用户上传的合作数据文件;
通过对所述合作数据文件中各个数据表中的数据字段添加对应的标签特征、 业务主题
和应用场景, 生 成合作数据集, 所述合作数据集包括一个或多个数据集合, 每个数据集合包
括一个或多个数据字段的数据。
8.根据权利要求7所述的方法, 其特征在于, 所述通过对所述合作数据文件中各个数据
表中的数据字段 添加对应的标签特 征、 业务主题和应用场景, 生成合作数据集, 包括:
对所述合作 数据文件中各个数据表中的每个数据字段添加标签特征, 并根据 所述各个
数据字段的标签特 征生成所述 合作数据集包括的一个或多个数据集 合;
针对每个数据集合, 根据所述数据集合中各个数据字段的标签特征, 确定所述数据集
合的标签特 征;
根据所述数据集合的标签特征和预设的标签特征与业务主题之间的映射关系, 确定所
述数据集 合关联的业 务主题;
根据所述数据集合关联的业务主题和预设的业务主题与应用场景之间的映射关系, 确
定所述数据集 合关联的应用场景。
9.根据权利要求8所述的方法, 其特 征在于, 所述方法还 包括:
根据所述合作数据集中的各个数据集合关联的标签特征、 业务主题和应用场景, 确定
所述合作数据集的属 性信息; 其中, 所述合作数据集的属 性信息包括所述合作数据集相关
的应用场景、 业务主题和标签特征, 以及应用场景与业务主题之间的映射关系, 业务主题与
标签特征之间的映射关系;
将所述合作数据集的属性信息发送给 所述数据应用方。
10.根据权利要求9所述的方法, 其特征在于, 所述合作数据集的属性信息还包括所述
合作数据集中的每个数据集合的属 性信息, 所述数据集合的属 性信息包括数据集合标识、
数据集合名称、 数据描述信息、 数据量信息和更新时间信息中的一项或多 项。
11.一种多方协作场景下的数据推荐方法, 其特征在于, 所述方法应用于数据应用方,
所述方法包括:
向数据源方发送数据需求信 息, 所述数据需求信 息用于指示数据推荐需要满足的应用
场景、 业务主题或标签特 征中的一项或多 项的组合;
接收来自所述数据源方的合作数据集中的一个或多个推荐数据集合的信 息; 所述一个
或多个推荐数据集合是根据所述合作数据集中的各个数据集合与所述数据需求信息的关
联程度的得分确定的, 其中, 所述合作数据集中的每个数据集合通过该数据集合的标签特
征以及所述标签特 征对应的至少一个业 务主题与一个或多个 应用场景相关联;
所述数据应用方根据所述 一个或多个 推荐数据集 合的信息, 确定目标 数据集合。
12.根据权利要求11所述的方法, 其特征在于, 所述接收来自所述数据源方的合作 数据
集中的一个或多个 推荐数据集 合的信息, 包括:
接收来自所述数据源方的所述一个或多个推荐数据集合的数据集合标识和每个所述
推荐数据集 合与所述数据需求信息的关联程度的得分;权 利 要 求 书 2/4 页
3
CN 115080858 A
3
专利 多方协作场景下的数据推荐方法及装置
文档预览
中文文档
30 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共30页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:35:06上传分享