(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 20221074515 5.2
(22)申请日 2022.06.29
(65)同一申请的已公布的文献号
申请公布号 CN 114817968 A
(43)申请公布日 2022.07.29
(73)专利权人 深圳红途科技有限公司
地址 518000 广东省深圳市南 山区粤海街
道滨海社区滨海 大道3398号赛西科技
大厦17层170 6房
(72)发明人 黄俊辉 刘小龙
(74)专利代理 机构 深圳市精英专利事务所
44242
专利代理师 李燕娥
(51)Int.Cl.
G06F 21/60(2013.01)G06F 21/62(2013.01)
(56)对比文件
CN 114117311 A,2022.03.01
CN 113360800 A,2021.09.07
CN 113360799 A,2021.09.07
CN 111784320 A,2020.10.16
CN 107809346 A,2018.0 3.16
CN 114649033 A,2022.06.21
CN 112448969 A,2021.0 3.05
CN 112115023 A,2020.12.2 2
审查员 宋梦玲
(54)发明名称
无特征数据 的路径追溯方法、 装置、 设备及
存储介质
(57)摘要
本申请涉及一种无特征数据的路径追溯方
法、 装置、 设备及存储介质, 其中方法包括采集应
用服务的传输数据以及接口信息, 并基于传输数
据以及接口信息, 获取关联信息; 获取预设数据
标签以及用户访问 的URL, 并将用户访问 的URL以
及预设数据标签与关联信息进行匹配处理, 以获
取目标应用接口以及目标数据; 创建追踪标识,
将目标数据中的节点与链路进行串联, 得到目标
数据对应的链路信息; 采集调用信息, 并将调用
信息存储于预设数据库中; 采集用户访问行为日
志, 并从预设数据库中的调用信息识别对应链路
信息, 得到数据追溯结果。 本发明实现对无特征
数据进行精 准分析, 从而对无特征数据进行全流
转路径的追溯, 有利于提高无特征数据路径追溯
的精准度。
权利要求书3页 说明书10页 附图4页
CN 114817968 B
2022.10.14
CN 114817968 B
1.一种无 特征数据的路径追溯方法, 其特 征在于, 包括:
通过字节码增强技 术, 采集应用服 务的传输数据以及所述传输数据对应的接口信息;
构建敏感数据对应的正则匹配项, 通过正则匹配的方式, 识别所述传输数据中的所述
敏感数据, 并对所述敏感数据访问过程中所涉及的对应接口信息进行识别, 得到关联应用
接口, 并基于所述传输数据以及所述接口信息, 获取关联信息, 其中, 所述关联信息包括关
联应用接口以及所述关联应用接口对应的无 特征数据;
基于预设的采集策略, 获取 所述关联应用接口对应的无 特征数据;
获取预设数据标签以及用户访问的URL;
分别对所述用户访问的URL和所述关联应用接口进行分割, 得到访问URL路径和关联应
用结果有序数组, 并对所述访问URL路径进行分割, 得到有序数组;
遍历所述有序 数组, 并将所述有序 数组与所述关联应用结果有序 数组相同位置的值进
行对比, 以确 定所述用户访问的URL所匹配成功的API接口, 并将所述API接口进行标记, 得
到目标应用接口;
将所述用户访 问的URL对应的字段与所述目标应用接口对应的字段进行关联, 并获取
所述预设数据标签中关于所述用户访问的URL对应的字段, 作为目标字段, 且将所述目标字
段所对应的数据标签关联至所述目标应用接口对应的字段, 得到所述目标应用接口对应的
无特征数据, 且将所述目标应用接口对应的无特征数据标记 为目标数据, 其中, 所述目标数
据中包括用户发起的请求信息, 所述预设数据标签包括数据标识、 数据分类以及数据分级;
基于所述用户发起的请求信息, 创建所述目标数据中的追踪标识, 并基于所述追踪标
识将所述目标 数据中的节点与链路进行串联, 得到所述目标 数据对应的链路信息;
通过预先部署在所述链路信息中的探针, 采集所述链路信息上的调用信息;
通过HTTP接口传输数据方式, 将所述调用信息传输至链路收集器中, 并在所述链路收
集器中按照信息类别, 将所述调用信息进行分类整合处理, 得到处理后的调用信息, 其中,
HTTP接口传输数据方式是指根据超文本传输协议HTTP的数据传输, 包括GET函数获取资源、
POST函数传输实体主体以及PUT函数传输文件, 所述信息类别包括调用时间范围、 节点名称
以及用户账号;
将所述处 理后的调用信息存 储于预设数据库中;
采集用户访问行为日志, 并对所述用户访问行为日志进行解析, 得到用户ID和SQL语
句;
基于所述用户ID以及 所述SQL语句, 构 建定位信息, 其 中, 定位信息包括所述用户ID、 应
用、 数据库及数据间四层关联;
根据所述定位信 息从所述预设数据库中的所述调用信 息识别对应链路信 息, 得到数据
追溯结果, 其中, 数据追溯结果包括用户账号、 IP、 时间、 应用接口、 访问链路、 数据库/表/字
段以及查询语句。
2.根据权利要求1所述的无特征数据的路径追溯方法, 其特征在于, 所述基于所述用户
发起的请求信息, 创建所述 目标数据中的追踪标识, 并基于所述追踪标识将所述 目标数据
中的节点与链路进行串联, 得到所述目标 数据对应的链路信息, 包括:
基于所述用户发起的请求信息, 创建所述目标 数据中的追踪标识;
识别所述目标 数据中与所述追踪标识相同的节点, 作为目标节点;权 利 要 求 书 1/3 页
2
CN 114817968 B
2从所述目标数据中提取所述目标节点的上下文信 息, 并基于所述上下文信 息构建父节
点编号和当前节点编号;
基于所述当前节点编号和所述父节点编号, 将所述目标数据中的节点与链路进行串
联, 得到所述目标 数据对应的链路信息 。
3.根据权利要求2所述的无特征数据的路径追溯方法, 其特征在于, 所述基于所述当前
节点编号和所述父节点编号, 将所述 目标数据中的节点与链路进行串联, 得到所述 目标数
据对应的链路信息, 包括:
基于节点访问顺序, 将所述上 下文信息进行排序, 得到排序结果;
基于所述排序结果, 将所述当前节点编号和所述父节点编号进行叠加, 以使得所述目
标数据中的节点与链路进行串联, 得到所述目标 数据对应的链路信息 。
4.一种无 特征数据的路径追溯装置, 其特 征在于, 包括:
数据采集模块, 用于通过字节码增强技术, 采集应用服务的传输数据以及所述传输数
据对应的接口信息;
关联应用接口识别模块, 用于构建敏感数据对应的正则匹配项, 通过正则匹配的方式,
识别所述传输数据中的所述敏感数据, 并对所述敏感数据访问过程中所涉及的对应接口信
息进行识别, 得到关联应用接口, 并基于所述传输数据以及所述接口信息, 获取关联信息,
其中, 所述关联信息包括关联应用接口以及所述关联应用接口对应的无 特征数据;
无特征数据获取模块, 用于基于预设的采集策略, 获取所述关联应用接口对应的无特
征数据;
数据标签获取模块, 用于获取 预设数据标签以及用户访问的URL;
目标应用接口获取模块, 用于分别对所述用户访 问的URL和所述关联应用接口进行分
割, 得到访问URL路径和关联应用结果有序数 组, 并对所述访问URL路径进 行分割, 得到有序
数组;
目标数据标记模块, 用于遍历所述有序数组, 并将所述有序数组与所述关联应用结果
有序数组相同位置的值进行对比, 以确定所述用户访问的URL所匹配成功的API接口, 并将
所述API接口进行 标记, 得到目标应用接口;
目标数据获取模块, 用于将所述用户访 问的URL对应的字段与所述目标应用接口对应
的字段进 行关联, 并获取所述预设数据标签中关于所述用户访问的URL对应的字段, 作为目
标字段, 且将所述 目标字段所对应的数据标签关联至所述 目标应用接口对应的字段, 得到
所述目标应用接口对应的无特征数据, 且将所述目标应用接口对应的无特征数据标记为目
标数据, 其中, 所述目标数据中包括用户发起的请求信息, 所述预设数据标签包括数据标
识、 数据分类以及数据分级;
链路信息生成模块, 用于基于所述用户发起的请求信息, 创建所述目标数据中的追踪
标识, 并基于所述追踪标识将所述 目标数据中的节点与链路进行串联, 得到所述 目标数据
对应的链路信息;
调用信息采集模块, 用于通过预先部署在所述链路信息中的探针, 采集所述链路信息
上的调用信息;
调用信息采集模块, 用于通过HTTP接口传输数据方式, 将所述调用信息传输至链路收
集器中, 并在所述链路收集器中按照信息类别, 将所述调用信息进 行分类整合处理, 得到处权 利 要 求 书 2/3 页
3
CN 114817968 B
3
专利 无特征数据的路径追溯方法、装置、设备及存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:35:09上传分享