standard download
(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 20221074515 5.2 (22)申请日 2022.06.29 (65)同一申请的已公布的文献号 申请公布号 CN 114817968 A (43)申请公布日 2022.07.29 (73)专利权人 深圳红途科技有限公司 地址 518000 广东省深圳市南 山区粤海街 道滨海社区滨海 大道3398号赛西科技 大厦17层170 6房 (72)发明人 黄俊辉 刘小龙  (74)专利代理 机构 深圳市精英专利事务所 44242 专利代理师 李燕娥 (51)Int.Cl. G06F 21/60(2013.01)G06F 21/62(2013.01) (56)对比文件 CN 114117311 A,2022.03.01 CN 113360800 A,2021.09.07 CN 113360799 A,2021.09.07 CN 111784320 A,2020.10.16 CN 107809346 A,2018.0 3.16 CN 114649033 A,2022.06.21 CN 112448969 A,2021.0 3.05 CN 112115023 A,2020.12.2 2 审查员 宋梦玲 (54)发明名称 无特征数据 的路径追溯方法、 装置、 设备及 存储介质 (57)摘要 本申请涉及一种无特征数据的路径追溯方 法、 装置、 设备及存储介质, 其中方法包括采集应 用服务的传输数据以及接口信息, 并基于传输数 据以及接口信息, 获取关联信息; 获取预设数据 标签以及用户访问 的URL, 并将用户访问 的URL以 及预设数据标签与关联信息进行匹配处理, 以获 取目标应用接口以及目标数据; 创建追踪标识, 将目标数据中的节点与链路进行串联, 得到目标 数据对应的链路信息; 采集调用信息, 并将调用 信息存储于预设数据库中; 采集用户访问行为日 志, 并从预设数据库中的调用信息识别对应链路 信息, 得到数据追溯结果。 本发明实现对无特征 数据进行精 准分析, 从而对无特征数据进行全流 转路径的追溯, 有利于提高无特征数据路径追溯 的精准度。 权利要求书3页 说明书10页 附图4页 CN 114817968 B 2022.10.14 CN 114817968 B 1.一种无 特征数据的路径追溯方法, 其特 征在于, 包括: 通过字节码增强技 术, 采集应用服 务的传输数据以及所述传输数据对应的接口信息; 构建敏感数据对应的正则匹配项, 通过正则匹配的方式, 识别所述传输数据中的所述 敏感数据, 并对所述敏感数据访问过程中所涉及的对应接口信息进行识别, 得到关联应用 接口, 并基于所述传输数据以及所述接口信息, 获取关联信息, 其中, 所述关联信息包括关 联应用接口以及所述关联应用接口对应的无 特征数据; 基于预设的采集策略, 获取 所述关联应用接口对应的无 特征数据; 获取预设数据标签以及用户访问的URL; 分别对所述用户访问的URL和所述关联应用接口进行分割, 得到访问URL路径和关联应 用结果有序数组, 并对所述访问URL路径进行分割, 得到有序数组; 遍历所述有序 数组, 并将所述有序 数组与所述关联应用结果有序 数组相同位置的值进 行对比, 以确 定所述用户访问的URL所匹配成功的API接口, 并将所述API接口进行标记, 得 到目标应用接口; 将所述用户访 问的URL对应的字段与所述目标应用接口对应的字段进行关联, 并获取 所述预设数据标签中关于所述用户访问的URL对应的字段, 作为目标字段, 且将所述目标字 段所对应的数据标签关联至所述目标应用接口对应的字段, 得到所述目标应用接口对应的 无特征数据, 且将所述目标应用接口对应的无特征数据标记 为目标数据, 其中, 所述目标数 据中包括用户发起的请求信息, 所述预设数据标签包括数据标识、 数据分类以及数据分级; 基于所述用户发起的请求信息, 创建所述目标数据中的追踪标识, 并基于所述追踪标 识将所述目标 数据中的节点与链路进行串联, 得到所述目标 数据对应的链路信息; 通过预先部署在所述链路信息中的探针, 采集所述链路信息上的调用信息; 通过HTTP接口传输数据方式, 将所述调用信息传输至链路收集器中, 并在所述链路收 集器中按照信息类别, 将所述调用信息进行分类整合处理, 得到处理后的调用信息, 其中, HTTP接口传输数据方式是指根据超文本传输协议HTTP的数据传输, 包括GET函数获取资源、 POST函数传输实体主体以及PUT函数传输文件, 所述信息类别包括调用时间范围、 节点名称 以及用户账号; 将所述处 理后的调用信息存 储于预设数据库中; 采集用户访问行为日志, 并对所述用户访问行为日志进行解析, 得到用户ID和SQL语 句; 基于所述用户ID以及 所述SQL语句, 构 建定位信息, 其 中, 定位信息包括所述用户ID、 应 用、 数据库及数据间四层关联; 根据所述定位信 息从所述预设数据库中的所述调用信 息识别对应链路信 息, 得到数据 追溯结果, 其中, 数据追溯结果包括用户账号、 IP、 时间、 应用接口、 访问链路、 数据库/表/字 段以及查询语句。 2.根据权利要求1所述的无特征数据的路径追溯方法, 其特征在于, 所述基于所述用户 发起的请求信息, 创建所述 目标数据中的追踪标识, 并基于所述追踪标识将所述 目标数据 中的节点与链路进行串联, 得到所述目标 数据对应的链路信息, 包括: 基于所述用户发起的请求信息, 创建所述目标 数据中的追踪标识; 识别所述目标 数据中与所述追踪标识相同的节点, 作为目标节点;权 利 要 求 书 1/3 页 2 CN 114817968 B 2从所述目标数据中提取所述目标节点的上下文信 息, 并基于所述上下文信 息构建父节 点编号和当前节点编号; 基于所述当前节点编号和所述父节点编号, 将所述目标数据中的节点与链路进行串 联, 得到所述目标 数据对应的链路信息 。 3.根据权利要求2所述的无特征数据的路径追溯方法, 其特征在于, 所述基于所述当前 节点编号和所述父节点编号, 将所述 目标数据中的节点与链路进行串联, 得到所述 目标数 据对应的链路信息, 包括: 基于节点访问顺序, 将所述上 下文信息进行排序, 得到排序结果; 基于所述排序结果, 将所述当前节点编号和所述父节点编号进行叠加, 以使得所述目 标数据中的节点与链路进行串联, 得到所述目标 数据对应的链路信息 。 4.一种无 特征数据的路径追溯装置, 其特 征在于, 包括: 数据采集模块, 用于通过字节码增强技术, 采集应用服务的传输数据以及所述传输数 据对应的接口信息; 关联应用接口识别模块, 用于构建敏感数据对应的正则匹配项, 通过正则匹配的方式, 识别所述传输数据中的所述敏感数据, 并对所述敏感数据访问过程中所涉及的对应接口信 息进行识别, 得到关联应用接口, 并基于所述传输数据以及所述接口信息, 获取关联信息, 其中, 所述关联信息包括关联应用接口以及所述关联应用接口对应的无 特征数据; 无特征数据获取模块, 用于基于预设的采集策略, 获取所述关联应用接口对应的无特 征数据; 数据标签获取模块, 用于获取 预设数据标签以及用户访问的URL; 目标应用接口获取模块, 用于分别对所述用户访 问的URL和所述关联应用接口进行分 割, 得到访问URL路径和关联应用结果有序数 组, 并对所述访问URL路径进 行分割, 得到有序 数组; 目标数据标记模块, 用于遍历所述有序数组, 并将所述有序数组与所述关联应用结果 有序数组相同位置的值进行对比, 以确定所述用户访问的URL所匹配成功的API接口, 并将 所述API接口进行 标记, 得到目标应用接口; 目标数据获取模块, 用于将所述用户访 问的URL对应的字段与所述目标应用接口对应 的字段进 行关联, 并获取所述预设数据标签中关于所述用户访问的URL对应的字段, 作为目 标字段, 且将所述 目标字段所对应的数据标签关联至所述 目标应用接口对应的字段, 得到 所述目标应用接口对应的无特征数据, 且将所述目标应用接口对应的无特征数据标记为目 标数据, 其中, 所述目标数据中包括用户发起的请求信息, 所述预设数据标签包括数据标 识、 数据分类以及数据分级; 链路信息生成模块, 用于基于所述用户发起的请求信息, 创建所述目标数据中的追踪 标识, 并基于所述追踪标识将所述 目标数据中的节点与链路进行串联, 得到所述 目标数据 对应的链路信息; 调用信息采集模块, 用于通过预先部署在所述链路信息中的探针, 采集所述链路信息 上的调用信息; 调用信息采集模块, 用于通过HTTP接口传输数据方式, 将所述调用信息传输至链路收 集器中, 并在所述链路收集器中按照信息类别, 将所述调用信息进 行分类整合处理, 得到处权 利 要 求 书 2/3 页 3 CN 114817968 B 3

PDF文档 专利 无特征数据的路径追溯方法、装置、设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 无特征数据的路径追溯方法、装置、设备及存储介质 第 1 页 专利 无特征数据的路径追溯方法、装置、设备及存储介质 第 2 页 专利 无特征数据的路径追溯方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:35:09上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。