(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202211258685.0 (22)申请日 2022.10.14 (65)同一申请的已公布的文献号 申请公布号 CN 115333869 A (43)申请公布日 2022.11.11 (73)专利权人 四川大学 地址 610000 四川省成 都市一环路南 一段 24号 (72)发明人 兰小龙 何俊江 王运鹏 张聿昊  梅鉴鑫 马宝强  (74)专利代理 机构 成都其知创新专利代理事务 所(普通合伙) 51326 专利代理师 王沙沙 (51)Int.Cl. H04L 9/40(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (56)对比文件 CN 115080982 A,202 2.09.20 WO 2021212675 A1,2021.10.28 CN 109117482 A,2019.01.01 审查员 邵娟 (54)发明名称 一种分布式网络对抗 攻击自训练学习方法 (57)摘要 本发明公开了一种分布式网络对抗攻击自 训练学习方法, 包括以下步骤: 步骤1: 原始攻击 样本通过对抗攻击模型产生变异样本; 步骤2: 变 异样本进入检测模型进行检测, 输出检测结果; 步骤3: 没有被检测出变异样本的对抗样本添加 到对抗样 本队列, 对抗样本队列达到设定阈值输 入步骤2的检测模型进行再训练, 直到所有的样 本检测完成; 本发明采用基于SAC算法的对抗攻 击模型结合检测模型, 对抗攻击模 型能够产生有 效检测模型检测率的对抗样本, 检测模型采用集 成式算法训练速度快; 抗干扰能力强, 训练效率 高, 满足网络靶场攻防演练需求。 权利要求书3页 说明书10页 附图2页 CN 115333869 B 2022.12.13 CN 115333869 B 1.一种分布式网络对抗 攻击自训练学习方法, 其特 征在于, 包括以下步骤: 步骤1: 原 始攻击样本通过对抗 攻击模型产生变异样本; 步骤2: 变异样本进入检测模型进行检测, 输出检测结果; 步骤3: 将没有被检测出变异样本的对抗样本添加到对抗样本队列, 对抗样本队列达到 设定阈值输入步骤2的检测模型进行 再训练, 直到所有的样本检测完成; 对抗攻击模型包括状态向量 生成模块、 对抗 攻击矩阵和SAC算法模块; 状态向量 生成模块用于将输入的攻击样本转换为状态向量; 对抗攻击矩阵用于将 样本突变为 突变样本; SAC算法模块 根据历史决策 经验选择 策略组合对样本进行突变; 步骤2中的检测模型包括预处 理模块、 语法特 征提取模块和抗干扰集成模块; 预处理模块用于对字符串 进行预处理, 过滤畸形字符串; 语法特征提取模块用于提取注入的语法信息特 征; 抗干扰集成模块用于对输入的语法信息特 征进行分类输出置信分数。 2.根据权利要求1所述的一种分布式网络对抗攻击自训练学习方法, 其特征在于, 所述 状态向量 生成模块处 理过程包括: 首先对攻击样本进行预处理, 生成静态样本状态向量, 根据突变策略生成动态样本状 态向量, 将静态样本状态向量和动态状态向量进行拼接即可 得到状态向量; 函数 表示一个样本的原始攻击样本  满足第i 个特征时取值 为1, 反之则为0; 则该样本的静态样本状态向量  可表示为: 其中,i为特征序号,n为特征个数; 动态样本状态向量 生成过程如下: 将策略执行前, 改变的文本结构定义为策略执行因子 k, 满足策略执行因子 k的样本 payloadj有函数D, 使得 , 反之为 ; 如下: 式中: 为满足策略执行因子 k的样本paylodorigin的函数D的值; 为满足策略执 行因子k的样本paylodj的函数D的值,j为样本序号; 对抗攻击策略中有 m个执行策略执行因子, 则该样本的动态状态向量 表示 为:权 利 要 求 书 1/3 页 2 CN 115333869 B 2式中:k为策略执行因子序号, m为策略执行因子个数, 为满足策略执 行因子k的样本paylod的函数D的值。 3.根据权利要求1所述的一种分布式网络对抗攻击自训练学习方法, 其特征在于, 所述 SAC算法模块中采用决策器选择 策略; 式中:  为最优策略,  为决策器,  为st状态下, 决策器有限采取 策略的熵值, α为温度参数, st为马尔科夫决策中 t时刻的状态, at为t时刻选取的动作, r(st, at)为在st状态下, 采取 at行为的反馈; 为符合策略器 所决策的 行为带来的回馈期望, ρ为转移概率。 4.根据权利要求1所述的一种分布式网络对抗攻击自训练学习方法, 其特征在于, 所述 预处理模块中预处 理方法如下: 首先进行URL 解码, 解码结果 通过科学计数法进行 过滤, 然后内嵌执 行过滤。 5.根据权利要求4所述的一种分布式网络对抗攻击自训练学习方法, 其特征在于, 所述 语法特征提取过程如下: 语法特 征提取模块处 理过程如下: 样本的文本为  ,语法解析函数为 fs, 样本序列化后的文本 tokens如下: 式中:l为样本序号, x为样本个数; 然后采用W ord2Vec方法, 将 样本序列化后的词嵌入向量 如下: 。 6.根据权利要求5所述的一种分布式网络对抗攻击自训练学习方法, 其特征在于, 所述 抗干扰集成模块包括 集成深度学习模型和集成算法; 集成深度学习模型包括3个深度学习模型; 分别为长短期记忆人工神经网络LSTM、 卷积 神经网络 CNN和多层感知器MLP; 根据集成深度 学习模型得到的检测结果通过集成算法获得最终检测结果; 集成算法选 择平均数模型、 投票制模型和最大值模型中的一种。 7.根据权利要求6所述的一种分布式网络对抗攻击自训练学习方法, 其特征在于, 所述 平均数模型计算每 个深度学习模型的置信分数的平均数 得到集成算法的置信分数; 第y个子模型的置信分数为  , 平均数模型计算得到的置信分数权 利 要 求 书 2/3 页 3 CN 115333869 B 3

PDF文档 专利 一种分布式网络对抗攻击自训练学习方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种分布式网络对抗攻击自训练学习方法 第 1 页 专利 一种分布式网络对抗攻击自训练学习方法 第 2 页 专利 一种分布式网络对抗攻击自训练学习方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:35上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。