(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210695834.3
(22)申请日 2022.06.20
(71)申请人 武汉纺织大 学
地址 430200 湖北省武汉市江夏区阳光大
道1号
(72)发明人 夏钦宇 董仕 夏元俊 彭涛
(74)专利代理 机构 安徽初升专利代理事务所
(普通合伙) 3423 3
专利代理师 曹雪菲
(51)Int.Cl.
G06V 10/774(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/46(2022.01)
G06V 10/62(2022.01)G06V 10/764(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
H04L 9/40(2022.01)
H04L 41/16(2022.01)
(54)发明名称
一种基于会话时空特征相残差的物联网设
备识别模型
(57)摘要
本发明属于物联网设备识别技术领域, 且公
开了一种基于会话时空特征相残差的物联网设
备识别模型, 包括设备指纹图生成模块、 Deep
convolutionalmaxout network模块和MTT模块。
本发明通过使用了一种混合深度学习识别模型,
能够直接将物联网设备原始通信流量作为深层
神经网络的输入 数据, 流量数据表征学习的整体
过程都由深层神经网络完成, 可节省大量的特征
工程工作量, 能够在降低任务的复杂 度的同时实
现对加密设备的识别, 通过残差结构恒等映射增
加网络深度的同时将会话的空间特征以及时序
特征相融合更大限度地提高物联网设备流量特
征的表征能力的同时不会产生额外的参数, 也不
会增加计算复杂 度, 以此来实现对物联网设备高
精度的识别目标。
权利要求书1页 说明书5页 附图1页
CN 115331068 A
2022.11.11
CN 115331068 A
1.一种基于会话时空特征相残差的物联网设备识别模型, 其特征在于: 包括设备指纹
图生成模块、 De ep convolutional maxout network模块和MT T模块;
S1.设备指纹图生成: 对原始流量数据集进行一系列处理, 得到会话生成的设备指纹
图, 将得到的设备指纹图按照特定设备存储在相应的文件夹中, 作为下一阶段模型 的输入
数据;
S2.混合模型训练: 将生成的设备指纹图分为训练集样本和测试集样本, 将会话指纹图
进行分组, 将训练集样本输入通过Deep convolutional maxout network模块和MTT模块构
建的混合深度学习模型进行训练, Deep convolutional maxout network模块通过Maxout
单元激活函数和卷积神经网络相结合实现对物联网设备间通信会话的空间特征的自动提
取, MTT模块通过对基于Transformer的模型进行改进, 使用旋转位置编码进行位置编码, 将
多个时序Transformer进 行堆叠, 实现对会话以及会话间时序特征的提取, 获得会话内部以
及会话间的时序特征, 将时序特征使用残差结构进行特征 的融合, 并进一步学习到深层特
征, 通过训练获得混合模型并进行保存;
S3.物联网设备识别: 使用测试集样本对混合模型进行评估, 进一步得到对于训练集样
本和测试集样本及不同细粒度设备识别效果;
S4.模型评估: 通过评价标准针对两种不同的评估场景进行模型的评估, 即对模型本身
进行评估以及与现有的先进识别方法进行评估, 输入测试样本, 加载本地训练保存的最佳
模型, 通过一系列评价标准 来评估模型性能。
2.根据权利要求1所述的一种基于会话时空特征相残差的物联网设备识别模型, 其特
征在于: 针对 所述原始 流量数据的一系 列处理包括使用SplitCap脚本文件将原始 流量数据
中所包含的TCP以及UDP会话数据进行并行分割处理; 对设备通信数据包中如IP地址以及
MAC地址等会对实验结果造成干扰的字段以及与设备识别不相关的字段以及重复性数据进
行清除; 根据所需会话长度对流 量进行维度统一 化处理, 以将其 转换为模型的输入形式。
3.根据权利要求1所述的一种基于会话时空特征相残差的物联网设备识别模型, 其特
征在于: 所述训练集样本和 测试集样本的划分比例为7:3 。
4.根据权利要求1所述的一种基于会话时空特征相残差的物联网设备识别模型, 其特
征在于: 所述Deep convolutional maxout network模块包括卷积层、 池化层、 Maxout单元
激活函数以及全连接层。
5.根据权利要求1所述的一种基于会话时空特征相残差的物联网设备识别模型, 其特
征在于: 所述MT T模块由3个Transformer组成, 每 个所述Transformer有6个编码器组成。
6.根据权利要求5所述的一种基于会话时空特征相残差的物联网设备识别模型, 其特
征在于: 所述编码器包括有两个子层分别为多头注意力机制和前馈网络 。
7.根据权利要求6所述的一种基于会话时空特征相残差的物联网设备识别模型, 其特
征在于: 所述多头注意力机制实现对会话内部的时序特征进行提取, 所述前馈网络一个给
编码器提供输出的全连接网络 。权 利 要 求 书 1/1 页
2
CN 115331068 A
2一种基于会话时空特征相残差的物联网 设备识别模型
技术领域
[0001]本发明属于物联 网设备识别技术领域, 具体为一种基于会话时空特征相残差的物
联网设备识别模型。
背景技术
[0002]随着海量物联网设备陆续接入网络空间, 物联网设备数量急剧增长, 在设备进行
通信的过程中会传输大量的流量信息, 存在 网络资源不畅以及 网络延时的状况, 资源分配
不均匀的情况下极易发生网络拥塞, 进而导致传输延迟和数据包丢失的增加, 服务质量
(QoS)不能得到有效保障, 同时由于各种各样的物联网设备成为构建人与物、 物与物之间进
行信息交互的桥梁, 许多隐私安全问题也日益突出, 在利用互联网进行信息交互的同时也
暴露出诸多的网络安全问题, 由于物联网设备 的种类繁多、 数量庞大并且在自身设计上或
多或少地存在缺陷, 部分不法分子通过对物联网设备发起 攻击破坏整个网络空间
[0003]现有技术中的大多数识别方法是将指纹识别与传统的机器学习方法相结合, 通过
人工提取的方式获得物联网设备的特征信息, 然后采用例如K ‑近邻法(KNN)、 朴素贝叶斯、
决策树、 随机森林等机器学习相关算法对提取到的特征信息进行识别, 但是该方法提取到
的特征都是浅层特征, 还需要通过特征工程手动设计识别特征来提高识别准确 率, 人为干
预较为严重, 消耗大量的人力物力, 限制了其鲁棒性和泛化能力, 而近几年深度学习的快速
发展有效促进了物联网设备识别研究的进步, 然而目前现有的深度学习方法大多集中在设
备通信流量的单一模态特征表征上, 不能实现对设备流量特征 的全方位表征, 具有一定的
局限性。
发明内容
[0004]本发明的目的在于提供一种基于会话时空特征相残差的物联网设备识别模型, 以
解决上述背景技 术中提出的问题。
[0005]为了实现上述目的, 本发明提供如下技术方案: 一种基于会话时空特征相残差的
物联网设备识别模型, 包括 设备指纹图生成模块、 Deep convolutional maxout network模
块和MTT模块;
[0006]S1.设备指纹图生成: 对原始流量数据集进行一系列处理, 得到会话生成的设备指
纹图, 将得到的设备指纹图按照特定设备存储在相应的文件夹中, 作为下一 阶段模型 的输
入数据;
[0007]S2.混合模型训练: 将生成的设备指纹图分为训练集样本和测试集样本, 将会话指
纹图进行分组, 将训练集样本输入 通过Deep convolutional maxout network模块和MTT模
块构建的混合深度学习模型进行训练, Deep convolutional maxout network模块通过
Maxout单元激活函数和卷积神经网络相结合实现对物联网设备间通信会话的空间特征的
自动提取, MTT模块通过对基于Transformer的模型进行改进, 使用旋转位置编码进行位置
编码, 将多个时序Transformer进行堆叠, 实现对会话以及会话间时序特征的提取, 获得会说 明 书 1/5 页
3
CN 115331068 A
3
专利 一种基于会话时空特征相残差的物联网设备识别模型
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:26:03上传分享