(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210811818.6 (22)申请日 2022.07.11 (71)申请人 北京交通大 学 地址 100044 北京市海淀区上园村 3号 (72)发明人 郭保青 余祖俊 朱力强 王尧  阮涛  (74)专利代理 机构 北京卫平智业专利代理事务 所(普通合伙) 11392 专利代理师 闫萍 (51)Int.Cl. G06V 20/54(2022.01) G06V 10/74(2022.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) B61L 23/04(2006.01) (54)发明名称 一种基于小样本学习的铁路场景不常见入 侵目标识别方法 (57)摘要 本发明涉及一种基于小样本学习的铁路场 景不常见入侵目标识别方法。 本发 明可以实时采 集铁路沿线相机获取的铁 路场景图像, 利用改进 的度量元学习网络模型进行铁路场景中不常见 入侵目标的识别。 该模型包括预训练的特征映射 网络, 自学习类中心微调网络, 距离度量模块三 部分, 并采用中心相关损失函数进行度量元学习 模型的训练。 本发明可以对铁 路空场景以及场景 中包含但 不限于列车、 落石、 行人、 泥石流等类别 的图像进行分类识别。 当列车经过时不报警, 而 当铁路场景中有落石、 行人、 泥石流等异物入侵 铁路限界时则发出报警信息, 通过有线或无线 方 式提醒相关人员。 权利要求书2页 说明书7页 附图6页 CN 115393802 A 2022.11.25 CN 115393802 A 1.一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其特 征在于: 采用改进的度量元学习网络模型进行铁路场景中不常见入侵目标的识别, 改进的度量 元学习模 型包括预训练的特征映射网络, 自学习类中心微调网络, 距离度量模块三部 分; 并 采用中心相关损失函数进行 特征映射网络训练。 2.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其 特征在于, 包括如下步骤: 步骤1, 首先将具有与铁路图像特征类似的小样本公共数据集输入到随机初始化的特 征映射网络中进行 预训练, 得到预训练的特 征映射网络及其 参数; 步骤2, 利用小样本公共数据集建立元训练集, 输入到步骤1获得的预训练的特征映射 网络中进行度量元训练, 得到元训练的特 征映射网络及其 参数; 步骤3, 将铁路空场景图像、 入侵目标样本图像建立小样本支持集S, 输入至步骤2获得 的元训练的特征映射网络中, 利用元训练的特征映射网络将上述入侵目标样本映射到同一 个特征空间; 步骤4, 将步骤3获得的支持集图像特征输入到自学习类中心微调网络中, 学习得到各 图像类别的中心 表示; 步骤5, 将待测图像输入到步骤2获得的元训练的特征映射网络中, 获得待测图像的图 像特征, 然后利用距离度量模块计算待测图像特征与步骤4得到的各图像类别中心之间的 相似度, 得到入侵目标识别结果。 3.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其 特征在于: 步骤1中所述的特征映射网络为基于通道注意力机制的特征映射网络, 该特征映 射网络由两 部分组成: 第一部分由依次连接的四个残差块构成, 每 个残差块后附带一层最大池化层; 第二部分为改进通道 注意力模块。 4.如权利要求3所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其 特征在于: 所述改进通道 注意力模块包括: 信息压缩部分, 将卷积后的特征通过并行的全局最大池化层Fm(·)和全局平均池化层 Fa(·)在空间维度上进行压缩; 信息激励部分Fσ(·), 将上述全局池化层和全局平均池化层的特征相加融合, 利用激活 函数将融合后的特 征归一化到0‑1之间得到通道 注意力权 重值; 通道特征增强Fscale(·), 将获得的通道注意力权重值与原 特征值F相乘, 从而实现对关 键通道的注意力增强。 5.如权利要求3所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其 特征在于: 采用模型预训练方法获得所述的特征映射网络的初始网络参数, 再进 行元训练, 具体训练步骤如下: 步骤1‑1, 在基于通道注意力机制的特征映射网络上用标准的交叉熵损失训练一个分 类器, 并在训练的过程中采用一边训练一边元验证的方式, 保存在N ‑way K‑shot设置下元 验证准确率 最高的特 征映射网络作为预训练后的模型; 步骤1‑2, 提取预训练后的模型的网络参数, 迁移到度量元学习中, 采用元训练的方式 继续训练网络 。权 利 要 求 书 1/2 页 2 CN 115393802 A 26.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其 特征在于: 所述自学习类中心微调网络处 理算法步骤如下: 步骤2‑1, 对于支持集S中类别为k的所有样本Sk={xi|i=1, ..., N}, 经过特征映射网络 后得到特征 根据求得的均值作为可学习参数类k的中心原型在特征空间的初始值, 如下式(1): 步骤2‑2, 根据式(1)依次得到支 持集S中所有类中心原型的初始值, 利用softmax函数, 归一化支持集中样本 到每个初始类中心的距离, 得到属于类k的概 率, 如式(2): 其中d为两特 征向量在特 征空间的欧氏距离; 步骤2‑3, 据式(3)计算交叉熵损失: 7.如权利要求1所述的一种基于小样本学习的铁路场景不常见入侵目标识别方法, 其 特征在于: 所述采用中心相关损失函数进行 特征映射网络训练, 具体为: 中心损失Lc表达式具体如下式(4): 上式中λ为超参数, 在训练的过程中可以用于控制类内的距离; xi表示某一入侵目标样 本在特征空间中的特 征值, ck表示各图像 类别的类别中心; 同时, 在对特征映射网络进行训练中, 每次迭代时要采用支持集特征均值重新初始化 类别中心; 最后采用交叉熵损失和中心损失结合构建下式(5)表示的中心相关损失函数用于特征 映射网络训练: 权 利 要 求 书 2/2 页 3 CN 115393802 A 3

PDF文档 专利 一种基于小样本学习的铁路场景不常见入侵目标识别方法

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于小样本学习的铁路场景不常见入侵目标识别方法 第 1 页 专利 一种基于小样本学习的铁路场景不常见入侵目标识别方法 第 2 页 专利 一种基于小样本学习的铁路场景不常见入侵目标识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:28:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。