(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210745758.2
(22)申请日 2022.06.29
(65)同一申请的已公布的文献号
申请公布号 CN 114821486 A
(43)申请公布日 2022.07.29
(73)专利权人 武汉纺织大 学
地址 430073 湖北省武汉市洪山区纺织路1
号
(72)发明人 刘军 姜明华 李会引 赵雅欣
朱佳龙 余锋
(74)专利代理 机构 武汉科皓知识产权代理事务
所(特殊普通 合伙) 42222
专利代理师 王琪
(51)Int.Cl.
G06V 20/52(2022.01)G06V 10/774(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06V 10/82(2022.01)
(56)对比文件
CN 114612813 A,202 2.06.10
CN 114612835 A,2022.06.10
CN 113610759 A,2021.1 1.05
CN 112990232 A,2021.0 6.18
CN 112270347 A,2021.01.26
US 2021027485 A1,2021.01.28
审查员 周锦
(54)发明名称
一种电力作业场景 下人员识别方法
(57)摘要
本发明公开了一种电力作业场景下人员识
别方法, 包括: 收集电力施工现场工作人员图像、
非施工人员图像和一些没有检测目标的图像, 并
将不同人员进行打标区分, 构成训练的数据集。
将收集到的数据集通过图像拼接、 图像翻转和增
加噪点等技术, 对数据集进行扩充。 目标检测 网
络使用扩充后的数据集进行训练, 获得人员识别
模型。 使用训练好的人员识别模 型实时检测现场
采集的图像, 检测到人员时输出人员的身份, 当
识别到的人员身份为非施工人员时进行提醒。 本
发明可以避免非施工人员误入电力施工现场的
状况, 有效实施对电力施工现场人员情况的监
督, 有力保证 了电力施工现场的生命财产安全。
权利要求书2页 说明书6页 附图2页
CN 114821486 B
2022.10.11
CN 114821486 B
1.一种电力作业场景 下人员识别方法, 其特 征在于, 包括以下步骤:
步骤1, 收集电力施工现场工作人员图像、 非施工人员图像和没有检测目标的图像, 并
将不同人员进行打标区分, 构成训练的数据集;
步骤2, 将收集到的数据集进行扩充;
步骤 3, 使用扩充后的数据集对目标检测网络进行训练, 获得 人员识别模型;
所述目标检测网络包括 三个部分: 特 征提取部分、 特 征融合部分和结果输出部分;
所述特征提取部分包括7个卷积模块, 其中第一卷积模块包括1个3 ×3卷积, 1个2 ×2卷
积以及一个通道空间注意模块; 第二卷积模块包括2个1 ×1卷积和1个3 ×3卷积, 第三卷积
模块包括 1个2×2卷积和一个通道空间注意模块; 第四个卷积模块包括2个1 ×1卷积和1个3
×3卷积, 第五卷积模块包括1个2 ×2卷积和一个通道空间注 意模块, 第六个卷积模块包括2
个1×1卷积和1个3 ×3卷积, 第七卷积模块包括1个2 ×2卷积和一个通道空间注意模块; 另
外将第一卷积模块的输出进行深度可分离卷积之后与第二卷积模块的输出进行加和得到
第三卷积模块的输入, 第三卷积模块的输出进行深度可分离卷积之后与第四卷积模块的输
出进行加和得到第五卷积模块的输入, 第五卷积模块的输出进行深度可分离卷积之后与第
六卷积模块的输出进行加 和得到第七卷积模块的输入;
所述特征融合部分包括1个卷积操作模块, 1个分支结构和3个上采样模块, 其输入为第
七卷积模块的输出, 其中卷积操作模块包括2个1 ×1卷积和1个3 ×3卷积, 分支结构对卷积
操作模块的输出分别进行3 ×3、 7×7和9×9的卷积, 然后将3个 分支的输出和卷积操作模块
的输出进行拼接作为上采样模块的输入, 每个上采样模块包括2个1 ×1卷积、 1个3 ×3卷积
和1个上采样操作; 结果输出部分包括三个输出, 分别为用于预测大目标的输出、 用于预测
中目标的输出和用于预测小目标的输出, 其中预测大目标的输出是通过第七卷积模块与第
一上采样模块拼接 之后经过1个3 ×3卷积和1个1 ×1卷积实现, 预测中目标的输出是通过第
五卷积模块与第二上采样模块拼接之后经过1个3 ×3卷积和1个1 ×1卷积实现, 预测小目标
的输出是通过第三卷积模块与第三上采样模块拼接之后经过1个3 ×3卷积和1个1 ×1卷积
实现;
特征提取部分的具体处 理过程如下;
训练图像输入第一卷积模块, 先进行3 ×3卷积将其深度变为32层, 接着使用一个2 ×2
步距为2的卷积将特征图高宽缩小成原来的1/2, 通道数不变, 通过通道空间注意模块获取
全局特征, 不改变特征图的高宽和通道数; 然后进入第二卷积模块, 先通过1 ×1的卷积把特
征图的通道数调整为64, 再通过3 ×3卷积将通道数变为128, 最后执行1 ×1的卷积把特征图
的通道数调整为64, 再将第一卷积模块的输出进 行深度可分离卷积之后与第二卷积模块的
输出进行加 和得到第三卷积模块的输入;
再执行第三卷积模块至第六卷积模块, 得到高宽为原图1/8的特征图, 其深度为256层,
将这个特征图送入第七卷积模块, 先进 行2×2步距为2的卷积, 将特征图高宽缩小为原 来的
1/16, 然后送入通道空间注意模块, 不改变特 征图的高宽和通道数;
其中, 每一个卷积操作之后都会进行归一化操作和激活操作, 这里激活操作使用的激
活函数是Leaky ReLU;
步骤4, 使用训练好的人员识别模型实时检测现场采集的图像, 检测到人员时输出人员
的身份, 当识别到的人员身份为非施工人员时进行提醒。权 利 要 求 书 1/2 页
2
CN 114821486 B
22.如权利要求1所述的一种电力作业场景下人员识别方法, 其特征在于: 通道 空间注意
模块的具体操作如下;
首先, 将输入特征图先进行3 ×3卷积操作, 不改变特征图高宽和通道数, 然后送入通道
注意模块, 通道注意模块具体操作是分别对特征图进行全局平均池化和全局 最大池化, 得
到两个向量, 再将这两个向量相加, 得到通道维上的向量权重, 将这个权重向量与 原输入特
征图相乘, 得到具有通道 注意的特 征图;
然后, 在获得具有通道注意的特征图后先进行3 ×3卷积操作, 然后送入空间注意模块,
空间注意模块具体操作是通过两个分支 生成两个与 原图大小相同的特征图, 其中一个分支
是1×1步长为1的最大池化操作和一个 分支是1×1步长为1的平均池化操作, 然后将这两个
特征图进 行拼接再进 行卷积操作生 成通道维为 1维的特征图, 使用这个1维特征图与 原具有
通道注意的特征图相乘得到空间注意特征图, 最后再将得到的空间注意特征图直接与通道
注意模块中的通道维向量权 重进行相乘, 输出既有通道 注意又有空间注意的特 征图。
3.如权利要求1所述的一种电力作业场景下人员识别方法, 其特征在于: 步骤1中对收
集到的图像中的人员身份进 行打标, 身份标签包括电力施工工人, 工作负责人, 专责负责人
和非施工人员, 另外还采集一些没有检测目标的图像作为负样本; 对每一张有检测目标 的
图像进行手动标注, 得到待检测目标的位置和类别信息, 其中标注目标区域为人员穿着服
装的身体部分不包 含头部。
4.如权利要求1所述的一种电力作业场景下人员识别方法, 其特征在于: 步骤2将收集
到的数据集图像进 行图像拼接, 水平翻转, 像素移 位, 随机裁剪, 变形缩放, 增加高斯噪声处
理生成新的图像, 实现数据集的扩充。
5.如权利要求1所述的一种电力作业场景下人员识别方法, 其特征在于: 步骤4的具体
实现方式如下;
实时获取监控视频, 对视频进行逐帧解析得到每一帧的图像, 将解析后的图像送入到
人员识别模型中, 通过人员识别模型输出检测人员的身份类别, 当识别到人员身份为非施
工人员时, 调用语音播报功能进行提醒并将图像进行保存和日志记录, 识别到其他人员则
正常显示 其身份信息, 其中识别人员不同身份的标准是电力场景 下人员穿着的服装。权 利 要 求 书 2/2 页
3
CN 114821486 B
3
专利 一种电力作业场景下人员识别方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:59:54上传分享