(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210629393.7
(22)申请日 2022.06.06
(65)同一申请的已公布的文献号
申请公布号 CN 114708543 A
(43)申请公布日 2022.07.05
(73)专利权人 成都信息工程大学
地址 610225 四川省成 都市西南 航空港经
济开发区学府路一段24 号
(72)发明人 刘说 潘帆 李翔 赵启军 黄珂
杨玲 杨智鹏
(74)专利代理 机构 成都拓荒者知识产权代理有
限公司 51254
专利代理师 邹广春
(51)Int.Cl.
G06V 20/40(2022.01)
G06V 20/52(2022.01)G06V 40/10(2022.01)
G06V 10/22(2022.01)
(56)对比文件
CN 105678213 A,2016.0 6.15
CN 10971 1377 A,2019.0 5.03
US 5430809 A,19 95.07.04
CN 106991360 A,2017.07.28
CN 10826 0918 A,2018.07.10
CN 1074515 55 A,2017.12.08
王红梅.基 于视频的人体 检测与计数技 术研
究. 《中国优秀博硕士学位 论文全文数据库(硕
士)信息科技 辑》 .2012,(第0 5期),
Xiaofei Peng等.Teac hing Assistant and
Class Attendance Analysis Usi ng
Surveillance Camera. 《IFTC 2018 : Digital
TV and Multimedia Com munication》 .2019,
审查员 梁清粼
(54)发明名称
一种考场监控视频图像中考 生定位方法
(57)摘要
本发明涉及图像处理领域, 具体涉及一种考
场监控视频图像中考生定位方法, 主要包括, 首
先根据考场监控视频图像数据中考生的耳朵可
见情况、 对包含了不同考试场景、 不同考生的大
量考场监控视频图像数据进行基于考生头顶部
头发区域的框选标记, 建立考生头顶部头发区域
数据集, 在此基础上进行基于高虚警率的目标检
测的初步筛选, 最后建立基于SSD深度学习目标
检测的模型, 对考生头发区域定位, 最终实现考
生的定位, 该方法提高了对考场监控视频图像中
考生定位的准确性、 可靠性及泛化能力。
权利要求书2页 说明书4页 附图1页
CN 114708543 B
2022.08.30
CN 114708543 B
1.一种考场监控视频图像中考 生定位方法, 其特 征在于:
步骤1: 对包含了不同考试场景、 不同考生的大量考场 监控视频图像数据进行基于考生
头顶部头发区域的框选标记, 具体方法为: 对考场监控视频图像数据中的考生的头顶部头
发区域进 行基于考生耳 朵显露情况及基于近似图像的方框标记; 然后建立考场监控视频图
像数据的考 生头顶部 头发区域数据集;
步骤2: 建立针对考场监控视频图像数据中考生头顶部头发区域定位的目标检测深度
学习模型, 首先对考场监控视频图像数据中的可能为头发的像素点进行筛选, 得到预处理
图像数据, 然后在预处 理图像数据上进行基于S SD的深度学习目标检测;
步骤3: 将建立的考场监控视频图像数据的考生头顶部头发区域数据集按比例进行划
分, 分别生成训练数据集和测试数据集, 对建立的针对考场监控视频图像数据中考生头顶
部头发区域定位的目标检测深度学习模型进行训练和 测试, 得到最终目标检测模型Mssd;
步骤4: 将考场监控视频初始图像数据输入到最终目标检测模型Mssd中, 然后得到对考
场监控视频图像数据中的考 生定位结果。
2.如权利要求1所述的一种考场监控视频图像中考生定位方法, 其特征在于对考场监
控视频图像数据中的考生的头顶部头发区域进行基于考生耳朵显露情况方框标记, 耳 朵显
露情况分为: 两个耳朵显露, 一个耳朵显露, 没有显露耳朵。
3.如权利要求1所述的一种考场监控视频图像中考生定位方法, 其特征在于对考场监
控视频图像数据中的考生的头顶部头发区域进行基于近似图像的方框标记, 具体为生成的
边框的水平和垂直 边都平行于图像数据边 缘。
4.如权利要求2所述的一种考场监控视频图像中考生定位方法, 其特征在于视频图像
数据中考生两个耳朵显露, 则框选区域为: 以边缘检测所得头发与额头交界的最低点为框
选区域底部, 以框选区域底部到边缘检测所得头发最顶部距离 的α1倍为框选高度, 以头发
左右两侧与背景交界最长距离的β1倍为框选宽度, 组成框 选区域, 变量α1和β1为加权系数。
5.如权利要求2所述的一种考场监控视频图像中考生定位方法, 其特征在于视频图像
数据中考生一个耳朵显露, 则框选区域为: 以头发与额头交界的最高点和最低点之间的中
间值点为框选区域底部, 以框选区域底部到头发最顶部距离 的α2倍为框选高度, 以显露的
一个耳朵与头发交界的边缘与另一侧头发与背景交界的边缘的最长距离 的β2倍为框选宽
度, 组成框 选区域, 变量α2和β2为加权系数。
6.如权利要求2所述的一种考场监控视频图像中考生定位方法, 其特征在于视频图像
数据中考生没有显露耳朵, 以头发与额头交界的最高点为框选区域底部, 以框选区域底部
到头发最顶部的距离为框选高度, 以额头在图像数据中显示的水平宽度为框选宽度, 组成
框选区域。
7.如权利要求1所述的一种考场监控视频图像中考生定位方法, 其特征在于步骤2: 对
考场监控视频图像数据中的可能为头发的像素点进行筛选, 得到预处理图像数据, 具体方
法为: 首先对图像数据进行灰度化处理, 得到灰度图像数据Ig; 然后对灰度图像数据中 的每
个像素点的像素值按照Ic(i, j)=255 ‑Ig(i, j)进行取反, 得到灰度取反图像数据Ic, 其中Ig
(i, j)、 Ic(i, j)为图像数据Ig、 Ic中的横坐标为i, 纵坐标为j的像素点的灰度值; 对灰度取反
图像数据Ic进行高虚警率的CFAR目标检测, 得到筛选后的图像数据, 设置阈值th, 对筛选后
的图像数据进行二 值化处理, 得到预处 理图像数据It。权 利 要 求 书 1/2 页
2
CN 114708543 B
28.如权利要求1所述的一种考场监控视频图像中考生定位方法, 其特征在于步骤2: 在
预处理图像数据上进行基于SSD的深度学习目标检测, 具体为: 将二值检测结果图像数据It
作为索引图像, 将索引图像中非0像素值像素点在图像中的坐标映射到相应考场监控视频
图像数据上, 以映射的像素点作为锚框中心点, 基于SSD目标检测框架, 建立针对考场监控
视频图像数据头发区域定位的目标检测模型。
9.如权利要求1所述的一种考场监控视频图像中考生定位方法, 其特征在于步骤4: 将
考场监控视频初始图像数据输入到最终目标检测模型Mssd中, 然后得到对考场监控视频图
像数据中的考生定位结果, 具体为: 将考场监控视频初始图像数据输入到最终目标检测模
型Mssd中, 得到头发区域框选结果, 将每个框选区域向下扩展自身 范围的Q倍, 得到更新的区
域框选结果, 将该 更新的区域框 选结果定为 考生定位结果。权 利 要 求 书 2/2 页
3
CN 114708543 B
3
专利 一种考场监控视频图像中考生定位方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:00:16上传分享