(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210807521.2
(22)申请日 2022.07.11
(65)同一申请的已公布的文献号
申请公布号 CN 114898201 A
(43)申请公布日 2022.08.12
(73)专利权人 浙江大华 技术股份有限公司
地址 310053 浙江省杭州市滨江区滨安路
1187号
(72)发明人 杨雪峰 余言勋 王亚运 刘智辉
(74)专利代理 机构 北京同达信恒知识产权代理
有限公司 1 1291
专利代理师 张恺宁
(51)Int.Cl.
G06V 20/00(2022.01)
G06V 10/74(2022.01)G06V 10/764(2022.01)
G06V 10/774(2022.01)
(56)对比文件
CN 111339839 A,2020.0 6.26
CN 113033397 A,2021.0 6.25
US 2017316281 A1,2017.1 1.02
CN 114283316 A,202 2.04.05
陈骞.基于YOLOv4的车间实时目标检测. 《现
代计算机: 图形图像》 .2021,全 文.
审查员 徐梦春
(54)发明名称
一种目标检测方法、 装置、 设备及 介质
(57)摘要
本申请实施例公开了一种目标检测方法、 装
置、 设备及介质, 涉及计算机视觉技术领域。 该方
法包括: 通过将待处理图像输入目标检测网络以
确定待处理图像中是否包含目标类型的待搜索
对象, 以及待搜索对象在图像中的位置区域。 该
目标检测网络是基于标注目标框和已标注第一
样本类型的预测目标框训练得到的, 上述预测目
标框的第一样本类型是根据训练图像在预测目
标框内的图像特征与该训练图像在标注目标框
内的图像特征的相似度确定的。 由此在目标检测
网络的训练阶段不仅需基于预测目标框与标注
目标框间的坐标差异对模型进行修正, 还需基于
预测目标框与标注目标框的图像特征相似信息
对模型进行修 正, 以此提高模型的检测精度。
权利要求书3页 说明书14页 附图3页
CN 114898201 B
2022.10.28
CN 114898201 B
1.一种目标检测方法, 其特 征在于, 所述方法包括:
将待处理图像输入训练后的目标基础检测网络, 通过所述目标基础检测网络对所述待
处理图像进行识别;
确定所述待处理图像中是否包含目标类型的待搜索对象, 以及所述待搜索对象在所述
待处理图像中的位置区域;
所述目标基础检测网络是通过下述方式训练 的: 将训练图像输入基础检测网络 中采用
迭代的方式对所述基础检测网络进行迭代训练, 直至根据迭代训练得到的检测损失值确定
所述基础检测网络收敛, 将收敛的基础检测网络作为所述目标基础检测网络; 其中, 每轮所
述迭代训练包括:
通过训练后的对比学习网络对所述训练图像进行识别, 得到所述训练图像的图像特征
相似信息, 并根据所述图像特征相似信息确定各预测目标框的第一样本类型; 所述图像特
征相似信息是根据所述训练图像中各第二样本类型的预测目标框内的图像特征和训练图
像中标注目标框内的图像特征的相似度确定的; 所述第二样本类型是基于所述训练图像中
预测目标框与标注目标框间的交并比确定的; 所述标注目标框是针对所述训练图像中的待
搜索对象进行 标注的目标框;
针对各所述第 一样本类型的预测目标框, 基于本轮迭代训练前的基础检测网络参数确
定所述预测目标框与标注目标框间的分类损失值和坐标回归损失值;
根据所述坐标回归损失值从所述各第 一样本类型的预测目标框中确定指定目标框; 并
通过所述对比学习网络, 基于所述训练图像中所述指 定目标框内的图像特征与所述训练图
像在所述标注目标框内的图像特 征的相似度, 确定对比损失值;
基于所述分类损 失值、 所述坐标回归损 失值和所述对比损 失值确定所述检测损 失值,
并根据所述检测损失值调整所述基础检测网络的参数; 其中, 所述基础检测网络是基于所
述标注目标框和已标注第二样本类型的预测目标框对初始基础检测网络训练得到的。
2.根据权利要求1所述的方法, 其特征在于, 通过训练后的对比学习网络对训练图像进
行识别, 得到图像特 征相似信息, 包括:
将各特征图像输入所述训练后的对比学习 网络, 其中, 各所述特征图像为根据所述训
练图像在各所述第二样本类型的预测目标框内的图像特征确定的多张图像; 通过所述对比
学习网络执 行如下过程:
针对每一特征图像, 根据所述特征图像和所述标注目标框的图像特征的相似度, 确定
所述图像特 征相似信息;
根据所述图像特征相似信息和相似度阈值的比对结果确定所述特征图像对应预测目
标框的第一样本类型。
3.根据权利要求1所述的方法, 其特征在于, 所述根据所述坐标回归损失值从所述各第
一样本类型的预测目标框中确定指定目标框, 包括:
将坐标回归损失值 最小的预测目标框作为所述指定目标框 。
4.根据权利要求3所述的方法, 其特征在于, 所述训练后的对比学习网络是通过如下方
式获得的:
将样本图像对输入基础学习网络 中采用迭代的方式对所述基础学习网络进行训练, 根
据所述基础学习网络每轮迭代得到的学习损失值确定是否满足第二收敛条件, 并在 满足所权 利 要 求 书 1/3 页
2
CN 114898201 B
2述第二收敛条件后将所述基础学习网络作为所述对比学习网络; 其中, 每一样本图像对包
含两幅图像特征不同的样本图像, 所述样本图像是根据所述训练图像在所述第二样本类型
的预测目标框中的图像特 征确定的; 每 轮迭代过程如下:
针对每一样本图像对, 基于本轮迭代前的基础学习网络参数确定所述样本图像对内各
样本图像间的特 征相似度;
根据各样本图像对应预测目标框的第二样本类型确定对比阈值;
根据所述特征相似度与对比阈值的比对结果确定所述学习损失值, 并根据所述学习损
失值调整所述基础学习网络参数。
5.根据权利要求4所述的方法, 其特征在于, 所述根据各样本图像对应预测目标框的第
二样本类型确定对比阈值, 包括:
若各所述样本图像对应预测目标框的第 二样本类型相同, 则将第 一阈值作为所述对比
阈值;
若各所述样本图像对应预测目标框的第 二样本类型不同, 则将第 二阈值作为所述对比
阈值; 其中, 所述第二阈值小于所述第一阈值。
6.一种目标检测装置, 其特 征在于, 所述装置包括:
图像识别模块, 被配置为执行将待处理图像输入训练后的目标基础检测网络, 通过所
述目标基础检测网络对所述待处 理图像进行识别;
检测信息模块, 被配置为执行确定所述待处理图像中是否包含目标类型的待搜索对
象, 以及所述待搜索对象在所述待处 理图像中的位置区域;
所述目标基础检测网络是通过下述方式训练 的: 将训练图像输入基础检测网络 中采用
迭代的方式对所述基础检测网络进行迭代训练, 直至根据迭代训练得到的检测损失值确定
所述基础检测网络收敛, 将收敛的基础检测网络作为所述目标基础检测网络; 其中, 每轮所
述迭代训练包括:
通过训练后的对比学习网络对所述训练图像进行识别, 得到所述训练图像的图像特征
相似信息, 并根据所述图像特征相似信息确定各预测目标框的第一样本类型; 所述图像特
征相似信息是根据所述训练图像中各第二样本类型的预测目标框内的图像特征和训练图
像中标注目标框内的图像特征的相似度确定的; 所述第二样本类型是基于所述训练图像中
预测目标框与标注目标框间的交并比确定的; 所述标注目标框是针对所述训练图像中的待
搜索对象进行 标注的目标框;
针对各所述第 一样本类型的预测目标框, 基于本轮迭代训练前的基础检测网络参数确
定所述预测目标框与标注目标框间的分类损失值和坐标回归损失值;
根据所述坐标回归损失值从所述各第 一样本类型的预测目标框中确定指定目标框; 并
通过所述对比学习网络, 基于所述训练图像中所述指 定目标框内的图像特征与所述训练图
像在所述标注目标框内的图像特 征的相似度, 确定对比损失值;
基于所述分类损 失值、 所述坐标回归损 失值和所述对比损 失值确定所述检测损 失值,
并根据所述检测损失值调整所述基础检测网络的参数; 其中, 所述基础检测网络是基于所
述标注目标框和已标注第二样本类型的预测目标框对初始基础检测网络训练得到的。
7.一种电子设备, 其特 征在于, 包括:
存储器, 用于存 储程序指令;权 利 要 求 书 2/3 页
3
CN 114898201 B
3
专利 一种目标检测方法、装置、设备及介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:51上传分享