(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211200016.8
(22)申请日 2022.09.29
(71)申请人 河南中原消费金融股份有限公司
地址 450000 河南省郑州市郑东 新区康宁
街99号万众大厦
(72)发明人 张雪飞 吕杨苗 胡光辉 郭腾飞
廖艺 张翼飞 冯伟 程昱
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 李倩
(51)Int.Cl.
G06V 10/82(2022.01)
G06V 10/80(2022.01)
G06V 10/44(2022.01)
G06V 10/42(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种图像目标检测模型训练方法、 装置、 设
备及存储介质
(57)摘要
本发明公开了一种图像目标检测模型训练
方法、 装置、 设备及存储介质, 应用于目标检测领
域, 包括: 获取原始数据, 获取生成数据中遮挡面
积达到预设遮挡阈值的数据, 得到生成训练数
据, 不断使用基础目标检测模型对生成训练数据
和原始数据进行内循环训练; 获取混合数据对基
础检测模型进行迭外循环迭代训练, 当使用混合
数据进行训练时的Loss3在连续预设次数内不发
生改变时, 停止内外循环的迭代训练, 得到图像
目标检测模 型。 本发明通过计算机技术生成大量
生成数据, 并利用基础模型对获取的原始数据、
生成数据和混合数据进行内外循环训练, 极大地
降低了数据收集时间成本, 并且由于存在内外循
环迭代, 使得到的图像目标检测训练模型可以更
加准确的识别目标物品。
权利要求书3页 说明书14页 附图5页
CN 115424117 A
2022.12.02
CN 115424117 A
1.一种图像目标检测模型训练方法, 其特 征在于, 包括:
获取原始数据和生成数据; 其中, 所述生成数据是指将所述原始数据中的图像作为目
标图像和遮挡图像进行融合得到的数据;
获取所述生成数据中遮挡面积达到预设遮挡阈值的数据, 得到生成训练数据; 其中, 所
述遮挡面积是指所述目标图像 被所述遮挡图像遮挡的面积;
不断使用基础目标检测模型对所述生成训练数据和所述原始数据进行训练, 得到所述
原始数据对应的Loss1和所述生成训练数据对应的Loss2, 并不断计算Loss2‑Loss1, 得到
LossD0......Lo ssDn, 直到
时, 触发下一个内循环; 其中, epoch表示使
用所述基础目标检测模型对所述生成训练数据和所述原始数据进 行训练的次数; 通过不断
上调所述预设遮挡阈值的值, 来调整所述生成训练数据, 以进行下一个内循环进行迭代训
练;
不断获取相邻两次内循环对应的LossDn, 当LossDn<上一轮内循环
时, 触发一次
外循环; 其中, 所述外循环使用混合数据进 行迭代训练; 所述混合数据由所述原始数据和所
述生成数据混合而成; 外循环 一次获得一个Loss3, 当连续两轮Loss3等于上一轮Loss3时, 触
发内循环;
当Loss3在连续预设次数内不发生改变时, 停止使用所述基础目标检测 模型进行训练,
得到图像目标检测模型。
2.根据权利要求1所述的图像目标检测模型训练方法, 其特 征在于, 还 包括:
对第一次上采样结果进行一 次最大池化, 得到最大池化结果; 其中, 使用所述基础目标
检测模型训练的过程中包括上采样;
对第二次上采样结果进行平均池化, 并对平均池化结果进行三次向量转置, 得到转置
结果;
将所述最大池化结果和所述 转置结果进行相加, 得到加 和结果;
将所述加和结果与上采样过程中的图像向量进行相加, 得到向量加和结果, 并传入解
码网络; 其中, 使用所述基础检测模型训练的过程中包括所述 解码网络 。
3.根据权利要求1所述的图像目标检测模型训练方法, 其特征在于, 所述获取生成数据
之前, 还包括:
使用Cycle ‑Gan对所述原 始数据进行随机扩充, 得到所述 生成数据。
4.根据权利要求3所述的图像目标检测模型训练方法, 其特征在于, 所述使用Cycle ‑
Gan对所述原 始数据进行随机扩充, 得到所述 生成数据, 包括:
利用随机点 位算子对所述原 始数据进行处 理, 得到合成图像数据;
对所述合成图像数据进行 卷积处理, 得到卷积图像数据;
利用残差网络对所述卷积图像数据进行残差处 理, 得到残差图像数据;
对所述卷积图像数据和所述残差 图像数据进行相加, 得到增强图像数据, 并利用编码
器对所述增强图像数据进行处 理得到编码图像数据;
对所述编码图像数据进行 卷积处理, 得到所述 生成数据。
5.根据权利要求1至4任一项所述的图像目标检测模型训练方法, 其特征在于, 计算所权 利 要 求 书 1/3 页
2
CN 115424117 A
2述Loss1和所述Loss2的损失函数, 包括:
其中, A为所述原始
数据和所述生成数据对应的实际目标区域, B为使用所述基础训练模型得到的推理目标区
域, SA∪B和SA∩B分别表示所述实际目标区域和所述推理目标区域的面积并集和交集, L表示
所述实际目标区域和所述推理目标区域的长, H表示所述实际目标区域和所述推理目标区
域的宽, gt在 公式中表示该数据来自推理结果,
表示所述推理目标区域和所述实
际目标区域之间关于中心点的欧式距离与所述推理目标区域和所述实际目标区域之间的
最大外顶角连线的比值, Pa表示遮挡面积。
6.根据权利要求1至4任一项所述的图像目标检测模型训练方法, 其特征在于, 所述外
循环中的损失函数模型, 包括:
其中, 其中, A为所述原
始数据和所述生成数据对应的实际目标区域, B为使用所述基础训练模型得到的推理目标
区域, SA∪B和SA∩B分别表示所述实际目标区域和所述推理目标区域 的面积并集和交集, L表
示所述实际目标区域和所述推理目标区域的长, H表示所述实际目标区域和所述推理目标
区域的宽, gt在公式中表示该数据来自推理结果,
表示所述推理目标区域和所述
实际目标区域之间关于中心点的欧式距离与所述推理目标区域和所述实际目标区域之间
的最大外顶角连线的比值。
7.根据权利要求1所述的图像目标检测模型训练方法, 其特征在于, 所述混合数据的生
成方式, 包括:
所述混合数据是由所述原始数据和所述生成数据进行无放回随机抽样预设百分比而
成。
8.一种图像目标检测模型训练装置, 其特 征在于, 包括:
原始数据和生成数据获取模块, 用于获取原始数据和生成数据; 其中, 所述生成数据 是
指将原始数据中的图像作为目标图像和遮挡图像进行融合得到的数据;
生成训练数据获取模块, 用于获取所述生成数据中遮挡面积达到预设遮挡阈值的数
据, 得到生成训练数据; 其中, 所述遮挡面积是指所述目标图像被所述遮挡图像遮挡的面
积;
内循环模块, 用于不断使用基础目标检测模型对所述生成训练数据和所述原始数据进
行训练, 得到所述原始数据对应的Loss1和所述生成训练数据对应的Loss2,并不断计算
Loss2‑Loss1, 得到LossD0......LossDn, 直到
时, 触发下一个内循环; 其
中, epoch表示使用所述基础目标检测模型对所述生成训练数据和所述原始数据进行训练
的次数; 通过不断上调预设遮挡阈值的值, 来调整 所述生成训练数据, 以进行下一个内循环
进行迭代训练;
外循环模块, 用于不断获取相邻两次内循环对应的LossDn, 当LossDn<上一轮内循环权 利 要 求 书 2/3 页
3
CN 115424117 A
3
专利 一种图像目标检测模型训练方法、装置、设备及存储介质
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 04:37:17上传分享