专利 一种图像目标检测模型训练方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211200016.8 (22)申请日 2022.09.29 (71)申请人河南中原消费金融股份有限公司地址 450000 河南省郑州市郑东新区康宁街99号万众大厦 (72)发明人张雪飞　吕杨苗　胡光辉　郭腾飞　廖艺　张翼飞　冯伟　程昱　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师李倩 (51)Int.Cl. G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/44(2022.01) G06V 10/42(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种图像目标检测模型训练方法、装置、设备及存储介质 (57)摘要本发明公开了一种图像目标检测模型训练方法、装置、设备及存储介质，应用于目标检测领域，包括：获取原始数据，获取生成数据中遮挡面积达到预设遮挡阈值的数据，得到生成训练数据，不断使用基础目标检测模型对生成训练数据和原始数据进行内循环训练；获取混合数据对基础检测模型进行迭外循环迭代训练，当使用混合数据进行训练时的Loss3在连续预设次数内不发生改变时，停止内外循环的迭代训练，得到图像目标检测模型。本发明通过计算机技术生成大量生成数据，并利用基础模型对获取的原始数据、生成数据和混合数据进行内外循环训练，极大地降低了数据收集时间成本，并且由于存在内外循环迭代，使得到的图像目标检测训练模型可以更加准确的识别目标物品。权利要求书3页说明书14页附图5页 CN 115424117 A 2022.12.02 CN 115424117 A 1.一种图像目标检测模型训练方法，其特征在于，包括：获取原始数据和生成数据；其中，所述生成数据是指将所述原始数据中的图像作为目标图像和遮挡图像进行融合得到的数据；获取所述生成数据中遮挡面积达到预设遮挡阈值的数据，得到生成训练数据；其中，所述遮挡面积是指所述目标图像被所述遮挡图像遮挡的面积；不断使用基础目标检测模型对所述生成训练数据和所述原始数据进行训练，得到所述原始数据对应的Loss1和所述生成训练数据对应的Loss2，并不断计算Loss2‑Loss1，得到 LossD0......Lo ssDn，直到时，触发下一个内循环；其中， epoch表示使用所述基础目标检测模型对所述生成训练数据和所述原始数据进行训练的次数；通过不断上调所述预设遮挡阈值的值，来调整所述生成训练数据，以进行下一个内循环进行迭代训练；不断获取相邻两次内循环对应的LossDn，当LossDn<上一轮内循环时，触发一次外循环；其中，所述外循环使用混合数据进行迭代训练；所述混合数据由所述原始数据和所述生成数据混合而成；外循环一次获得一个Loss3，当连续两轮Loss3等于上一轮Loss3时，触发内循环；当Loss3在连续预设次数内不发生改变时，停止使用所述基础目标检测模型进行训练，得到图像目标检测模型。 2.根据权利要求1所述的图像目标检测模型训练方法，其特征在于，还包括：对第一次上采样结果进行一次最大池化，得到最大池化结果；其中，使用所述基础目标检测模型训练的过程中包括上采样；对第二次上采样结果进行平均池化，并对平均池化结果进行三次向量转置，得到转置结果；将所述最大池化结果和所述转置结果进行相加，得到加和结果；将所述加和结果与上采样过程中的图像向量进行相加，得到向量加和结果，并传入解码网络；其中，使用所述基础检测模型训练的过程中包括所述解码网络。 3.根据权利要求1所述的图像目标检测模型训练方法，其特征在于，所述获取生成数据之前，还包括：使用Cycle ‑Gan对所述原始数据进行随机扩充，得到所述生成数据。 4.根据权利要求3所述的图像目标检测模型训练方法，其特征在于，所述使用Cycle ‑ Gan对所述原始数据进行随机扩充，得到所述生成数据，包括：利用随机点位算子对所述原始数据进行处理，得到合成图像数据；对所述合成图像数据进行卷积处理，得到卷积图像数据；利用残差网络对所述卷积图像数据进行残差处理，得到残差图像数据；对所述卷积图像数据和所述残差图像数据进行相加，得到增强图像数据，并利用编码器对所述增强图像数据进行处理得到编码图像数据；对所述编码图像数据进行卷积处理，得到所述生成数据。 5.根据权利要求1至4任一项所述的图像目标检测模型训练方法，其特征在于，计算所权　利　要　求　书 1/3 页 2 CN 115424117 A 2述Loss1和所述Loss2的损失函数，包括：其中， A为所述原始数据和所述生成数据对应的实际目标区域， B为使用所述基础训练模型得到的推理目标区域， SA∪B和SA∩B分别表示所述实际目标区域和所述推理目标区域的面积并集和交集， L表示所述实际目标区域和所述推理目标区域的长， H表示所述实际目标区域和所述推理目标区域的宽， gt在公式中表示该数据来自推理结果，表示所述推理目标区域和所述实际目标区域之间关于中心点的欧式距离与所述推理目标区域和所述实际目标区域之间的最大外顶角连线的比值， Pa表示遮挡面积。 6.根据权利要求1至4任一项所述的图像目标检测模型训练方法，其特征在于，所述外循环中的损失函数模型，包括：其中，其中， A为所述原始数据和所述生成数据对应的实际目标区域， B为使用所述基础训练模型得到的推理目标区域， SA∪B和SA∩B分别表示所述实际目标区域和所述推理目标区域的面积并集和交集， L表示所述实际目标区域和所述推理目标区域的长， H表示所述实际目标区域和所述推理目标区域的宽， gt在公式中表示该数据来自推理结果，表示所述推理目标区域和所述实际目标区域之间关于中心点的欧式距离与所述推理目标区域和所述实际目标区域之间的最大外顶角连线的比值。 7.根据权利要求1所述的图像目标检测模型训练方法，其特征在于，所述混合数据的生成方式，包括：所述混合数据是由所述原始数据和所述生成数据进行无放回随机抽样预设百分比而成。 8.一种图像目标检测模型训练装置，其特征在于，包括：原始数据和生成数据获取模块，用于获取原始数据和生成数据；其中，所述生成数据是指将原始数据中的图像作为目标图像和遮挡图像进行融合得到的数据；生成训练数据获取模块，用于获取所述生成数据中遮挡面积达到预设遮挡阈值的数据，得到生成训练数据；其中，所述遮挡面积是指所述目标图像被所述遮挡图像遮挡的面积；内循环模块，用于不断使用基础目标检测模型对所述生成训练数据和所述原始数据进行训练，得到所述原始数据对应的Loss1和所述生成训练数据对应的Loss2,并不断计算 Loss2‑Loss1，得到LossD0......LossDn，直到时，触发下一个内循环；其中， epoch表示使用所述基础目标检测模型对所述生成训练数据和所述原始数据进行训练的次数；通过不断上调预设遮挡阈值的值，来调整所述生成训练数据，以进行下一个内循环进行迭代训练；外循环模块，用于不断获取相邻两次内循环对应的LossDn，当LossDn<上一轮内循环权　利　要　求　书 2/3 页 3 CN 115424117 A 3

专利 一种图像目标检测模型训练方法、装置、设备及存储介质

专利一种图像目标检测模型训练方法、装置、设备及存储介质