专利一种特征提取模型的训练方法、重识别方法及装置 -在线下载 -AI解读-standardshub.tech

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210815301.4 (22)申请日 2022.07.08 (71)申请人泰康保险集团股份有限公司地址 100031 北京市西城区复兴门内大街 156号泰康人寿大厦 (72)发明人于吉鹏　李驰　刘岩　赵庆隆　王子豪　 (74)专利代理机构北京同达信恒知识产权代理有限公司 1 1291 专利代理师李海波 (51)Int.Cl. G06V 10/774(2022.01) G06V 20/40(2022.01) G06V 40/10(2022.01) G06V 10/42(2022.01)G06V 10/74(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种特征提取模型的训练方法、重识别方法及装置 (57)摘要本申请涉及信息处理技术领域，尤其涉及一种特征提取模型的训练方法、重识别方法及装置，解决无法在存在遮挡干扰的情况下，实现对于视频中对象特征进行有效识别的问题，方法为：获取样本数据集合；基于所述样本数据集合对初始特征提取网络和预训练的分类网络进行多轮迭代训练，在训练过程中，将指定数目的样本视频帧和预测特征图输入预训练的局部特征提取网络，得到前景增强向量，并基于各前景增强向量和对应的图像特征向量之间的向量差异，计算损失值。这样，借助于模型训练过程中提取的前景增强向量，能够增强模型对于图像中关键区域的注意程度，增强对于前景中关键区域的感知，减少背景信息的干扰，增加训练得到的目标特征提取模型的鲁棒性。权利要求书3页说明书18页附图5页 CN 115294420 A 2022.11.04 CN 115294420 A 1.一种特征提取模型的训练方法，其特征在于，包括：获取样本数据集合，其中，每个样本数据中包括样本视频帧、以及所述样本视频帧对应的对象标签；基于所述样本数据集合对初始特征提取网络和预训练的分类网络进行多轮迭代训练，直至满足预设的收敛条件，基于训练后的目标图像特征提取网络生成目标特征提取模型；其中，在一轮迭代训练过程中，执行以下操作：读取指定数目的样本视频帧输入所述初始特征提取网络，得到各预测特征图和图像特征向量，并采用所述分类网络基于各图像特征向量确定分类结果，以及基于所述分类结果与对应的对象标签之间的分类差异，计算第一类损失值；将所述指定数目的样本视频帧和预测特征图输入预训练的局部特征提取网络，得到每个预测特征图各自对应的关键区域特征向量；基于各关键区域特征向量，对相应的预测特征图进行特征增强，得到前景增强向量，并基于各前景增强向量和对应的图像特征向量之间的向量差异，计算第二类损失值，以及基于所述第一类损失值和所述第二类损失值调整网络参数。 2.如权利要求1所述的方法，其特征在于，所述计算第二损失之后，进一步包括：针对每个预测特征图，基于所述预测特征图中的各关键区域生成区域组集合，其中，所述区域组集合中包括：由两个对称肢体各自归属的关键区域构成的区域组，以及由一个非对称肢体归属的关键区域构成的区域组；针对每个区域组集合，获取对应各个区域组内的关键区域提取的关键区域特征向量，并基于各个关键区域特征向量与对应的图像特征向量之间的向量差异，计算第三类损失值；基于所述第一类损失值、所述第二类损失值、以及各个第三类损失值，调整网络参数。 3.如权利要求2所述的方法，其特征在于，所述基于各个关键区域特征向量与对应的图像特征向量之间的向量差异，计算第三类损失值，包括：确定各个关键区域特征向量对应的图像特征向量，并确定所述各个关键区域特征向量和图像特征向量对应的特征通道数信息；基于所述特征通道数信息确定拆分后的各个特征维度范围，并基于所述各个特征维度范围，分别将拆分后的、对应相同特征维度范围的各个关键区域子特征向量和图像子特征向量，确定为一组子特征向量，得到各组子特征向量；针对每组子特征向量，分别计算各个关键区域子特征向量与图像子特征向量之间的向量差异，得到第三子损失；基于各个第三子损失计算第三类损失值。 4.如权利要求1 ‑3任一项所述的方法，其特征在于，所述基于各关键区域特征向量，对相应的预测特征图进行特征增强，得到前景增强向量，包括：基于各关键区域特征向量与对应的预测特征图中各个位置的特征信息之间的融合结果，分别计算对于每个预测特征图中各个位置的注意力权重；基于各个注意力权重计算对应的预测特征图中、各个位置的特征信息对应的加权融合结果，并基于所述加权融合结果，对相应的预测特征图、对应的图像特征向量进行特征增强，得到前景增强向量。 5.一种重识别方法，其特征在于，包括：权　利　要　求　书 1/3 页 2 CN 115294420 A 2获取包含目标对象的目标图像帧，并获取待处理视频帧集合，其中，每个待处理视频帧关联有时间信息，并且对应一个从采集的一个原始视频帧中、裁剪出的待识别对象；采用已训练的目标特征提取模型，基于所述目标视频帧提取出目标图像特征向量，以及分别基于各个待处理视频帧，提取出待处理图像特征向量，其中，所述目标特征提取模型是采用权利要求1 ‑4任一项所述的训练方法训练得到的；计算所述目标图像特征向量与各个待处理图像特征向量之间的相似度，并基于各个相似度识别包含所述目标对象的待处理视频帧。 6.如权利要求5所述的方法，其特征在于，所述获取待处理视频帧集合，包括：获取各个图像采集设备采集的原始视频流，并针对每个原始视频流进行抽帧处理，得到各个原始视频帧集合；针对每个原始视频帧，识别所述原始视频帧中各个对象所在的区域，并裁剪出所述原始视频帧中的各个对象所在的区域，分别生成对应的各个待处理视频帧，并将所述各个待处理视频帧关联所述原始视频帧对应的时间信息；基于各个待处理视频帧生成待处理视频帧集合。 7.一种特征提取模型的训练装置，其特征在于，包括：获取单元，用于获取样本数据集合，其中，每个样本数据中包括样本视频帧、以及所述样本视频帧对应的对象标签；训练单元，用于基于所述样本数据集合对初始特征提取网络和预训练的分类网络进行多轮迭代训练，直至满足预设的收敛条件，基于训练后的目标图像特征提取网络生成目标特征提取模型；其中，在一轮迭代训练过程中，执行以下操作：读取指定数目的样本视频帧输入所述初始特征提取网络，得到各预测特征图和图像特征向量，并采用所述分类网络基于各图像特征向量确定分类结果，以及基于所述分类结果与对应的对象标签之间的分类差异，计算第一类损失值；将所述指定数目的样本视频帧和预测特征图输入预训练的局部特征提取网络，得到每个预测特征图各自对应的关键区域特征向量；基于各关键区域特征向量，对相应的预测特征图进行特征增强，得到前景增强向量，并基于各前景增强向量和对应的图像特征向量之间的向量差异，计算第二类损失值，以及基于所述第一类损失值和所述第二类损失值调整网络参数。 8.一种重识别装置，其特征在于，包括：获取单元，用于获取包含目标对象的目标图像帧，并获取待处理视频帧集合，其中，每个待处理视频帧关联有时间信息，并且对应一个从采集的一个原始视频帧中、裁剪出的待识别对象；提取单元，用于采用已训练的目标特征提取模型，基于所述目标视频帧提取出目标图像特征向量，以及分别基于各个待处理视频帧，提取出待处理图像特征向量，其中，所述目标特征提取模型是采用权利要求1 ‑4任一项所述的训练方法训练得到的；计算单元，用于计算所述目标图像特征向量与各个待处理图像特征向量之间的相似度，并基于各个相似度识别包含所述目标对象的待处理视频帧。 9.一种电子设备，其特征在于，包括：存储器，用于存储可执行指令；权　利　要　求　书 2/3 页 3 CN 115294420 A 3

专利 一种特征提取模型的训练方法、重识别方法及装置

专利一种特征提取模型的训练方法、重识别方法及装置