(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210457140.6
(22)申请日 2022.04.27
(71)申请人 北京市商汤科技 开发有限公司
地址 100080 北京市海淀区北四环西路58
号11层1101-1117室
(72)发明人 李思奇 田茂清 刘建博 伊帅
(74)专利代理 机构 北京中知恒瑞知识产权代理
事务所(普通 合伙) 11889
专利代理师 袁忠林
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/74(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
(54)发明名称
网络训练及目标检测方法、 装置、 设备及存
储介质
(57)摘要
本公开提供了一种网络训练及目标检测方
法、 装置、 设备及存储介质, 其中, 该方法包括: 获
取第一图片样本和第二图片样 本; 第一图片样本
由第一相机采集得到, 且第一图片样本携带已有
商品标签, 第二图片样本由第二相机采集得到,
且第二图片样本未携带新增商品标签; 通过第一
图片样本和第二图片样本对预训练的目标检测
网络进行训练, 得到训练好的目标检测网络以用
于对目标图片进行目标检测, 得到目标图片中新
增商品的检测结果。 本公开中的目标检测网络不
仅对于源域具有较高的检测准确率, 对于目标域
同样具有较高的检测准确率, 与此同时, 基于训
练好的目标检测网络可以快速地对新增商品进
行上新, 节省了大量的人工标注成本, 具有更高
的实用性。
权利要求书3页 说明书14页 附图3页
CN 114821234 A
2022.07.29
CN 114821234 A
1.一种网络训练方法, 其特 征在于, 包括:
获取第一图片样本和第二图片样本; 所述第一图片样本由第一相机采集得到, 且所述
第一图片样本携带已有商品标签, 所述第二图片样本由第二相 机采集得到, 且所述第二图
片样本未携带新增商品标签;
通过所述第 一图片样本和所述第 二图片样本对预训练的目标检测网络进行训练, 得到
训练好的目标检测网络;
其中, 所述训练好的目标检测网络用于对目标图片进行目标检测, 得到所述目标图片
中新增商品的检测结果。
2.根据权利要求1所述的方法, 其特征在于, 所述通过所述第 一图片样本和所述第 二图
片样本对预训练的目标检测网络进行训练, 得到训练好的目标检测网络, 包括:
在当前输入到预训练 的目标检测网络包括第 一图片样本的情况下, 利用所述第 一图片
样本以及所述第一图片样本携带的 已有商品标签对所述预训练的目标检测网络进行网络
训练; 以及,
在当前输入到预训练 的目标检测网络包括第 二图片样本的情况下, 利用所述预训练 的
目标检测网络对所述第二图片样本进行目标检测, 得到检测结果, 将所述检测结果作为所
述第二图片样本的伪标签以利用携带有伪标签的第二图片样本对所述预训练的目标检测
网络进行网络训练;
直至满足训练截止条件, 得到训练好的目标检测网络 。
3.根据权利要求1或2所述的方法, 其特 征在于, 所述方法还 包括:
获取第三图片样本; 所述第 三图片样本由第二相机采集得到, 且携带新增商品标签, 所
述第三图片样本的数量小于所述第二图片样本的数量, 且所述第二图片样本与所述第三图
片样本之间的数量差大于预设阈值;
在当前输入到预训练 的目标检测网络为第 三图片样本的情况下, 利用所述第 三图片样
本以及所述第三图片样本携带的新增商品标签对所述预训练的目标检测网络进行网络训
练。
4.根据权利要求3所述的方法, 其特征在于, 所述目标检测网络包括特征提取层以及分
类层; 所述通过所述第一图片样本和所述第二图片样本对预训练的目标检测网络进行训
练, 包括:
通过携带有已有商 品标签的第 一图片样本、 携带有伪标签的第 二图片样本以及携带有
新增商品标签的第三图片样本对预训练的目标检测网络进行训练。
5.根据权利要求4所述的方法, 其特征在于, 所述通过携带有已有商 品标签的第 一图片
样本、 携带有伪标签的第二图片样本以及携带有新增商品标签的第三图片样本对预训练的
目标检测网络进行训练, 包括:
将所述第一图片样本、 所述第二图片样本、 和所述第三图片样本输入所述预训练的目
标检测网络包括的特征提取层, 分别提取所述第一图片样本对应的第一图片特征、 所述第
二图片样本对应的第二图片特 征、 以及所述第三图片样本对应的第三图片特 征;
将所述第一图片特征、 所述第 二图片特征和所述第 三图片特征分别输入到所述预训练
的目标检测网络包括的分类层, 得到针对所述第一图片样本的检测结果、 针对所述第二图
片样本的检测结果、 以及针对所述第三图片样本的检测结果;权 利 要 求 书 1/3 页
2
CN 114821234 A
2确定所述第一图片样本的检测结果与所述第一图片样本携带的已有商品标签之间的
第一匹配度、 所述第二图片样本的检测结果与所述第二图片样本携带的伪标签之 间的第二
匹配度、 以及所述第三图片样本的检测结果与所述第三图片样本携带的新增商品标签之间
的第三匹配度;
基于所述第 一匹配度、 所述第 二匹配度以及所述第 三匹配度对所述预训练的目标检测
网络进行训练。
6.根据权利要求5所述的方法, 其特征在于, 所述基于所述第一匹配度、 所述第二匹配
度以及所述第三匹配度对所述预训练的目标检测网络进行训练, 包括:
基于所述第一匹配度、 所述第二匹配度以及所述第三匹配度, 确定所述目标检测网络
的损失函数值;
基于所述损失函数值对所述预训练的目标检测网络进行训练。
7.根据权利要求6所述的方法, 其特征在于, 所述目标检测网络还包括设置于特征提取
层与分类层之间的梯度逆转层; 所述基于所述第一匹配度、 所述第二匹配度以及所述第三
匹配度, 确定所述目标检测网络的损失函数值, 包括:
在确定所述第 一图片样本和所述第 三图片样本包括同一类商 品的情况下, 基于所述梯
度逆转层确定所述第一图片特 征和所述第三图片特 征之间的相似度;
基于所述相似度、 所述第 一匹配度、 所述第二匹配度以及所述第三匹配度, 确定所述目
标检测网络的损失函数值。
8.根据权利要求4至7任一所述的方法, 其特征在于, 所述特征提取层包括骨干网络层
以及金字塔网络层; 按照如下步骤提取 所述第一图片样本对应的第一图片特 征:
将所述第一图片样本输入所述特征提取层包括的骨干网络层, 得到所述骨干网络层输
出的第一原 始图片特 征;
将所述骨干网络层输出的第一原始图片特征输入所述特征提取层包括的金字塔网络
层, 得到所述金字塔网络层输出 的多个不同维度的第一图片特征, 并作为所述第一图片样
本对应的第一图片特 征。
9.根据权利要求1至8任一所述的方法, 其特征在于, 按照如下步骤获取所述第二图片
样本或所述第三图片样本:
通过调整所述第 二相机相对新增商品的拍摄角度, 获取在各个拍摄角度 下采集的图片
样本, 所述图片样本中包括所述 新增商品; 或者,
通过调整所述新增商品朝向所述第二相机的商品视角, 获取采集到的图片样本, 所述
图片样本包括各个商品视角下的新增商品。
10.根据权利要求4至8任一所述的方法, 其特征在于, 所述通过携带有已有商品标签的
第一图片样本、 携带有伪标签的第二图片样本以及携带有新增商品标签的第三图片样本对
预训练的目标检测网络进行训练, 包括:
从所述第一图片样本、 第 二图片样本以及所述第 三图片样本 中选取包括同一类商品的
图片样本;
将选取出的图片样本作为预训练的目标检测网络的输入数据, 对预训练 的目标检测网
络进行训练。
11.一种目标检测方法, 其特 征在于, 包括:权 利 要 求 书 2/3 页
3
CN 114821234 A
3
专利 网络训练及目标检测方法、装置、设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 01:00:06上传分享