(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211351224.8 (22)申请日 2022.10.31 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 张国生  (74)专利代理 机构 北京市汉坤律师事务所 11602 专利代理师 姜浩然 吴丽丽 (51)Int.Cl. G06V 10/44(2022.01) G06V 10/762(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01) G06V 40/16(2022.01)G06V 40/40(2022.01) (54)发明名称 图像检测方法和图像 检测模型训练的方法 (57)摘要 本公开提供了一种图像检测方法和图像检 测模型训练的方法, 涉及人工智 能技术领域, 具 体为深度学习、 图像处理、 计算机视觉技术领域, 可应用于人脸识别、 活体检测等场景。 实现方案 为: 获得目标图像, 目标图像对应于多个类别中 的一个类别, 多个类别中的每一个类别具有相应 的聚类中心, 聚类中心是基于与该类别对应的多 个图像的多个图像特征获得的; 基于目标图像, 获得目标图像的图像特征, 图像特征指示多个类 别中的一个类别; 以及基于目标图像的图像特征 和多个类别中的至少目标类别对应的聚类中心, 获得目标图像的检测结果, 检测结果指示目标图 像是否对应 于目标类别。 权利要求书4页 说明书14页 附图5页 CN 115546510 A 2022.12.30 CN 115546510 A 1.一种图像 检测方法, 包括: 获得目标图像, 所述目标图像对应于多个类别 中的一个类别, 所述多个类别 中的每一 个类别具有相应的聚类中心, 该聚类中心是基于与该类别对应的多个图像的多个图像特征 获得的; 基于所述目标图像, 获得所述目标图像的图像特征, 所述图像特征指示所述多个类别 中的一个 类别; 以及 基于所述目标图像的图像特征和所述多个类别中的至少目标类别对应的聚类中心, 获 得所述目标图像的检测结果, 所述检测结果指示所述目标图像是否对应于所述目标类别。 2.根据权利要求1所述的方法, 其中, 所述基于所述目标图像, 获得所述目标图像的图 像特征包括: 通过将所述目标图像输入到特征提取网络, 以获得所述图像特征, 其中, 所述特征提取 网络是通过与分类网络组成 图像检测模型后采用训练图像训练所述图像检测模型而获得 的, 其中, 所述分类网络包括与所述多个类别分别对应的多个分类子网络, 并且其中, 所述多个 分类子网络中的每一个分类子网络的权重参数与所述多个类别中的相 应类别的聚类中心 相应, 所述聚类中心是基于与该相 应类别对应的多个图像的多个图像特征获得的, 并且其 中, 在训练过程中, 通过将所述训练图像输入到特征提取网络获得所述训练图像的图像特 征, 基于所述训练图像的图像特征, 更新所述多个类别对应的多个聚类中心并且获得所述 多个聚类中心中与所述训练图像相应的第一聚类中心和所述分类网络, 将所述训练图像的 图像特征输入到基于更新后的多个聚类中心和所述分类网络获得 的第一分类网络获得预 测结果, 以及基于所述多个类别中与所述第一聚类中心所对应的第一类别和所述预测结 果, 调整所述特 征提取网络的参数。 3.根据权利要求2所述的方法, 其中, 所述基于所述目标图像的图像特征和所述多个类 别的至少目标类别对应的聚类中心, 获得 所述目标图像的检测结果包括: 通过将所述目标图像的图像特征输入到所述分类网络中与所述目标类别对应的目标 分类子网络中, 以获得 所述检测结果。 4.根据权利要求1 ‑3中任一项所述的方法, 其中, 所述目标图像为包括人脸的图像, 所 述多个类别包括人脸活体 类别、 头模攻击类别、 纸质攻击类别或者屏幕攻击类别。 5.一种图像检测模型的训练方法, 其中, 所述图像检测模型包括特征提取网络和初始 分类网络, 所述初始分类网络包括与多个类别分别对应的多个分类子网络, 所述多个分类 子网络中的每一个分类子网络的权重参数与所述多个类别中的相应类别的聚类中心相应, 所述聚类中心是基于与该相应类别对应的多个图像的多个图像特征获得的, 所述方法包 括: 获得训练图像; 通过将所述训练图像输入到特 征提取网络, 获得 所述训练图像的图像特 征; 基于所述训练图像的图像特征, 更新所述多个类别对应的多个聚类中心, 并且获得所 述多个聚类中心中与所述训练图像相应的目标聚类中心; 基于更新后的多个聚类中心和所述初始分类网络, 获得第一分类网络;权 利 要 求 书 1/4 页 2 CN 115546510 A 2将所述训练图像的图像特征输入至所述第 一分类网络, 以获得所述训练图像的预测结 果, 所述预测结果指示所述训练图像对应于所述多个 类别中的相应 类别; 以及 基于所述多个类别中与所述目标聚类中心相应的第 一类别和所述预测结果, 调 整所述 特征提取网络的参数。 6.根据权利要求5所述的方法, 其中, 所述多个类别包括目标类别, 所述多个分类子网 络包括与所述目标类别对应的目标分类子网络, 所述方法还 包括: 获得所述训练图像的标注标签, 所述标注标签指示所述训练图像对应于是否对应于所 述多个类别中的目标类别; 以及其中, 所述基于更新后的多个聚类中心和所述初始分类网 络, 获得第一分类网络包括: 响应于所述标注标签指示所述训练图像不对应于所述多个类别中的目标类别, 基于所 述更新后的多个聚类中心与所述多个类别中区别于所述目标类别的第一类别对应的第一 聚类中心, 更新所述多个分类子网络中与所述第一类别对应的第一分类子网络的权重参 数, 以获得所述第一分类网络, 并且所述方法还包括: 基于所述第一类别和所述预测结果, 调整所述目标分类子网络的参数; 以及 响应于所述标注标签指示所述训练图像对应于所述多个类别中的目标类别, 将所述初 始分类网络确定为所述第一分类网络, 并且所述方法还包括: 基于所述标注标签和所述第 一预测结果, 调整所述目标分类子网络的权 重参数。 7.根据权利要求6所述的方法, 其中, 所述基于所述多个类别中与所述第 一聚类中心相 应的第一类别和所述第一预测结果, 调整所述特 征提取网络的参数还 包括: 响应于所述标注标签指示所述训练图像对应于所述多个类别中的目标类别, 基于所述 标注标签与所述预测结果, 调整所述特 征提取网络的参数。 8.根据权利要求6所述的方法, 其中, 所述基于所述训练图像的图像特征, 更新所述多 个类别对应的多个聚类中心包括: 获得特征队列, 所述特征队列包括与所述多个类别中的每一个类别对应的多个图像的 多个图像特 征; 将所述训练图像的图像特 征加入所述特 征队列; 以及 基于所述特 征队列中的多个图像特 征, 更新所述多个聚类中心。 9.根据权利要求8所述的方法, 其中, 所述特征队列中的多个图像特征的数量为预设 值, 并且其中, 所述将所述训练图像的图像特 征加入所述特 征队列包括: 将所述特 征队列中的第一图像特 征替换为所述训练图像的图像特 征。 10.根据权利要求5 ‑9中任一项所述的方法, 其中, 所述训练图像为包括人脸的图像, 所 述多个类别包括人脸活体 类别、 头模攻击类别、 纸质攻击类别或者屏幕攻击类别。 11.一种图像 检测装置, 包括: 目标图像获取单元, 被配置用于获得目标图像, 所述目标图像对应于多个类别 中的一 个类别, 所述多个类别中的每一个类别具有相应的聚类中心, 该聚类中心是基于与该类别 对应的多个图像的多个图像特 征获得的; 特征提取单元, 被配置用于基于所述目标图像, 获得所述目标图像的图像特征, 所述图 像特征指示所述多个 类别中的一个 类别; 以及 检测结果获取单元, 被配置用于基于所述目标图像的图像特征和所述多个类别中的至权 利 要 求 书 2/4 页 3 CN 115546510 A 3

PDF文档 专利 图像检测方法和图像检测模型训练的方法

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像检测方法和图像检测模型训练的方法 第 1 页 专利 图像检测方法和图像检测模型训练的方法 第 2 页 专利 图像检测方法和图像检测模型训练的方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。