standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210748220.7 (22)申请日 2022.06.29 (71)申请人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 武文琦  (74)专利代理 机构 北京市一法律师事务所 11654 专利代理师 李琳娜 刘荣娟 (51)Int.Cl. G06V 10/22(2022.01) G06V 10/40(2022.01) G06V 10/25(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01)G06V 20/52(2022.01) G06V 20/40(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01) (54)发明名称 图像识别的方法和系统 (57)摘要 本说明书提供的图像识别的方法和系统, 在 目标图像中识别出至少一个候选区域后, 基于至 少一个候选区域中每个候选区域的尺 寸, 获取至 少一个候选区域对应的总目标图像特征, 可以针 对不同的候选区域的尺寸, 采用不同的特征融合 方式, 使得提取出候选区域的目标图像特征更加 准确, 从而提升图像识别的准确率。 权利要求书4页 说明书19页 附图5页 CN 115131544 A 2022.09.30 CN 115131544 A 1.一种图像识别方法, 包括: 获取目标图像, 所述目标图像包括至少一个目标对象; 从所述目标图像中识别出至少一个候选区域, 所述至少一个候选区域对应于至少一个 目标对象; 基于所述至少一个候选区域中每个候选区域的尺寸, 获取所述至少一个候选区域对应 的总目标图像特 征; 以及 基于所述总目标图像特 征, 确定所述至少一个目标对象的对象信息 。 2.根据权利要求1所述的图像识别方法, 其中, 所述从所述目标图像中识别出至少一个 候选区域, 包括: 在所述目标图像中识别出至少一个基础候选区域, 所述至少一个基础候选区域对应于 所述目标对象; 对所述目标图像进行多维图像特征提取, 得到基础图像特征, 所述基础图像特征包括 每一维度所对应的图像特 征; 以及 基于所述基础图像特 征, 在所述基础候选区域中检测出至少一个候选区域。 3.根据权利要求2所述的图像识别方法, 其中, 所述基于所述基础图像特征, 在所述基 础候选区域中检测出至少一个候选区域, 包括: 从所述基础图像特 征中筛选出目标维度对应的图像特 征; 将所述基础候选区域投影至所述图像特 征对应的特 征图, 得到目标 特征图; 在所述目标 特征图中进行滑窗处 理, 以得到 至少一个候选区域。 4.根据权利要求3所述的图像识别方法, 其中, 所述在所述目标特征图中进行滑窗处 理, 以得到 至少一个候选区域, 包括: 基于预设滑窗的尺寸信 息, 在所述目标特征图中识别出每一预设滑窗与所述基础候选 区域的位置关系; 基于所述位置关系, 确定所述预设滑窗的检测粒度, 并基于所述检测粒度, 在所述目标 特征图中生成至少一个锚框; 以及 在所述至少一个锚框中筛选出至少一个目标锚框, 并将所述目标锚框对应的区域作为 候选区域。 5.根据权利要求4所述的图像识别方法, 其中, 所述基于所述检测粒度, 在所述目标特 征图中生成至少一个锚框, 包括: 基于所述检测粒度, 确定所述预设滑窗对应的滑窗步长; 以及 基于所述滑窗步长, 在所述目标 特征图中生成至少一个锚框 。 6.根据权利要求4所述的图像识别方法, 其中, 所述在所述至少一个锚框 中筛选出至少 一个目标锚框, 包括: 在所述目标 特征图中提取 出所述至少一个锚框对应的当前图像特 征; 基于所述当前图像特 征, 确定所述至少一个锚框对应的候选对象信息; 以及 基于所述候选对象信息, 在所述至少一个锚框中筛选出所述目标锚框, 所述目标锚框 中包括所述目标对象。 7.根据权利要求2所述的图像识别方法, 其中, 所述基于所述至少一个候选区域中每个 候选区域的尺寸, 获取 所述至少一个候选区域对应的总目标图像特 征, 包括:权 利 要 求 书 1/4 页 2 CN 115131544 A 2基于所述至少一个候选区域中每个候选区域的尺寸, 获取所述每个候选区域对应的目 标图像特 征; 将所述目标图像特 征进行融合, 得到所述至少一个候选区域对应的总目标图像特 征。 8.根据权利要求7所述的图像识别方法, 其中, 所述基于所述至少一个候选区域中每个 候选区域的尺寸, 获取 所述每个候选区域对应的目标图像特 征, 包括: 在所述基础图像特征中筛选出预设多个维度的基础图像特征, 得到所述至少一个候选 区域中每 个候选区域对应的区域图像特 征集合; 以及 基于所述每个候选区域的尺寸, 对所述区域图像特征集合中的图像特征进行融合, 得 到所述每 个候选区域的目标图像特 征。 9.根据权利要求8所述的图像识别方法, 其中, 所述基于所述每个候选区域的尺寸, 对 所述区域图像特征集合中的图像特征进行融合, 得到所述每个候选区域的目标图像特征, 包括: 当所述候选区域的尺寸小于预设尺寸阈值 时, 对所述区域图像特征集合中的图像特征 进行融合, 得到所述 候选区域的目标图像特 征。 10.根据权利要求9所述的图像识别方法, 其中, 所述对所述区域图像特征集合中的图 像特征进行融合, 得到所述 候选区域的目标图像特 征, 包括: 基于所述候选区域的尺寸, 在所述 区域图像特征集合中筛选出所述候选区域对应的多 个图像特 征, 得到目标图像特 征组; 以及 对所述目标图像特征组中的图像特征进行融合, 以得到所述候选区域的目标图像特 征。 11.根据权利要求10所述的图像识别方法, 其中, 所述基于所述候选区域的尺寸, 在所 述区域图像特征集合中筛选出所述候选区域对应的多个图像特征, 得到目标图像特征组, 包括: 基于所述 候选区域的尺寸, 确定所述 候选区域对应的目标对象的对象尺度; 以及 在所述区域图像特征集合中筛选出所述对象尺度对应的多个图像特征, 得到目标图像 特征组。 12.根据权利要求10所述的图像识别方法, 其中, 所述对所述目标图像特征组中的图像 特征进行融合, 以得到所述 候选区域的目标图像特 征, 包括: 在所述目标图像特征组中筛选出待增强图像特征和所述待增强图像特征对应的邻近 图像特征; 采用所述邻近 图像特征对所述待增强图像特征进行语义增强, 得到增强后图像特征; 以及 将所述增强后图像特征和所述区域图像特征集合中除所述待增强图像特征以外的图 像特征作为所述 候选区域的目标图像特 征。 13.根据权利要求12所述的图像识别方法, 其中, 所述在所述目标图像特征组中筛选出 待增强图像特 征和所述待增强图像特 征对应的邻近图像特 征, 包括: 基于所述目标图像特征组中的图像特征对应的图像分辨率, 对所述目标图像特征组中 的图像特 征进行排序; 以及 基于排序 结果, 在所述目标图像特征组中筛选出至少一个待增强图像特征和所述待增权 利 要 求 书 2/4 页 3 CN 115131544 A 3

.PDF文档 专利 图像识别的方法和系统

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像识别的方法和系统 第 1 页 专利 图像识别的方法和系统 第 2 页 专利 图像识别的方法和系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:01:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。