(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211290054.7
(22)申请日 2022.10.21
(71)申请人 阿里巴巴 (中国) 有限公司
地址 311121 浙江省杭州市余杭区五常街
道文一西路969号3幢5层5 54室
(72)发明人 董波 王丕超 王帆
(74)专利代理 机构 北京博浩百 睿知识产权代理
有限责任公司 1 1134
专利代理师 李静茹
(51)Int.Cl.
G06V 10/40(2022.01)
G06V 10/26(2022.01)
G06V 10/762(2022.01)
G06V 20/10(2022.01)
G06V 20/20(2022.01)G06V 20/54(2022.01)
(54)发明名称
图像识别方法、 计算机可读存储介质以及电
子设备
(57)摘要
本申请公开了一种图像识别方法、 计算机可
读存储介质以及电子设备。 其中, 该方法包括: 获
取遥感图像; 对遥感图像进行特征提取, 得到遥
感图像的图像特征; 对图像特征进行特征处理,
得到遥感图像的目标特征, 其中, 特征处理用于
对图像特征进行聚类以得到局部特征, 并基于图
像特征和局部特征进行恢复以得到目标特征; 利
用目标特征对遥感图像进行语义 分割, 得到遥感
图像的语义分割结果, 其中, 语义分割结果用于
表征遥感图像中每个像素所属对象的类型。 本申
请解决了相关技术中语义分割的效率较低的技
术问题。
权利要求书3页 说明书24页 附图14页
CN 115359261 A
2022.11.18
CN 115359261 A
1.一种图像识别方法, 其特 征在于, 包括:
获取遥感图像;
对所述遥感图像进行 特征提取, 得到所述遥感图像的图像特 征;
对所述图像特征进行特征处理, 得到所述遥感图像的目标特征, 其中, 所述特征处理用
于对所述图像特征进 行聚类以得到局部特征, 并基于所述图像特征和所述局部特征进 行恢
复以得到所述目标 特征;
利用所述目标特征对所述遥感图像进行语义分割, 得到所述遥感图像的语义分割结
果, 其中, 所述语义分割结果用于表征 所述遥感图像中每 个像素所属对象的类型。
2.根据权利要求1所述的方法, 其特征在于, 对所述图像特征进行特征处理, 得到所述
遥感图像的目标 特征, 包括:
利用多个特征处理模型对所述图像特征进行多次所述特征处理, 得到所述目标特征,
其中, 每个特征 处理模型包括: 聚类模 型和像素描述符, 所述聚类模 型的输入端与所述每个
特征处理模型的输入端连接, 所述像素描述符的输入端与所述每个特征处理模型的输入端
和所述聚类模型的输出端连接 。
3.根据权利要求2所述的方法, 其特征在于, 利用多个特征处理模型对所述图像特征进
行多次所述特 征处理, 得到所述目标 特征, 包括:
确定输入至所述每个特征处理模型的输入特征, 其中, 所述输入特征为所述图像特征,
或前一个特 征处理模型的输出 特征;
利用所述聚类模型对所述输入特 征进行聚类, 得到所述局部特 征;
利用所述像素描述符对所述输入特征和所述局部特征进行恢 复, 得到所述每个特征处
理模型的输出特征, 其中, 所述输出特征为所述目标特征, 或后一个特征 处理模型的输入特
征。
4.根据权利要求3所述的方法, 其特征在于, 所述聚类模型包括: 聚类模块和原型学习
模型, 其中, 利用所述聚类模型对所述输入特 征进行聚类, 得到所述局部特 征, 包括:
利用所述聚类模块对所述输入特 征进行聚类, 得到聚类中心集 合;
利用所述原型学习模型基于所述聚类中心集合的频率信息对所述聚类中心集合进行
更新, 得到所述局部特 征。
5.根据权利要求4所述的方法, 其特征在于, 所述原型学习模型包括: 采用并行结构的
频率相似核、 低通滤波器和高通滤波器, 其中, 利用所述原型学习模 型基于所述聚类中心 集
合的频率信息对所述聚类中心集 合进行更新, 得到所述局部特 征, 包括:
确定所述聚类中心集 合的频率分量的查询向量、 键向量和值向量;
利用所述频率相似核对所述频率分量进行筛选, 得到第 一频率分量, 其中, 所述频率相
似核用于表征不同频率分量之间的对应关系;
利用所述低 通滤波器对所述值向量进行滤波, 得到第 二频率分量, 其中, 所述低 通滤波
器包含多组内核, 不同组内核用于处 理不同值向量;
利用所述高通滤波器对所述值向量进行滤波以得到滤波向量, 并获取所述滤波向量和
所述查询向量的乘积以得到第三频率分量;
对所述第一频率分量、 所述第二频率分量和所述第三频率分量进行加权和 处理, 得到
所述局部特 征。权 利 要 求 书 1/3 页
2
CN 115359261 A
26.根据权利要求3所述的方法, 其特征在于, 利用所述像素描述符对所述输入特征和所
述局部特 征进行恢复, 得到所述每 个特征处理模型的输出 特征, 包括:
将所述输入特征从原始空间投影到预设空间, 得到投影特征, 其中, 所述预设空间的维
度低于所述原 始空间;
将所述局部特 征插入嵌入到所述投影特 征中, 得到所述输出 特征。
7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
基于所述语义分割结果, 确定所述遥感图像中每 个像素的输出 方式;
按照所述每 个像素的输出 方式, 输出 所述遥感图像。
8.根据权利要求7 所述的方法, 其特 征在于, 所述方法还 包括:
接收所述遥感图像对应的反馈信息, 其中, 所述反馈信息用于对所述遥感图像中任意
一个像素所属对象的类型进行修改;
基于所述反馈信息对多个特 征处理模型的参数进行调整。
9.一种图像识别方法, 其特 征在于, 包括:
获取建筑物图像;
对所述建筑物图像进行 特征提取, 得到所述建筑物图像的图像特 征;
对所述图像特征进行特征处理, 得到所述建筑物图像的目标特征, 其中, 所述特征处理
用于对所述图像特征进行聚类以得到局部特征, 并基于所述图像特征和所述局部特征进 行
恢复以得到所述目标 特征;
利用所述目标特征对所述建筑物图像进行语义分割, 得到所述建筑物图像的语义分割
结果, 其中, 所述语义分割结果用于表征 所述建筑物图像中每 个像素所属建筑物的类型。
10.一种图像识别方法, 其特 征在于, 包括:
响应作用于操作界面上的输入指令, 在所述操作界面上显示 监测到的遥感图像;
响应作用于所述操作界面上的识别指令, 在所述操作界面上显示所述遥感图像的语义
分割结果, 其中, 所述语义分割 结果是利用所述遥感图像的目标特征对所述遥感 图像进行
语义分割得到的, 所述 目标特征是对所述遥感图像的图像特征进行特征处理得到的, 所述
图像特征是对所述遥感图像进 行特征提取得到的, 所述特征处理用于对所述图像特征进 行
聚类以得到局部特征, 并基于所述图像特征和所述局部特征进行恢复以得到所述目标特
征。
11.一种图像识别方法, 其特 征在于, 包括:
在虚拟现实VR设备或增强现实AR设备的呈现画面上展示遥感图像;
对所述遥感图像进行 特征提取, 得到所述遥感图像的图像特 征;
对所述图像特征进行特征处理, 得到所述遥感图像的目标特征, 其中, 所述特征处理用
于对所述图像特征进 行聚类以得到局部特征, 并基于所述图像特征和所述局部特征进 行恢
复以得到所述目标 特征;
利用所述目标特征对所述遥感图像进行语义分割, 得到所述遥感图像的语义分割结
果, 其中, 所述语义分割结果用于表征 所述遥感图像中每 个像素所属对象的类型;
驱动所述VR设备或所述AR设备渲染展示所述语义分割结果。
12.一种图像识别方法, 其特 征在于, 包括:
通过调用第 一接口获取遥感图像, 其中, 所述第 一接口包括第一参数, 所述第 一参数的权 利 要 求 书 2/3 页
3
CN 115359261 A
3
专利 图像识别方法、计算机可读存储介质以及电子设备
文档预览
中文文档
42 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共42页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 01:00:16上传分享