standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210827268.7 (22)申请日 2022.07.13 (71)申请人 南京信息 工程大学 地址 210000 江苏省南京市宁六路219号 (72)发明人 王友伟 郭颖 邵香迎 鲍正位  王季宇  (74)专利代理 机构 北京众合诚成知识产权代理 有限公司 1 1246 专利代理师 陈国强 (51)Int.Cl. G06V 20/10(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/764(2022.01) G06V 10/774(2022.01)G06V 10/40(2022.01) G06V 10/25(2022.01) G06V 10/32(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于改进Orientedrcnn的旋转目标检 测方法 (57)摘要 本发明涉及旋转图像目标检测技术领域, 具 体是一种基于改进Orientedrcnn的旋转目标检 测方法, 包括以下步骤: 输入 图像; 图像预处理: 将每张图片调整到固定尺寸, 对固定尺寸图片 进 行归一化处理, 并划分为训练集、 验证集、 测试 集; 输入网络模型进行训练: 将训练集输入到改 进的Oriented  rcnn模型进行训练; 输入测试集, 输出检测结果; 本发明使用了不同于现有技术中 的六参数法来定义旋转锚框, 并且使用不同的极 化函数分别提取分类任务与定位任务所需的不 同特征, 此外引入SPP模块实现局部特征与全局 特征之间的融合, 能够克服分类和回归之间所需 特征的不一致性带来的检测干扰, 有效提取不同 任务所需的不同特征, 可以更准确地对遥感图像 目标进行分类和定位。 权利要求书2页 说明书5页 附图3页 CN 115272846 A 2022.11.01 CN 115272846 A 1.一种基于改进Orientedrcn n的旋转目标检测方法, 其特 征在于: 包括以下步骤: 步骤1、 输入图像: 选择标注文件包含方向信息的遥感图像数据集作为输入图像, 对输 入图像进行随机翻转、 填充; 步骤2、 图像预处理: 将每张图片调整到固定的1024 ×1024尺寸; 对固定尺寸图片进行 归一化处理, 并按5:2:3划分为训练集、 验证集、 测试集; 步骤3、 输入网络模型进行训练: 将步骤2的训练集输入到改进的Orientedrcnn模型进 行训练; 步骤4、 输入测试集, 输出检测结果: 利用训练好的改进Orientedrcnn模型对遥感图像 进行检测, 得到由旋转框 框出目标的结果图像; 其中, 步骤3中训练改进的Orientedrcnn模型操作包括: 将训练集输入到主干网络 ResNet50进行特征提取, 得到不同尺寸的特征C2 ‑C5; 将提取的特征输入SPP ‑FPN模块进行 特征融合得到 featuremap, 其中, SPP ‑FPN模块将主干网络最深层输出C5经过SPP模块得到 M5。 2.根据权利要求1所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述步骤3的具体操作包括: 步骤3.1、 将训练集输入到主干网络ResNet50进行特征提取, 得到不同尺寸的特征C2 ‑ C5; 步骤3.2、 将提取的特 征输入SPP‑FPN模块进行 特征融合得到featuremap; 步骤3.3、 将fe aturemap输入到旋转建议区域生成模块orientedRPN, 经过编码和解码, 输出建议区域proposals; 步骤3.4、 将步骤3.2得到的fe aturemap和步骤3.3得到的prop osals输入到改进的检测 头模块PAM ‑head, 进行最后的分类和定位操作, 输出遥感目标识别和定位结果。 3.根据权利要求2所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述步骤3.2中, SPP ‑FPN模块具体工作流程包括: 将主干网络最深层输出C5经过SPP模 块得到M5, 将M5上采样与C4做横向连接得到的结果进行元素求和得到M4, 将M4上采样与C3 做横向连接得到的结果进行元素求和得到M3, 依次类推得到M2 ‑M5, 将M2‑M5分别经过3 ×3 卷积得到改进的FPN输出P2 ‑P5。 4.根据权利要求3所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述SPP模块 实现局部特征与全局特征之 间的融合, 使用不同尺寸的池化对 特征图进 行 处理, 最后进行拼接得到 输出结果。 5.根据权利要求2所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述步骤3.3中, 旋转建议区域生成模块orientedRPN具体操作包括: 步骤3.2输出特征 图经过卷积通道数变为6A, A表示每个锚点处生 成的锚框个数, 6表 示需要6个参数来定义一 个旋转锚框, 6个参数为(x,y,w,h,Δα,Δβ ), 其中x,y表示生成的水平锚框中心点坐标, w,h 表示生成的水平锚框的宽和高, Δα,Δβ 表示旋转锚框两个相邻顶点与水平锚框相邻两条 边中点之间的偏移量。 6.根据权利要求2所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述步骤3.4中改进的检测头PAM ‑head模块具体操作包括: 将 输入的特征图经极化注 意 力模块PAM处理, 为分类任务和定位任务生成不同的特征金字塔, 可以避免不同任务之间的权 利 要 求 书 1/2 页 2 CN 115272846 A 2特征干扰, 并有效提取不同任务所需的不同关键特征, 将得到的不同特征送入全连接层进 行分类和回归, 输出最终的分类与定位结果。 7.根据权利要求6所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述极化注意力模块PAM为双分支结构, 输入特征图经过注意力模块(通道注意力模块 与空间注意力模块并行)后使用不同的特征表示函数, 其中分类 分支使用激励函数, 可以得 到高响应的全局特征, 定位分支使用抑制函数, 可以只关注 边界特征, 抑制不相关的高激活 区域。 8.根据权利要求1 ‑7任一所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其 特征在于: 所述旋转目标检测方法的训练模 型的实验配置包括基于MMdetectionV2框架, 实 验环境为Pyt hon3.8, Pytorch1.7.0, torchv ision0.7.0, bat chsize为2, 学习率初始值 设置 为0.001, 最大训练epoch数为12, 在迭代到第9和11个epoch后学习率 分别下降到1 ×10‑4和 1×10‑5。 9.根据权利要求8所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 所述旋转目标检测方法的训练模型的实验硬件设备为 CoreTMi9‑10900XCPU, NVIDIARTX3 080Ti显卡。 10.根据权利要求9所述的一种基于改进Orientedrcnn的旋转目标检测方法, 其特征在 于: 将输入图像的尺寸调整为1024 ×1024像素, 以数据集各类目标的精度AP和全类目标平 均精度mAP作为实验的衡量指标。权 利 要 求 书 2/2 页 3 CN 115272846 A 3

.PDF文档 专利 一种基于改进Orientedrcnn的旋转目标检测方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于改进Orientedrcnn的旋转目标检测方法 第 1 页 专利 一种基于改进Orientedrcnn的旋转目标检测方法 第 2 页 专利 一种基于改进Orientedrcnn的旋转目标检测方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:26:33上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。