(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211030296.2
(22)申请日 2022.08.26
(71)申请人 中船航海科技有限责任公司
地址 200136 上海市浦东 新区金桥路5 35号
(72)发明人 郭富海 李晨浩 王鸿显 张政
杜鹏 胡春洋 陈秀敏
(74)专利代理 机构 上海智力专利商标事务所
(普通合伙) 31105
专利代理师 周涛
(51)Int.Cl.
G06V 20/10(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/25(2022.01)
G06V 10/44(2022.01)G06V 10/75(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于深度学习的船舶目标识别检测方
法
(57)摘要
本发明公开了一种基于深度学习的船舶目
标识别检测方法, 包括如下步骤: (1)采集船舶航
行水域的图像样本; (2)对 图像进行预处理及标
注; (3)进行数据增强, 制作用于训练的数据集;
(4)基于YOLOv 4网络构建深度学习网络模型; (5)
使用预训练的参数作为初始 权重, 训练深度学习
网络; (6)将处理后的待检测图片输入骨干网络
进行特征提取, 经过颈部网络进行特征融合, 并
进行非极大值抑制操作, 完成对船舶目标的预
测; (7)进行输 出后处理, 使用置信 度阈值进行结
果过滤, 结合其他指标判断得到最优的检测结
果。 本发明在复杂海域中提高小目标检测能力和
多目标分类效果。
权利要求书2页 说明书7页 附图5页
CN 115471746 A
2022.12.13
CN 115471746 A
1.一种基于深度学习的船舶目标识别检测方法, 其特 征在于, 包括如下步骤:
(1)采集船舶航行 水域的图像样本;
(2)对图像进行 预处理及标注;
(3)进行数据增强, 制作用于训练的数据集;
(4)基于YOLOv4网络构建深度学习网络模型;
(5)使用预训练的参数作为初始权 重, 训练深度学习网络;
(6)将处理后的待检测图片输入骨干网络进行特征提取, 经过颈部网络进行特征融合,
并进行非极大值抑制操作, 完成对船舶目标的预测;
(7)进行输出后处理, 使用置信度阈值进行结果过滤, 结合其他指标判断得到最优的检
测结果。
2.根据权利要求1所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述步
骤(2)中, 对采集的图像使用LabelImage进行至少以下五种海面目标的标注: 散货船、 集装
箱船、 渔船、 游轮、 岛屿。
3.根据权利要求1所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述步
骤(3)中, 使用Mosaic数据增强的方法制作用于训练的数据集, 采用4张图片一组, 随机缩
放、 随机裁剪、 随机排布的方式进行拼接, 得到新的4张图像, 使其输入总数不变, 并对得到
的新的图像采取随机遮挡。
4.根据权利要求3所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述步
骤(4)中, 所述深度学习网络模型包括骨干特征提取网络、 SPP结构、 PANet多路径特征融合
结构和Head检测头结构; 所述骨干特征提取网络使用尺寸为640*640的RGB图像作为输入,
经过卷积、 Batch Normalization和Mish激活函数后, 再通过尺寸分别为(320, 320, 64),
(160, 160, 128), (80, 80, 256), (40, 40, 512), (20, 20, 1024)的残差块结构; 进行特征提取
后, 最后一个残差块的输出经过SPP结构, 拼接后将经过CSP与CBL结构的结果与主干网络倒
数第二和倒数第三个残差块的输出结果一起作为PANet结构的输入; 所述PANet结构, 进行
一系列的上采样、 下采样和卷积操作, 并将三个输入进行多路径特征融合处理, 然后输入
Head; 所述Head将输出解码前船舶的目标坐标信息, 包括目标框横坐标x、 目标框纵坐标y、
目标框宽w及目标框高h, 分类置信度和目标有无置信度。
5.根据权利要求1所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述步
骤(5)中, 引入自适应锚框计算模块, 在训练的过程中自动计算锚框, 网络在初始锚框的基
础上输出 预测框, 进 而和真实框进行比对, 计算两者差距, 再反向更新, 迭代网络参数。
6.根据权利要求1所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 步骤
(6)中所述骨干网络为Darknet ‑53, 在Darknet ‑53中将特征注意模块FA嵌入调整后的残差
结构中, 对特征通道关系中的特征权重进行重新分配, 在全局平均池化前加入1 ×1和3×3
的卷积, 实现跨通道信息集 成, 增强船舶图像的空间连通能力; 然后, 通过全局平均池化, 将
特征图的全局空间信息转 化为一维向量 求和, 得到特 征图的全局信息 。
7.根据权利要求6所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述全
局平均池化公式如下:权 利 要 求 书 1/2 页
2
CN 115471746 A
2其中, Gc为特征 图全局平均池化后的向量和, H和W为输入特征图的宽度和高度, Uc(i,
j)为第c通道Uc在(i,j)处的值。
8.根据权利要求4所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述步
骤(6)中, 对Mosaic数据增强后的图像自适应添加最少的黑边, 进行标准化处理, 缩放到
640*640大小, 并转换为RGB图片; 标准化的图片输入到训练好的网络中, 得到Head的输出;
Head的输出将包括三个特征层, 每个特征层分别划分20*20, 40*40和80*80个网格, 每个格
点将对应三个anchor, 每个anchor在其对应的网格点内进行中心偏移和长宽放缩; 对于解
码, 首先将预测结果根据对应anchor的原始尺寸进行比例放缩, 然后根据网格划分与
anchor中心的偏移 量计算出预测框相对于标准化输入图的长宽和位置, 最后根据标准化处
理时所加入的灰色边框过滤掉多余的预测; 解码后, 将进行非极大值抑制操作, 直接选择置
信度最高的一个目标作为输出。
9.根据权利要求4所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述步
骤(7)中, 对步骤(6)的输出先进行输出区域阈值过滤, 防止网络在没有船舶目标时给出预
测, 减少误检; 然后使用置信度阈值进 行最后的结果过滤, 即置信度大于阈值的船舶目标被
输出作为 最终预测。
10.根据权利要求9所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 所述
输出区域阈值包括宽度方向阈值和高度方向阈值两个部 分, 其中所述宽度方向阈值为船舶
目标的中心坐标距所在图片边界的距离, 所述高度方向阈值 为整张图片宽和高的比值。
11.根据权利要求1所述的基于深度学习的船舶目标识别检测方法, 其特征在于, 步骤
(7)中所述其他指标包括目标边界框、 定位置信度、 所有类别概率图, 定位置信度大于阈值
的船舶目标被输出作为预测结果; 目标边界框与预测 边界框偏移量小于一定值、 所有类别
概率图中概 率大的为所检测目标。权 利 要 求 书 2/2 页
3
CN 115471746 A
3
专利 一种基于深度学习的船舶目标识别检测方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 04:38:20上传分享