standard download
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
问题反馈
首页
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211240926.9 (22)申请日 2022.10.11 (71)申请人 同济人工智能研究院 (苏州) 有限公 司 地址 215000 江苏省苏州市相城区高铁新 城青龙港路58号天成时代商务广场 29、 30层 (72)发明人 邓若愚 胡尚薇 (74)专利代理 机构 苏州见山知识产权代理事务 所(特殊普通 合伙) 32421 专利代理师 袁丽花 (51)Int.Cl. G06V 20/62(2022.01) G06V 10/26(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06V 10/82(2022.01) (54)发明名称 一种基于动态染色的场景文字检测方法和 系统 (57)摘要 本申请提供一种基于动态染色的场景文字 检测方法和系统。 方法, 包括以下步骤: 1)提取待 检测图像的视觉特征, 对视觉特征进行特征融 合, 获取特征表达; 2)将特征表达输入分割预测 头部, 生成5个颜色通道的文本核语义分割概率 图; 3)在每个颜色通道Ci上找到置信度大于0的 连通域, 得到每个文本核位点集合Kj; 4)将每个 文本核Kj膨胀为完整文本实例Tj, 得到每个文本 实例的多边形候选框Pj; 5)依次遍历所有多边形 候选框, 对于每两个多边形候选框PiPj, 如果其 交叉面积占比较大, 则将其合并, 由此得到所有 检测框。 与现有技术相比, 本发明具有更好的泛 化性、 更有效的执行速度和对相邻文本更强的切 割能力。 权利要求书2页 说明书9页 附图3页 CN 115546777 A 2022.12.30 CN 115546777 A 1.一种基于动态染色的场景文字检测方法, 包括以下步骤: 1)提取待检测图像的视觉特征, 并对所述视觉特征进行多尺度特征融合, 获取所述待 检测图像的特 征表达; 2)根据所述特 征表达, 生成5个颜色通道的文本核语义分割概 率图; 3)在每个所述文本核语义分割概率图上找到置信度大于0的连通域, 得到每个文本核 位点集合; 4)将每个所述文本核位点集合膨胀为完整文本实例, 得到每个完整文本实例的多边形 候选框; 5)依次遍历所有多边形候选框, 对于每两个多边形候选框, 如果交叉面积与相对较小 的多边形候选 框的面积之比大于 0.5, 则将该两个多边形候选 框合并, 得到所有检测框 。 2.根据权利要求1所述的方法, 其特征在于, 所述的步骤1)中, 提取所述视觉特征的方 法包括: 利用在Ima geNet上预训练的主干网络, 所述主干网络包括ResNet5 0网络。 3.根据权利要求1所述的方法, 其特征在于, 所述的步骤2)中, 通过对特征表达进行三 个连续的卷积及 线性整流后, 最后经过SoftMax层得到5个颜色通道的文本核语义分割概率 图。 4.根据权利要求1所述的方法, 其特征在于, 所述的步骤3)中, 设定一个阈值, 在每个文 本核语义分割概 率图上找到 置信度大于所述阈值的连通 域, 得到每 个文本核位 点集合。 5.根据权利要求1所述的方法, 其特征在于, 所述的步骤4)中, 将每个文本核位点集合 经过形态学操作膨胀为完整文本实例; 遍历所有序号, 得到每个完整文本实例的独立二值 图, 再通过寻找轮廓算法, 得到每 个完整文本实例的多边形候选 框。 6.根据权利要求1所述的方法, 其特 征在于, 所述的步骤5)的具体算法为: 其中, Nt为最终检测框, IOU(Pi, Pj)为第i个与第j个候选框的交叉比, η为判断为重叠的 交叉比的阈值。 7.根据权利要求1所述的方法, 其特征在于, 所述的步骤1)中, 对视觉特征进行多尺度 特征融合的方法包括: 自浅入深的融合多尺度特 征。 8.一种基于动态染色的场景文字检测系统, 其特 征在于, 包括: 特征提取融合模块, 用于提取待检测图像的视觉特征, 并对所述视觉特征进行多尺度 特征融合, 获取 所述待检测图像的特 征表达; 染色分割模块, 用于根据所述特 征表达, 生成5个颜色通道的文本核语义分割概 率图; 文本核模块, 用于在每个所述文本核语义分割概率图上找到置信度 大于0的连通域, 得 到每个文本核位 点集合; 膨胀模块, 用于将每个所述文本核位点集合膨胀为完整文本实例, 得到每个完整文本 实例的多边形候选 框; 交叉合并模块, 用于依次遍历所有多边形候选框, 对于每两个多边形候选框, 如果交叉 面积与相对较小的多边形候选框的面积之比大于0.5, 则将该两个多边形候选框合并, 得到 所有检测框 。权 利 要 求 书 1/2 页 2 CN 115546777 A 29.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器运行所述计算机程序以实现如权利要求 1‑7任一 项所述的方法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理 器执行实现如权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115546777 A 3
专利 一种基于动态染色的场景文字检测方法和系统
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-24 01:00:18
上传分享
举报
下载
原文档
(714.6 KB)
分享
友情链接
OWASP SAMM中文Alpha版.pdf
GB-T 6995.2-2008 电线电缆识别标志方法 第2部分 标准颜色.pdf
GB-T 35589-2017信息技术大数据技术参考模型.pdf
T-ZZB 0746—2018 变频空调压缩机用永磁同步电动机.pdf
GB-T 30503-2014 船用制氮装置通用技术条件.pdf
GB-T 24513.2-2010 金属和合金的腐蚀 室内大气低腐蚀性分类 第2部分:室内大气腐蚀性的测定.pdf
GB-T 39901-2021 乘用车自动紧急制动系统(AEBS)性能要求及试验方法.pdf
GB-T 27563-2011 工业用N-甲基-2-吡咯烷酮.pdf
DB34-T 3906-2021 基层防汛监测预警系统集成规范 安徽省.pdf
LY-T 3159-2019 细木工板生产节能技术规范.pdf
GB-T 29716.1-2013 机械振动与冲击 信号处理 第1部分:引论.pdf
T-TCDZ 0001—2019 电动自行车用蓄电池充电器.pdf
华为 工业互联网白皮书 工业知识与ICT技术深入融合 2020.pdf
GM-T 0111-2021 区块链密码应用技术要求.pdf
T-CI 175—2022 智能交通基础设施数字化技术规范.pdf
人工智能语言对话大模型合集.pdf
GB-T 18488.2-2015 电动汽车用驱动电机系统 第2部分:试验方法.pdf
T-CSAE 262—2022 电动汽车电池管理系统用故障注入测试规范.pdf
TB-T 3210.1-2020 铁路煤炭运输抑尘技术条件 第1部分:抑尘剂.pdf
GB-T 42859-2023 航天产品质量问题三个面向分析方法实施要求.pdf
1
/
15
评价文档
赞助2.5元 点击下载(714.6 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。