standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210946807.9 (22)申请日 2022.08.09 (71)申请人 深圳市跨越新科技有限公司 地址 518000 广东省深圳市宝安区航城街 道后瑞社区深圳机场航站四路汉莎航 空园区A栋4楼 (72)发明人 寇宇 陈才宁 赵兴  (74)专利代理 机构 深圳国新 南方知识产权代理 有限公司 4 4374 专利代理师 张亚娟 (51)Int.Cl. G06F 40/279(2020.01) G06V 30/10(2022.01) G06V 30/14(2022.01) G06V 30/412(2022.01)G06F 21/62(2013.01) (54)发明名称 一种敏感信息识别方法、 装置、 设备及存储 介质 (57)摘要 本发明公开了一种敏感信息识别方法、 装 置、 设备及存储介质, 其中方法包括: 对输入图片 进行信息提取, 获得若干文字信息和每一文字信 息对应的位置信息; 将所述文字信息按照其对应 的位置信息进行排序, 按照顺序依次判断当前文 字信息是否为第一类关键词; 若为, 确定当前文 字信息处于表格中, 则判断其所处表格类型并识 别相应位置的文字信息是否含有敏感标识, 若 是, 继续识别下一个文字信息; 若否, 确定 所述输 入图片包含敏感信息; 若不为, 判断当前文字信 息是否包含第二类关键词, 若包含, 确定所述输 入图片包含敏感信息; 若不包含, 继续识别下一 个文字信息。 本发明能够在敏感信息不可见的情 况下, 高效准确的识别图片中是否存在敏感信 息, 保障信息安全。 权利要求书2页 说明书10页 附图3页 CN 115422917 A 2022.12.02 CN 115422917 A 1.一种敏感信息识别方法, 其特 征在于, 包括: 对输入图片进行信息提取, 获得若干文字信息和每一文字信息对应的位置信息; 将所述文字信 息按照其对应的位置信 息进行排序, 按照顺序依次判断当前文字信 息是 否为第一类关键词; 若为, 确定当前文字信息处于表格中, 则判断其所处表格类型并识别相应位置的文字 信息是否含有敏感标识, 若是, 继续识别下一个文字信息; 若否, 确定所述输入图片包含敏 感信息; 若不为, 判断当前文字信 息是否包含第二类关键词, 若包含, 确定所述输入图片包含敏 感信息; 若不包 含, 继续识别下一个文字信息 。 2.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述表格类型包括竖向表 格和横向表格; 所述判断其所处表格 类型, 包括: 判断所述当前文字信 息的上侧和/或下侧是否为第 一类关键词, 若是, 确定其所处表格 类型为横向表格; 若否, 判断所述当前文字信息的左侧和/或右侧是否为第一类关键词, 若是, 确定其所 处表格类型为竖向表格。 3.如权利要求2所述的一种敏感信 息识别方法, 其特征在于, 所述识别相应位置的文字 信息是否含有敏感标识, 包括: 若所述当前文字信 息所处表格类型为所述横向表格, 识别其右侧相邻的文字信 息是否 含有敏感标识; 若所述当前文字信 息所处表格类型为所述竖向表格, 识别其下侧相邻的文字信 息是否 含有敏感标识。 4.如权利要求3所述的一种敏感信 息识别方法, 其特征在于, 所述位置信 息包括每一文 字信息的左侧边界的位置信息; 识别所述当前文字信 息下侧相邻的文字信 息含有敏感标识后, 继续依次识别位于所述 当前文字信息下侧、 且左侧边界的位置信息与其相同的文字信息是否含有敏感标识。 5.如权利要求1或权利要求3或权利要求4所述的一种敏感信 息识别方法, 其特征在于, 相应位置的文字信息识别含有敏感标识后, 对其设置已识别标识; 当按照顺序依次判断当前文字信 息是否为第 一类关键词时, 跳过有已识别标识的文字 信息。 6.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述将所述文字信 息按照 其对应的位置信息进行排序, 包括: 将所述文字信息按照其对应的位置信息从左到右、 从上到下进行排序。 7.如权利要求1所述的一种敏感信 息识别方法, 其特征在于, 所述敏感标识用于屏蔽信 息。 8.一种敏感信 息识别装置, 其特征在于, 包括数据获取模块、 文本排序模块和判断引擎 模块; 所述数据获取模块用于对输入图片进行信 息提取, 获得若干文字信 息和每一文字信 息 对应的位置信息; 所述文本排序模块用于将所述文字信息按照其对应的位置信息进行排序;权 利 要 求 书 1/2 页 2 CN 115422917 A 2所述判断引擎模块用于按照顺序依次判断当前文字信息是否为第一类关键词; 若为, 确定当前文字信息处于表格中, 则判断其所处表格类型并识别相应位置的文字 信息是否含有敏感标识, 若是, 继续识别下一个文字信息; 若否, 确定所述输入图片包含敏 感信息; 若不为, 所述判断引擎模块继续判断当前文字信息是否包含第二类关键词, 若包含, 确 定所述输入图片包 含敏感信息; 若不包 含, 继续识别下一个文字信息 。 9.一种敏感信息识别设备, 包括处 理器和存 储器, 其中: 所述存储器用于存 储计算机程序; 所述处理器用于读取所述存储器 中的计算机程序, 并执行如权利要求1~7所述的任一 敏感信息识别方法的步骤。 10.一种计算机可读存储介质, 其上存储有可读的计算机程序, 该程序被处理器执行时 实现如权利要求1~7 所述的任一敏感信息识别方法的步骤。权 利 要 求 书 2/2 页 3 CN 115422917 A 3

PDF文档 专利 一种敏感信息识别方法、装置、设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种敏感信息识别方法、装置、设备及存储介质 第 1 页 专利 一种敏感信息识别方法、装置、设备及存储介质 第 2 页 专利 一种敏感信息识别方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。