(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210452325.8
(22)申请日 2022.04.24
(65)同一申请的已公布的文献号
申请公布号 CN 114565800 A
(43)申请公布日 2022.05.31
(73)专利权人 深圳尚米网络技 术有限公司
地址 518100 广东省深圳市宝安区新 安街
道兴东社区69区洪浪北二路26号信义
领御研发中心8栋1409
(72)发明人 邓小明
(74)专利代理 机构 北京智丞瀚方知识产权代理
有限公司 1 1810
专利代理师 白月霞
(51)Int.Cl.
G06V 10/764(2022.01)G06V 10/74(2022.01)
G06K 9/62(2022.01)
G06T 5/20(2006.01)
G06V 20/62(2022.01)
(56)对比文件
US 20170 34094 A1,2017.02.02
CN 111324764 A,2020.0 6.23
审查员 魏兰
(54)发明名称
一种用于违规图片检测的方法及 图片检测
引擎
(57)摘要
本发明提供了一种用于违规图片检测的方
法及图片检测引擎; 所述图片检测引擎包括数据
接口模块、 黑白名单过滤模块、 图片预处理模块、
文本识别检测模块、 主题检测模块、 违规决策模
块、 用户检测模块、 引 擎数据库、 引擎管理模块;
违规图片检测的方法借助上述图片检测引擎的
各模块实现针对违规图片的识别检测。
权利要求书3页 说明书9页 附图1页
CN 114565800 B
2022.07.29
CN 114565800 B
1.一种用于违规图片检测的方法, 其特 征在于,
违规图片检测的方法包括以下步骤:
步骤S1、 数据接口模块获得用户发布图片数据, 包括用户数据、 图片数据、 关联主题数
据;
步骤S2、 黑白名单过滤模块对用户发布图片数据进行黑白名单过滤, 将对应结果输入
违规决策模块执行第一违规判断操作, 得到第一违规判断结果; 若第一违规判断结果表征
命中黑白名单, 则通过 数据接口模块输出第一违规判断结果;
步骤S3、 若第一违规判断结果表征未命中黑白名单, 则将用户发布图片数据输入图片
预处理模块进 行图片预处理操作, 得到图片预 处理结果; 同时, 将用户发布图片数据中的用
户数据输入用户检测模块进行用户检测操作, 得到用户检测结果;
图片预处理结果包括处理后的图片数据、 图片分类结果; 用户检测结果包括用户风险
概率数值;
步骤S4、 根据所述图片预处理结果中的图片分类结果进行操作: 若图片分类结果为含
文本类图片, 则将图片预 处理结果输入文本识别检测模块进 行文本检测得到文本违规检测
结果; 若图片分类结果为非文本图片, 则将图片预处理结果输入主题检测模块进行主题违
规检测得到主题违规检测结果;
步骤S5、 违规决策模块根据用户检测结果、 文本违规检测结果、 主题违规检测结果进行
违规决策 得到违规判定结果, 并由数据接口模块输出;
其中, 步骤S2中所述黑白名单过滤包括用户id黑白名单过滤、 用户ip黑白名单过滤、 图
片黑白名单 过滤;
步骤S4中所述主题检测模块 通过以下 方式实现主题违规检测:
根据图片预处理得到的图片分类结果匹配不同的检测模型, 并将图片数据输入对应的
检测模型进行检测, 得到对应模型的违规检测结果, 并拼装为违规检测结果列表;
根据违规检测结果列表计算主题违规 风险概率数值, 方法如下:
其中M为输入图片分类结果对应的检测模型集合,
为检测模型的绝对风险因数,
为
对应检测模型的检测结果。
2.根据权利要求1所述的方法, 其特 征在于,
所述文本检测依靠违规文本数据库实现, 所述违规文本数据库存 储违规文本关键词;
所述主题违规检测依靠关联主题图片数据库实现, 所述关联主题图片数据库存储关联
主题的违规图片及主题标签;
所述黑白名单过滤依靠黑白名单数据库, 所述黑白名单数据库用于存储用户id黑白名
单、 ip黑白名单及图片黑白名单。
3.根据权利要求1所述的方法, 其特 征在于,
所述用户id黑白名单过滤通过以下方式实现: 将用户id作为关键字在黑白名单数据库
中的用户id黑白名单列表中进行查询, 并输出对应的查询结果, 结果包含 “0”、“1”、“2”,“0”
表示用户id为白名单id, “1”表示用户id为 黑名单id, “2”表示无查询结果;权 利 要 求 书 1/3 页
2
CN 114565800 B
2所述用户ip黑白名单过滤通过以下方式实现: 将用户ip作为关键字在黑白名单数据库
中的ip黑白名单列表中进行查询, 并输出对应的查询结果, 结果包含 “0”、“1”、“2”,“0”表示
用户ip为白名单ip, “1”表示用户ip为 黑名单ip, “2”表示无查询结果;
所述图片黑白名单过滤通过以下方式实现: 将图片转化为灰度图并进行hash运算, 得
到图片关键编 码, 并以图片关键编 码为关键字在黑白名单数据库中的图片黑白名单列表中
进行查询, 并输出对应的查询结果, 结果包含 “0”、“1”、“2”,“0”表示图片为白名单图片, “1”
表示图片为黑名单图片, “2”表示无查询结果; 其中hash运算采用MD5算法; 所述图片黑白名
单列表中存储有黑白名单图片关键编 码及黑白名单标识, 黑白名单图片关键编 码同样通过
灰度转化后进行hash运 算得到。
4.根据权利要求1所述的方法, 其特 征在于,
步骤S3中所述图片预处理操作包括: 图片滤波、 图片增强、 图像分类检测, 具体步骤为:
对输入图片按照图片编码方式进行读取并将色彩空间转化为RGB空间得到第一图片数据;
对第一图片数据进行图片滤波及图片增强处理, 得到第二图片数据; 对第二图片数据执行
图片分类 检测, 得到图片分类数据。
5.根据权利要求 4所述的方法, 其特 征在于,
所述图片滤波通过以下算法实现: 对于输入图片转化为灰度图并按照预设的映射方式
得到增维的三维矩阵; 对三维矩阵按照预设变换方式得到增维度矩阵IX及权重矩阵EX; 通
过空间插值获得 滤波后图像;
所述图片增强通过以下算法实现:
将图片 (i, j) 位置的像素点
按照如下方式进 行变换, 得到处理后的处理后位置的
像素
:
其中depth表示图片增强 强度, 中档增强时取depth =2, 增强时取depth =2.5。
6.根据权利要求 4所述的方法, 其特 征在于,
所述图片分类 检测通过以下 方式进行:
对第二图片数据进行图片特征提取得到第 一图片特征数据, 并输入已训练的第 一图片
分类模型, 得到第一图片分类结果; 其中第一图片分类模型用于区分图片是否包含文本; 第
一图片分类结果 为“T”或“N‑T”,“T”表示图片包 含文本,“N‑T”表示图片不包 含文本;
当第一图片分类结果为 “T”时, 结束图片分类检测并输出包含第一图片分类结果的列
表; 当图片分类结果为 “N‑T”时, 将第一图片特征数据输入第二图片分类模型, 得到第二图
片分类结果, 结束图片分类检测并将第一图片分类结果与第二图片分类结果进行合并输
出; 其中第二图片分类模型用于识别检测图片涉及的主题标签, 第二图片分别类结果为包
含图片主题标签字符串的列表。
7.根据权利要求6所述的方法, 其特 征在于,
所述第一图片分类模型通过以下方式得到: 通过人工筛选方式取得第一模型原始数
据, 包括图片数据与图片是否包含文本的标签; 将第一模型原始数据拆分为第一模型训练
集和第一模型测试集; 采用逻辑回归算法通过第一模型训练集训练第一图片分类模型并依权 利 要 求 书 2/3 页
3
CN 114565800 B
3
专利 一种用于违规图片检测的方法及图片检测引擎
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 01:00:11上传分享