standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210474113.X (22)申请日 2022.04.29 (71)申请人 北京育达东方软件科技有限公司 地址 100080 北京市海淀区海淀东 三街2号 13层1301-02 (72)发明人 郝双 张建鑫 张飞飞 郑成祎  李宁  (74)专利代理 机构 北京英创嘉友知识产权代理 事务所(普通 合伙) 11447 专利代理师 温易娜 (51)Int.Cl. G06V 30/148(2022.01) G06V 30/32(2022.01) G06V 30/414(2022.01) G06T 7/73(2017.01)G06T 7/11(2017.01) G06K 9/62(2022.01) G06V 10/44(2022.01) G06V 10/26(2022.01) G06F 40/126(2020.01) G06V 10/774(2022.01) G06V 10/74(2022.01) (54)发明名称 批改方法、 装置、 存 储介质及电子设备 (57)摘要 本公开涉及计算机技术领域, 具体涉及一种 批改方法、 装置、 存储介质及电子设备, 以提高批 改的效率及准确性。 该方法包括: 获取待批改的 答题图像; 确定所述待批改 的答题图像中是否包 含已批改的文本内容; 在所述待批改的答题图像 中包括所述已批改的文本内容的情况下, 擦除所 述已批改的文本内容, 得到待识别的目标答题图 像; 对所述待识别的目标答题图像进行文本识 别, 得到待批改的文本内容; 对所述待批改的文 本内容进行批改。 权利要求书2页 说明书13页 附图9页 CN 114821593 A 2022.07.29 CN 114821593 A 1.一种批改方法, 其特 征在于, 包括: 获取待批改的答题图像; 确定所述待批改的答题图像中是否包 含已批改的文本内容; 在所述待批改的答题图像中包括所述已批改的文本内容的情况下, 擦除所述已批改的 文本内容, 得到待识别的目标答题图像; 对所述待识别的目标答题图像进行文本识别, 得到待批改的文本内容; 对所述待批改的文本内容进行批改。 2.根据权利要求1所述的方法, 其特征在于, 所述确定所述待批改的答题图像中是否包 含已批改的文本内容, 包括: 对所述待批改的答题图像中每一文本行进行编码, 得到每一所述文本行的位置向量以 及句向量, 以及根据每一所述文本行 的位置向量及所述句向量, 得到每一所述文本行 的文 本特征向量; 根据每一所述文本行的文本特 征向量确定所述待批改的答题图像的文本特 征; 根据所述待批改的答题图像的文本特征和上一次获取的包含所述已批改的文本内容 的已批改答题图像的文本特征, 确定所述待批改的答题图像与所述已批改答题图像之 间的 特征相似度; 在所述特征相似度大于相似度阈值的情况下, 确定所述待批改的答题图像中包含已批 改的文本内容。 3.根据权利要求1所述的方法, 其特征在于, 所述在所述待批改的答题图像中包括所述 已批改的文本内容的情况下, 擦除所述已批改的文本内容, 得到待识别的目标答题图像, 包 括: 在所述待批改的答题图像中包括所述已批改的文本内容的情况下, 将所述待批改的答 题图像与上一次获取的包含所述已批改的文本内容的已批改答题图像进 行像素对齐处理, 得到对齐后的待批改的答题图像; 根据所述已批改答题图像, 在所述对齐后的待批改的答题图像中擦除所述已批改的文 本内容, 得到待识别的目标答题图像。 4.根据权利要求3所述的方法, 其特征在于, 所述在所述待批改的答题图像中包括所述 已批改的文本内容的情况下, 将所述待批改的答题图像与上一次获取的包含所述已批改的 文本内容的已批改答题图像进行像素对齐处 理, 得到对齐后的待批改的答题图像, 包括: 将所述待批改的答题图像划分成N ×M的网格图像; 根据所述网格图像, 确定所述待批改的答题图像中文本内容对应的局部区域图像; 通过SURF算法将所述局部区域图像与上一次获取的包含所述已批改的文本内容的已 批改答题图像的局部区域图像进行像素对齐处 理, 得到对齐后的待批改的答题图像。 5.根据权利要求4所述的方法, 其特征在于, 所述根据所述已批改答题图像, 在所述对 齐后的待批改的答题图像中擦除所述已批改的文本内容, 得到待识别的目标答题图像, 包 括: 确定所述局部区域图像与所述已批改答题图像的局部区域图像中每一像素点的灰度 值; 将所述局部区域图像中与 所述已批改答题图像的局部区域图像中位置对应, 且灰度值权 利 要 求 书 1/2 页 2 CN 114821593 A 2相同的像素点确定为待 擦除的像素点; 在所述对齐后的待批改的答题图像中擦除所述待擦除的像素点, 得到待识别的目标答 题图像。 6.根据权利要求1所述的方法, 其特征在于, 所述对所述待识别的目标答题图像进行文 本识别, 得到待批改的文本内容, 包括: 在所述目标答题图像中确定手写笔迹的位置, 并根据所述位置在所述目标答题图像中 用文本框标注; 根据所述文本 框对所述目标答题图像进行剪 裁, 得到待批改的文本图像; 将所述待批改的文本图像输入训练好的文字识别模型, 得到所述文字识别模型输出的 文字识别结果, 所述文字识别结果 为所述待批改的文本内容。 7.根据权利要求1所述的方法, 其特征在于, 所述对所述待批改的文本内容进行批改, 包括: 根据所述待批改的文本内容与试题答案的比对结果, 对所述待批改的文本 内容进行对 错判定; 或 将所述批改结果输入训练好的批改模型, 以通过所述批改模型对所待批改的文本 内容 进行批改。 8.一种批改装置, 其特 征在于, 包括: 获取模块, 被 配置为获取待批改的答题图像; 第一确定模块, 被 配置为确定所述待批改的答题图像中是否包 含已批改的文本内容; 擦除模块, 被配置为在所述待批改的答题图像中包括所述已批改的文本内容的情况 下, 擦除所述已批改的文本内容, 得到待识别的目标答题图像; 文本识别模块, 被配置为对所述待识别的目标答题图像进行文本识别, 得到待批改的 文本内容; 批改模块, 被 配置为对所述待批改的文本内容进行批改。 9.一种非临时性计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被 处理器执行时实现权利要求1 ‑7中任一项所述方法的步骤。 10.一种电子设备, 其特 征在于, 包括: 存储器, 其上存 储有计算机程序; 处理器, 用于执行所述存储器 中的所述计算机程序, 以实现权利要求1 ‑7中任一项所述 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114821593 A 3

PDF文档 专利 批改方法、装置、存储介质及电子设备

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 批改方法、装置、存储介质及电子设备 第 1 页 专利 批改方法、装置、存储介质及电子设备 第 2 页 专利 批改方法、装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。