(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210031460.5
(22)申请日 2022.01.12
(71)申请人 中国平安人寿保险股份有限公司
地址 518000 广东省深圳市福田区福田街
道益田路5033号平安金融中心14、 15、
16、 37、 41、 4 4、 45、 46、 54、 58、 59层
(72)发明人 刘东煜 曾增烽
(74)专利代理 机构 深圳中一联合知识产权代理
有限公司 4 4414
代理人 路亚芳
(51)Int.Cl.
G06V 20/62(2022.01)
G06F 40/30(2020.01)
G06F 16/583(2019.01)
G06F 16/532(2019.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/82(2022.01)
G06V 30/30(2022.01)
(54)发明名称
数据处理方法、 装置、 终端设备及存 储介质
(57)摘要
本申请适用于数据处理技术领域, 提供了一
种数据处理方法、 装置、 终端设备及存储介质。 上
述方法通过子数据的文本信息生成类型信息, 并
通过子数据的文本信息和类型信息生成标识信
息, 以及通过子数据之间的连接关系生成子数据
的结构信息, 将通过图像识别得到的结构化数据
进行分结构 存储, 并赋予每一结构的数据唯一标
识, 简化结构化数据的查询逻辑, 提高结构化数
据的调用效率。
权利要求书2页 说明书10页 附图4页
CN 114373173 A
2022.04.19
CN 114373173 A
1.一种数据处 理方法, 其特 征在于, 应用于数据库, 所述方法包括:
接收待识别图像的结构化数据; 所述结构化数据包括u层数据, 每层所述数据包括多份
子数据和每份所述子数据的文本信息, 第i+1层数据的任意一份子数据与第i层数据对应的
一份子数据连接, 每层所述数据用于存 储不同结构的数据;
对每份所述子数据的文本信息进行语义分析, 确定每 份所述子数据的类型信息;
根据每份所述子数据的文本信息和类型信息, 生成每份所述子数据的标识信息, 每份
所述子数据的标识信息不同;
根据多份所述子数据之间的连接关系, 生成每份所述子数据的结构信息, 所述结构信
息用于记录每 份所述子数据连接的上一层数据对应的一份子数据的标识信息;
其中, i=1,2,…u‑1, u为大于或等于2的整数。
2.如权利要求1所述的数据处理方法, 其特征在于, 所述接收待识别图像的结构化数据
之前, 所述方法还 包括:
通过图像识别模块分析所述待识别图像的图像特征和语义特征, 提取所述待识别图像
的结构化数据;
通过所述图像识别模块将所述待识别图像的结构化数据发送至所述数据库。
3.如权利要求1所述的数据处理方法, 其特征在于, 所述每层所述数据还包括每份所述
子数据的关键词信息;
所述根据每份所述子数据的文本信息和类型信息, 生成每份所述子数据的标识信息,
包括:
根据每份所述子数据的关键词信息, 确定关键词类型信息和关键词数值信息;
根据每份所述子数据的关键词类型信 息和关键词数值信 息, 生成每份所述子数据的标
识信息。
4.如权利要求1所述的数据处理方法, 其特征在于, 所述数据库与至少一个需求单元连
接;
所述对每份所述子数据的文本信 息进行语义分析, 确定每份所述子数据的类型信 息之
后, 所述方法还 包括:
根据每份所述子数据的类型信息, 确定每份所述子数据的权限级别, 所述子数据的权
限级别用于与所述需求单元的权限级别进 行比较, 以验证所述需求单元是否具有对应子数
据的访问权限。
5.如权利要求1所述的数据处理方法, 其特征在于, 所述数据库与至少一个需求单元连
接;
所述根据多份所述子数据之间的连接关系, 生成每份所述子数据的结构信息之后, 还
包括:
接收所述需求单 元发送的调用指令, 所述调用指令包括目标子数据的标识信息;
根据所述目标子数据的标识信息, 获取 所述目标子数据的文本信息和类型信息;
将所述目标子数据的文本信息和类型信息发送至所述需求单 元。
6.如权利要求5所述的数据处理方法, 其特征在于, 所述根据所述目标子数据的标识信
息, 获取所述目标子数据的文本信息和类型信息, 包括:
获取所述需求单 元的权限级别和所述目标子数据的权限级别;权 利 要 求 书 1/2 页
2
CN 114373173 A
2在所述需求单元的权限级别大于所述目标子数据的权限级别时, 根据 所述目标子数据
的标识信息, 获取 所述目标子数据的文本信息和类型信息 。
7.如权利要求1至6任一项所述的数据处理方法, 其特征在于, 所述结构化数据包括4层
数据, 第1层数据用于存储待识别图像, 第2层数据用于存储所述待识别图像的段落, 第3层
数据用于存储所述段落的事件或所述段落的表格, 第4层数据用于存储所述事件的元素或
所述表格的元 素。
8.一种数据处 理装置, 其特 征在于, 包括:
接收模块, 用于接收待识别图像的结构化数据; 所述结构化数据包括u层数据, 每层所
述数据包括多份子数据和每份所述子数据的文本信息, 第i+1层数据的任意一份子数据与
第i层数据对应的一份子数据连接, 每层所述数据用于存 储不同结构的数据;
分析模块, 用于对每份所述子数据的文本信息进行语义分析, 确定每份所述子数据的
类型信息;
标识模块, 用于根据每份所述子数据的文本信息和类型信息, 生成每份所述子数据的
标识信息, 每 份所述子数据的标识信息不同;
处理模块, 用于根据多份所述子数据之间的连接关系, 生成每份所述子数据的结构信
息, 所述结构信息用于记录每份所述子数据连接的上一层数据对应的一份子数据的标识信
息;
其中, i=1,2,…u‑1, u为大于或等于2的整数。
9.一种终端设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上
运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求1至7
任一项所述的数据处 理方法的步骤。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在
于, 所述计算机程序被处理器执行时实现如权利要求 1至7任一项 所述的数据处理方法的步
骤。权 利 要 求 书 2/2 页
3
CN 114373173 A
3
专利 数据处理方法、装置、终端设备及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:57上传分享