(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210735928.9
(22)申请日 2022.06.27
(71)申请人 浪潮工业互联网股份有限公司
地址 250101 山东省济南市高新区浪潮路
1036号浪潮科技园S02号楼19层
(72)发明人 姚欣云 胡立军 商广勇 肖雪
戎亚茹
(74)专利代理 机构 北京君慧知识产权代理事务
所(普通合伙) 11716
专利代理师 王彬
(51)Int.Cl.
G06F 16/22(2019.01)
G06F 16/2455(2019.01)
G06F 16/25(2019.01)
G06F 21/60(2013.01)G06F 21/62(2013.01)
(54)发明名称
一种针对工业大数据的数据管 理方法、 设备
及存储介质
(57)摘要
本申请公开了一种针对工业大数据的数据
管理方法、 设备及存储介质。 方法包括: 确定若干
个业务系统数据源, 并分析若干个业务系统数据
源中的数据字典表和模型字段, 以确定若干个业
务系统数据源中各源数据表对应的数据转换规
则; 根据数据转换规则, 对各源数据表中的源数
据进行格式转换, 以生成初始标准数据, 并基于
预设的数据安全 管理算法, 对初始标准数据进行
处理, 以生成标准数据; 将标准数据抽取到源数
据表对应的目标数据表中; 确定目标数据表对应
的元数据与主数据信息, 并基于目标数据表对应
的元数据与主数据信息对进行目标数据表发布。
本申请通过上述方法实现了对各业务系统的工
业数据按统一标准进行集成和治理。
权利要求书3页 说明书7页 附图1页
CN 115129716 A
2022.09.30
CN 115129716 A
1.一种针对工业大 数据的数据管理方法, 其特 征在于, 所述方法包括:
确定若干个业务系统数据源, 并分析所述若干个业务系统数据源中的数据字典表和模
型字段, 以确定所述若干个业务系统数据源中各源 数据表对应的数据转换规则; 其中, 所述
源数据表用于存储业务数据, 所述数据字典表包含对应业务系统数据源中各源数据表存储
的数据类型, 所述模型字段用于描述对应数据类型的数据表示形式;
根据所述数据转换规则, 对所述各源数据表中的源数据进行格式转换, 以生成初始标
准数据, 并基于预设的数据安全管理算法, 对所述初始标准数据进行处理, 以生成标准数
据;
将所述标准数据抽取到所述源数据表对应的目标 数据表中;
确定所述目标数据表对应的元数据与主数据信 息, 并基于所述目标数据表对应的元数
据与主数据信息对所述进行目标数据表发布; 其中, 所述 目标数据表对应的主数据信息用
于描述所述目标 数据表包 含的标准数据的数据类型。
2.根据权利要求1所述的一种针对工业大数据的数据 管理方法, 其特征在于, 基于预设
的数据安全管理算法, 对所述初始标准数据进行处 理, 具体包括:
根据预设的敏感数据判断规则, 确定所述初始标准数据是否为敏感数据, 并在确定所
述初始标准数据为敏感数据的情况下, 通过脱敏算法, 对所述初始标准数据进 行脱敏处理;
以及,
基于各业务系统数据源对应的数据读取权限与 数据加密算法, 对所述初始标准数据进
行加密。
3.根据权利要求1所述的一种针对工业大数据的数据 管理方法, 其特征在于, 将所述标
准数据抽取到所述源数据表对应的目标 数据表中, 具体包括:
构建所述目标数据表对所述源数据表的数据抽取逻辑; 其中, 所述数据抽取逻辑包含
待抽取的标准数据的数据类型、 以及所述源数据表与所述目标 数据表的映射关系;
基于所述源数据表的表类型, 确定所述标准数据对应的数据抽取方式; 其中, 所述表类
型包括: 可修改数据 表与不可修改数据 表; 所述数据抽取方式包括: 全量数据抽取与增量数
据抽取;
在触发所述标准数据对应的定时数据抽取任务的情况下, 基于所述标准数据对应的数
据抽取方式, 将所述标准数据抽取到所述源数据表对应的目标 数据表中。
4.根据权利要求3所述的一种针对工业大数据的数据 管理方法, 其特征在于, 在将所述
标准数据抽取到所述源数据表对应的目标 数据表中之后, 所述方法还 包括:
构建所述目标 数据表对应的数据质量检测规则;
在触发所述目标数据表对应的定时数据检测任务的情况下, 基于所述数据质量检测规
则, 对所述目标数据 表中的标准数据进 行检测, 并生成数据质量检测报告, 以确定所述目标
数据表中的标准数据是否存在质量问题; 其中, 所述数据质量检测报告包含基于所述数据
质量检测规则对各 标准数据的判断结果;
在所述目标数据表中的标准数据存在质量问题的情况下, 基于所述数据质量检测报告
修改所述数据抽取逻辑和/或所述数据转换规则, 以保证重新抽取到所述 目标数据表中的
标准数据的质量。
5.根据权利要求1所述的一种针对工业大数据的数据 管理方法, 其特征在于, 在基于所权 利 要 求 书 1/3 页
2
CN 115129716 A
2述元数据与所述主数据信息对所述进行目标 数据表发布之后, 所述方法还 包括:
基于预设的业 务需求, 确定待生成需求数据模型对应的与元 数据与主数据信息;
基于所述待生成需求数据模型对应的与 元数据与主数据信 息, 对所述目标数据表中的
主数据进行提取, 以构建需求数据模型。
6.根据权利要求5所述的一种针对工业大数据的数据 管理方法, 其特征在于, 在构建需
求数据模型之后, 所述方法还 包括:
确定所述需求数据模型的存 储地址;
基于所述需求数据模型的存储地址, 创建所述需求数据模型对应的数据共享服务, 具
体包括:
定义所述数据共享服务的访 问路径、 访 问协议、 访 问参数、 返回参数、 需求数据模型汇
总逻辑;
对所述数据共享 服务进行发布, 并设置所述数据共享 服务能够通过API方式进行调用。
7.根据权利要求6所述的一种针对工业大数据的数据 管理方法, 其特征在于, 在对所述
数据共享服务进 行发布, 并设置所述数据共享服务能够通过API方式进 行调用之后, 所述方
法还包括:
接收并解析所述数据共享服务对应的调用请求, 以确定所述调用请求包含的请求地址
与用户权限;
基于所述用户权限, 确定所述需求数据模型中对应权限的可展示数据, 并发送密钥验
证信息;
在基于所述密钥验证信 息接收到正确的密钥的情况下, 返回所述需求数据模型中对应
权限的可展示数据。
8.根据权利要求1所述的一种针对工业大数据的数据 管理方法, 其特征在于, 业务系统
数据源的类型包括: JDBC型 数据库、 大 数据型数据库、 DB型 数据库。
9.一种针对工业大 数据的数据管理设备, 其特 征在于, 所述设备包括:
处理器;
及存储器, 其上存储有可执行代码, 当所述可执行代码被执行时, 使得所述处理器执行
如权利要求1 ‑8任一项所述的一种针对工业大 数据的数据管理方法。
10.一种针对工业大数据的数据管理的非易失性计算机存储介质, 存储有计算机可执
行指令, 其特 征在于, 所述计算机可 执行指令设置为:
确定若干个业务系统数据源, 并分析所述若干个业务系统数据源中的数据字典表和模
型字段, 以确定所述若干个业务系统数据源中各源 数据表对应的数据转换规则; 其中, 所述
源数据表用于存储业务数据, 所述数据字典表包含对应业务系统数据源中各源数据表存储
的数据类型, 所述模型字段用于描述对应数据类型的数据表示形式;
根据所述数据转换规则, 对所述各源数据表中的源数据进行格式转换, 以生成初始标
准数据, 并基于预设的数据安全管理算法, 对所述初始标准数据进行处理, 以生成标准数
据;
将所述标准数据抽取到所述源数据表对应的目标 数据表中;
确定所述目标数据表对应的元数据与主数据信 息, 并基于所述目标数据表对应的元数
据与主数据信息对所述进行目标数据表发布; 其中, 所述 目标数据表对应的主数据信息用权 利 要 求 书 2/3 页
3
CN 115129716 A
3
专利 一种针对工业大数据的数据管理方法、设备及存储介质
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:35:12上传分享