(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210850105.0
(22)申请日 2022.07.20
(65)同一申请的已公布的文献号
申请公布号 CN 115080546 A
(43)申请公布日 2022.09.20
(73)专利权人 湖南新长海科技产业发展 有限公
司
地址 410100 湖南省长 沙市长沙县星沙街
道开元东路266号华润置地广场一期
12栋1201、 120 5-014
(72)发明人 唐畋甸 周正 涂长青 张小波
刘振亮 肖晓莉 黄丹凤
(74)专利代理 机构 长沙伊柏专利代理事务所
(普通合伙) 4326 5
专利代理师 罗莎(51)Int.Cl.
G06F 16/21(2019.01)
G06F 16/215(2019.01)
G06F 16/22(2019.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
G06F 21/55(2013.01)
(56)对比文件
CN 109597843 A,2019.04.09
CN 106682527 A,2017.0 5.17
CN 114418246 A,202 2.04.29
EP 2565814 A2,2013.0 3.06
CN 114003943 A,202 2.02.01
审查员 熊晶
(54)发明名称
一种基于大数据的企业数据诊断系统
(57)摘要
本发明涉及一种基于大数据的企业数据诊
断系统, 尤其涉及企业数据处理技术领域, 包括
数据获取模块, 与所述数据获取模块连接的数据
划分模块, 所述数据划分模块用以对 数据获取模
块获取的企业数据进行划分; 与所述数据划分模
块连接的数据存储模块, 通过对企业数据进行获
取, 并通过设置数据划分模块对企业数据进行数
据划分, 并针对划分完成的不同的企业数据, 设
置可访问企业数据数据库的用户权限和设置删
除时间期限, 从而保证对企业运营过程产生的数
据的控制精 准度, 避免重要数据丢失或非重要数
据删除不及时的问题, 提高了企业数据库的运行
效率。
权利要求书2页 说明书7页 附图1页
CN 115080546 B
2022.11.11
CN 115080546 B
1.一种基于大 数据的企业数据诊断系统, 其特 征在于, 包括:
数据获取模块, 其包括用以获取企业数据的数据获取 单元;
数据划分模块, 其与所述数据获取模块连接, 所述数据划分模块用以对数据获取模块
获取的所述企业数据进行划分;
数据存储模块, 其与所述数据划分模块连接, 所述数据存储模块用以将划分完成后的
所述数据存 储在对应的数据库;
其中, 数据划分模块在将所述企业数据进行划分时, 提取所述企业数据的若干关键词,
并将若干关键词与所述企业数据相关的大数据进 行关联, 根据若干 关键词和关联大数据的
关联度确定所述 企业数据的等级, 并在数据访问过程中, 获取用户历史数据, 根据用户历史
数据确定用户的合格率, 且在确定用户合格率完成时, 确定用户是否可继续访问数据库以
及可访问数据库时可提取的最大 数据量;
并根据用户数据中的敏感词比例确定是否对用户权限进行调 整, 以及在确定对用户权
限进行调整时, 根据敏感词比例确定对应的调节系数对用户权限值进行调整;
所述数据获取模块还包括用以获取用户的访问请求并确定用户访问请求是否合格的
访问识别单元, 分别与所述数据存储模块和访问识别单元连接的用以在确定所述用户访问
请求合格时提取对应数据库中的数据的数据提取 单元;
所述访问识别单元在识别到用户访 问请求时, 获取用户权限, 根据用户权限确定是否
可访问和/或提取所述企业数据, 并在确定可进行所述企业数据的访问和/或提取时, 获取
用户数据, 所述访问识别单元在获取用户数据完成时, 提取用户数据的关键词, 并根据该用
户数据的关键词确定用户访问是否合格,
若所述用户数据的关键词中存在敏感词, 则所述访问识别单 元确定用户访问不 合格;
若所述用户数据的关键词中不存在敏感词, 则所述访问识别单 元确定用户访问合格;
所述访问识别单元在确定所述用户访问不合格时, 获取用户历史访问的合格率Y, 设定
Y=P/Pz, 并根据该合格率Y与预设合格率Y0的比对 结果确定用户是否可继续访问企业数据,
其中P为历史访问不 合格次数, Pz为历史访问总次数,
若Y≤Y0, 所述访问识别单 元确定用户仅可继续访问第一企业数据;
若Y>Y0, 所述访问识别单 元确定用户可继续访问企业数据;
所述数据提取单元在所述访问识别单元确定用户可继续访问所述企业数据时, 计算所
述合格率Y与预设合格率Y0的第一合格率差值ΔYa, 设定ΔYa=Y ‑Y0, 并根据该第一合格率
差值与预设合格率差值的比对结果确定用户可提取 数据的最大 数据量。
2.根据权利要求1所述的基于大数据的企业数据诊断系统, 其特征在于, 所述数据划分
模块在将所述企业数据进行划分时, 提取所述企业数据的若干关键词, 并将若干关键词与
企业数据的关联大数据进行比对, 计算若干关键词与关联大数据的关联度 R, 设定R=D/Dz,
根据该关联度R和预设关联度的比对结果确定所述企业数据的划分, 其中D为若干所述关键
词中与关联大数据中相同的数据量, Dz为关联大数据的数据量, 所述预设关联度包括第一
预设关联度R1和第二预设 关联度R2, R 1<R2,
若R≤R1, 所述数据划分模块确定所述企业数据为第一企业数据;
若R1<R≤R2, 所述数据划分模块确定所述企业数据为第二企业数据;
若R>R2, 所述数据划分模块确定所述企业数据为第三企业数据。权 利 要 求 书 1/2 页
2
CN 115080546 B
23.根据权利要求2所述的基于大数据的企业数据诊断系统, 其特征在于所述数据提取
单元设置有第一预设误差率差值ΔY1、 第二预设误差率差值ΔY2、 第一最大数据量Q 1、 第二
最大数据量Q2以及第三 最大数据量Q3, 其中Δ Y1<ΔY2, Q1<Q2<Q3,
当ΔYa≤ΔY1时, 所述数据提取 单元确定用户可提取 数据的最大 数据量为Q1;
当ΔY1<ΔYa≤ΔY2时, 所述数据提取 单元确定用户可提取 数据的最大 数据量为Q2;
当ΔYa>ΔY2时, 所述数据提取 单元确定用户可提取 数据的最大 数据量为Q3。
4.根据权利要求3所述的基于大数据的企业数据诊断系统, 其特征在于, 所述访问识别
单元在确定所述用户访问不合格时, 根据用户数据中敏感词在用户数据中的比例B与预设
比例B0的比对结果确定是否对用户权限值进行调整,
若B>B0, 则所述访问识别单 元确定对所述用户权限值进行调整,
若B≤B0, 则所述访问识别单 元确定不对所述用户权限值进行调整。
5.根据权利要求4所述的基于大数据的企业数据诊断系统, 其特征在于, 所述数据划分
模块还包括与所述访问识别单元连接的数据调整 单元, 数据调整 单元在确定所述访问识别
单元对所述用户权限值进 行调整时, 计算所述比例B与预设比例B0的比例差值ΔB, 设定ΔB
=B‑B0, 并根据该比例差值与预设比例差值的比对结果选取对应的调节系数对用户权限值
进行调整,
其中, 所述数据调整单元设有第一预设比例差值ΔB1、 第二预设比例差值ΔB2、 第一调
节系数K1、 第二调节系数K2以及第三调节系数K3, 其中ΔB 1<ΔB2, 设定0.5<K3<K2<K1
<1,
当ΔB≤ΔB1时, 所述数据调整单 元选取第一调节系数 K1对所述用户权限值进行调整;
当ΔB1<ΔB≤ΔB2时, 所述数据调整单元选取第二调节系数K2对所述用户权限值进
行调整;
当ΔB>ΔB2时, 所述数据调整单 元选取第三调节系数 K3对所述用户权限值进行调整;
当所述数据调整单元选取第i调节系数Ki对所述用户权限值进行调整时, 设定i=1, 2,
3, 所述调整单元将调整后的用户权限值设置为Ak, 设定Ak=An ×Ki, 其中A n为调节前用户权
限值, n为大于零的正整数。
6.根据权利要求5所述的基于大数据的企业数据诊断系统, 其特征在于, 所述数据划分
模块在提取若干所述关键词时, 根据所述企业数据的数据量W与预设数据量的比对结果确
定提取所述关键词的数量, 其中所述数据划分模块设有第一预设数据量W1、 第二预设数据
量W2、 第一关键词数量G1、 第二关键词数量G2以及第三关键词数量G3, 其中W1<W2, G1<G2
<G3,
当W≤W1时, 所述数据划分模块确定所述关键词数量 为G1;
当W1<W≤W2时, 所述数据划分模块确定所述关键词数量 为G2;
当W>W2时, 所述数据划分模块确定所述关键词数量 为G3。
7.根据权利要求6所述的基于大数据的企业数据诊断系统, 其特征在于, 所述数据存储
模块在所述数据划分模块划分数据完成时, 生成所述第一企业数据对应的非存储数据库、
第二企业数据和 第三企业数据对应的存储数据库, 所述访问识别单元中设有针对存储数据
库的用户权限等级对应的用户权限值A n; 所述数据调整单元设有针对非存储数据库的数据
存储时长t。权 利 要 求 书 2/2 页
3
CN 115080546 B
3
专利 一种基于大数据的企业数据诊断系统
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:54上传分享