(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211064792.X
(22)申请日 2022.09.01
(71)申请人 湖南天河国云科技有限公司
地址 410199 湖南省长 沙市长沙经济技 术
开发区星沙产业基地开元东路1318号
综合楼308
申请人 国家计算机网络与信息安全管理中
心
(72)发明人 谭林 毛洪亮 史博轩 姚昱旻
杨征 施力
(74)专利代理 机构 湖南兆弘专利事务所(普通
合伙) 43008
专利代理师 邹大坚
(51)Int.Cl.
G06F 16/16(2019.01)G06F 16/27(2019.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
(54)发明名称
基于可证明数据去重技术的分布式存储方
法、 存储系统及 介质
(57)摘要
本发明公开了一种基于可证明数据去重技
术的分布式存储 方法、 存储系统及介质, 包括: 上
传: 用户C通过分布式网关G提供的用户数据上传
接口PUT上传数据; 用户C向分布式网关G发起数
据上传请求, 通过密钥验证方式进行具有标识化
的存储; 下载: 用户C将需要下载的文件的文件 标
识FID给分布式网关G, 分布式网关G判断用户身
份C是否在在下载文件的文件标识FID的元数据
里面, 用以判定用户是否能够下载; 删除: 当用户
需要删除指定文件时, 将文件对应的文件标识
FID发给分布式网关G; 分布式网关G只需要将用
户C的身份ID从本地或者区块链上的文件存储元
数据删除。 该存储系统和介质均是基于上述方法
来实施。 本发明具有原理简单、 便于管理、 适用范
围广等优点。
权利要求书2页 说明书6页 附图3页
CN 115374064 A
2022.11.22
CN 115374064 A
1.一种基于可证明数据去重技 术的分布式存 储方法, 其特 征在于, 包括:
上传: 用户C通过分布式网关G提供的用户数据上传接口PUT上传数据; 用户C向分布式
网关G发起数据上传请求, 通过密钥验证的方式进行 具有标识化的存 储;
下载: 用户C将需要下载的文件 的文件标识FID给分布式网关G, 分布式网关G判断用户
身份C是否在 在下载文件的文件标识FID的元 数据里面, 用以判定用户是否能够下 载;
删除: 当用户需要删除指定文件时, 将文件对应的文件标识FID发给分布式网关G; 分布
式网关G只需要将用户C的身份ID从本地或者区块链上的文件 存储元数据删除。
2.根据权利要求1所述的基于可证明数据去重技术的分布式存储方法, 其特征在于, 在
所述上传流程中, 确认本次文件f上传需要用的密钥; 用户C利用密钥key对本次文件f进行
加密, 计算文件标识FID, 并将密钥key和文件标识FID发送给分布 式网关G; 分布 式网关G收
到文件后, 根据文件标识FID, 判断本次文件f是否已存 储过, 再进行存 储。
3.根据权利要求2所述的基于可证明数据去重技术的分布式存储方法, 其特征在于, 所
述上传流 程包括:
步骤S1: 用户C先向分布式网关G发起数据上传请求, 确认本次文件f上传需要用的密钥
key;
步骤S2: 用户C利用密钥key对本次文件进行加密, 计算文件标识FID, 并将密钥key和文
件标识FID发送给分布式网关 G。
4.根据权利要求3所述的基于可证明数据去重技术的分布式存储方法, 其特征在于, 所
述用户C与分布式网关 G进行密钥协商, 计算当前请求所需要的加密 密钥, 流程包括:
步骤S101: 用户C首先用SHA256算法计算文件hash值, 然后从Zp中抽取随机数R, 计算
h*, 并将其发给分布式网关 G;
步骤S102: 分布式网关 G收到h*后, 用自己的私钥计算s*, 并将s*返回用户C;
步骤S103: 用户C计算s, 用hash算法计算对称加密。
5.根据权利要求3所述的基于可证明数据去重技术的分布式存储方法, 其特征在于, 分
布式网关 G对上传文件的处 理流程包括:
步骤S201: 当 分布式网关 G收到文件后, 根据文件标识FID, 判断文件是否已存 储过;
步骤S202: 若文件不存在, 如果当前上传文件没有存储过, 分布式网关G将会生成带时
间戳的上传链接generateURL; 通过上传链接generateURL, 用户C将数据上传到分布式网关
节点; 之后, 分布式网关G的网关节点将用户身份C保存到本地的文件标识FID对应的元数据
信息中, 该 元数据用区块链存 储或保存到 本地数据库中;
步骤S203: 若文件已存在, 分布式网关G只需将用户身份ID保存到文件标识FID将对应
的数据库中。
6.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法,
其特征在于, 所述下载流程包括: 用户将需要下载的文件的FID给分布式网关G, 分布式网关
G判断用户身份C是否在在下载文件FID元数据里面, 如果在, 则说明用户C拥有文件FID, 允
许用户下载; 当用户身份C不在FID的对应的元数据中时, 表明用户C并不拥有该文件, 拒绝
他下载请求。
7.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法,
其特征在于, 所述删除流程包括: 当用户要删除指定文件时, 将文件对应的FID发给分布式权 利 要 求 书 1/2 页
2
CN 115374064 A
2网关G; 分布式网关G将用户的身份ID从本地或者区块链上的文件存储元数据删除; 如果当
前用户时最后一个用户, 则表明文件可以直接删除, 分布式网关G调用存储服务器提供商的
数据删除接口, 删除数据。
8.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法,
其特征在于, 还包括用户存储费用生成流程, 包括: 所述分布式网关G在每个时间段结束后,
对外发布当前存 储文件所对应用户情况的证明。
9.根据权利要求8所述的基于可证明数据去重技术的分布式存储方法, 其特征在于, 所
述证明包 含:
a.指定文件 存储所对应的用户数目, 用于计算每 个用户需要分担的存 储费用;
b.每个用户需要验证自己存 储的文件确实是被分布式网关管理, 用于下 载使用。
10.根据权利要求9所述的基于可证明数据去重技术的分布式存储方法, 其特征在于,
在每个时间间隔片段结束后, 分布式存储网关G按规则给用户提供数据持有证据{FID, P},
用于验证该时间片段的文件 存储的正确性。
11.根据权利要求10所述的基于可证明数据去重技术的分布式存储方法, 其特征在于,
所述用户C和分布式网关 G按照如下规则构建不可篡改的数据持有性证明:
分布式网关G构建一颗Merkle哈希证据树, 用于证明当前该文件对应的数据持有者数
目和给每 个数据持有者验证确实持有相应的文件;
在时间间隔Et, j叶节点的计算方式是: S0,i=HASH(FID||Ci||Et||seedi,t), 其中seedi,t
为每个用户在该时间片段生成随机n once, 公开验证Et为对应的第j个时间片段;
枝干节点的计算方式是: H(Sj,k)=H(Sj‑1,k,Sj‑1,k),j为第几层节点, 依次迭代可以计算
出P=HASH(Sroot,0)。
12.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法,
其特征在于, 还 包括验证流 程: 当用户发起验证请求时, 分布式网关 G返回两类元 数据。
13.一种基于可证明数据去重技 术的分布式存 储系统, 其特 征在于, 包括:
若干个分布式网关, 用户通过分布式网关提供的用户数据上传接口PUT上传数据; 用户
C向分布式网关G发起数据上传请求, 确认本次文件f上传需要用的密钥; 用户C利用密钥key
对本次文件 f进行加密, 计算文件标识FID, 并将密钥key和文件标识FID发送给分布 式网关
G; 分布式网关G收到文件后, 根据文件标识FID, 判断本次文件f是否已存储过, 再进 行存储;
用户C将需要下载的文件的文件标识FID给分布式网关G, 分布式网关G判断用户身份C是否
在在下载文件的文件标识FID的元 数据里面, 用以判定用户是否能够下 载;
本地或者区块链单元, 当用户需要删除指定文件时, 将文件对应的文件标识FID发给分
布式网关G; 分布式网关G只需要将用户C的身份ID从本地或者区块链上的文件存储元数据
删除。
14.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序
在被处理器运行时执行如权利要求 1~12中任意一项 所述的基于可证明数据去重技术的分
布式存储方法的步骤。权 利 要 求 书 2/2 页
3
CN 115374064 A
3
专利 基于可证明数据去重技术的分布式存储方法、存储系统及介质
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:24上传分享