专利 基于可证明数据去重技术的分布式存储方法、存储系统及介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211064792.X (22)申请日 2022.09.01 (71)申请人湖南天河国云科技有限公司地址 410199 湖南省长沙市长沙经济技术开发区星沙产业基地开元东路1318号综合楼308 申请人国家计算机网络与信息安全管理中心 (72)发明人谭林　毛洪亮　史博轩　姚昱旻　杨征　施力　 (74)专利代理机构湖南兆弘专利事务所(普通合伙) 43008 专利代理师邹大坚 (51)Int.Cl. G06F 16/16(2019.01)G06F 16/27(2019.01) G06F 21/60(2013.01) G06F 21/62(2013.01) (54)发明名称基于可证明数据去重技术的分布式存储方法、存储系统及介质 (57)摘要本发明公开了一种基于可证明数据去重技术的分布式存储方法、存储系统及介质，包括：上传：用户C通过分布式网关G提供的用户数据上传接口PUT上传数据；用户C向分布式网关G发起数据上传请求，通过密钥验证方式进行具有标识化的存储；下载：用户C将需要下载的文件的文件标识FID给分布式网关G，分布式网关G判断用户身份C是否在在下载文件的文件标识FID的元数据里面，用以判定用户是否能够下载；删除：当用户需要删除指定文件时，将文件对应的文件标识 FID发给分布式网关G；分布式网关G只需要将用户C的身份ID从本地或者区块链上的文件存储元数据删除。该存储系统和介质均是基于上述方法来实施。本发明具有原理简单、便于管理、适用范围广等优点。权利要求书2页说明书6页附图3页 CN 115374064 A 2022.11.22 CN 115374064 A 1.一种基于可证明数据去重技术的分布式存储方法，其特征在于，包括：上传：用户C通过分布式网关G提供的用户数据上传接口PUT上传数据；用户C向分布式网关G发起数据上传请求，通过密钥验证的方式进行具有标识化的存储；下载：用户C将需要下载的文件的文件标识FID给分布式网关G，分布式网关G判断用户身份C是否在在下载文件的文件标识FID的元数据里面，用以判定用户是否能够下载；删除：当用户需要删除指定文件时，将文件对应的文件标识FID发给分布式网关G；分布式网关G只需要将用户C的身份ID从本地或者区块链上的文件存储元数据删除。 2.根据权利要求1所述的基于可证明数据去重技术的分布式存储方法，其特征在于，在所述上传流程中，确认本次文件f上传需要用的密钥；用户C利用密钥key对本次文件f进行加密，计算文件标识FID，并将密钥key和文件标识FID发送给分布式网关G；分布式网关G收到文件后，根据文件标识FID，判断本次文件f是否已存储过，再进行存储。 3.根据权利要求2所述的基于可证明数据去重技术的分布式存储方法，其特征在于，所述上传流程包括：步骤S1：用户C先向分布式网关G发起数据上传请求，确认本次文件f上传需要用的密钥 key；步骤S2：用户C利用密钥key对本次文件进行加密，计算文件标识FID，并将密钥key和文件标识FID发送给分布式网关 G。 4.根据权利要求3所述的基于可证明数据去重技术的分布式存储方法，其特征在于，所述用户C与分布式网关 G进行密钥协商，计算当前请求所需要的加密密钥，流程包括：步骤S101：用户C首先用SHA256算法计算文件hash值，然后从Zp中抽取随机数R，计算 h*，并将其发给分布式网关 G；步骤S102：分布式网关 G收到h*后，用自己的私钥计算s*，并将s*返回用户C；步骤S103：用户C计算s，用hash算法计算对称加密。 5.根据权利要求3所述的基于可证明数据去重技术的分布式存储方法，其特征在于，分布式网关 G对上传文件的处理流程包括：步骤S201：当分布式网关 G收到文件后，根据文件标识FID，判断文件是否已存储过；步骤S202：若文件不存在，如果当前上传文件没有存储过，分布式网关G将会生成带时间戳的上传链接generateURL；通过上传链接generateURL，用户C将数据上传到分布式网关节点；之后，分布式网关G的网关节点将用户身份C保存到本地的文件标识FID对应的元数据信息中，该元数据用区块链存储或保存到本地数据库中；步骤S203：若文件已存在，分布式网关G只需将用户身份ID保存到文件标识FID将对应的数据库中。 6.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法，其特征在于，所述下载流程包括：用户将需要下载的文件的FID给分布式网关G，分布式网关 G判断用户身份C是否在在下载文件FID元数据里面，如果在，则说明用户C拥有文件FID，允许用户下载；当用户身份C不在FID的对应的元数据中时，表明用户C并不拥有该文件，拒绝他下载请求。 7.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法，其特征在于，所述删除流程包括：当用户要删除指定文件时，将文件对应的FID发给分布式权　利　要　求　书 1/2 页 2 CN 115374064 A 2网关G；分布式网关G将用户的身份ID从本地或者区块链上的文件存储元数据删除；如果当前用户时最后一个用户，则表明文件可以直接删除，分布式网关G调用存储服务器提供商的数据删除接口，删除数据。 8.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法，其特征在于，还包括用户存储费用生成流程，包括：所述分布式网关G在每个时间段结束后，对外发布当前存储文件所对应用户情况的证明。 9.根据权利要求8所述的基于可证明数据去重技术的分布式存储方法，其特征在于，所述证明包含： a.指定文件存储所对应的用户数目，用于计算每个用户需要分担的存储费用； b.每个用户需要验证自己存储的文件确实是被分布式网关管理，用于下载使用。 10.根据权利要求9所述的基于可证明数据去重技术的分布式存储方法，其特征在于，在每个时间间隔片段结束后，分布式存储网关G按规则给用户提供数据持有证据{FID， P}，用于验证该时间片段的文件存储的正确性。 11.根据权利要求10所述的基于可证明数据去重技术的分布式存储方法，其特征在于，所述用户C和分布式网关 G按照如下规则构建不可篡改的数据持有性证明：分布式网关G构建一颗Merkle哈希证据树，用于证明当前该文件对应的数据持有者数目和给每个数据持有者验证确实持有相应的文件；在时间间隔Et， j叶节点的计算方式是： S0,i＝HASH(FID||Ci||Et||seedi,t)，其中seedi,t 为每个用户在该时间片段生成随机n once，公开验证Et为对应的第j个时间片段；枝干节点的计算方式是： H(Sj,k)＝H(Sj‑1,k,Sj‑1,k),j为第几层节点，依次迭代可以计算出P＝HASH(Sroot,0)。 12.根据权利要求1 ‑5中任意一项所述的基于可证明数据去重技术的分布式存储方法，其特征在于，还包括验证流程：当用户发起验证请求时，分布式网关 G返回两类元数据。 13.一种基于可证明数据去重技术的分布式存储系统，其特征在于，包括：若干个分布式网关，用户通过分布式网关提供的用户数据上传接口PUT上传数据；用户 C向分布式网关G发起数据上传请求，确认本次文件f上传需要用的密钥；用户C利用密钥key 对本次文件 f进行加密，计算文件标识FID，并将密钥key和文件标识FID发送给分布式网关 G；分布式网关G收到文件后，根据文件标识FID，判断本次文件f是否已存储过，再进行存储；用户C将需要下载的文件的文件标识FID给分布式网关G，分布式网关G判断用户身份C是否在在下载文件的文件标识FID的元数据里面，用以判定用户是否能够下载；本地或者区块链单元，当用户需要删除指定文件时，将文件对应的文件标识FID发给分布式网关G；分布式网关G只需要将用户C的身份ID从本地或者区块链上的文件存储元数据删除。 14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序在被处理器运行时执行如权利要求 1～12中任意一项所述的基于可证明数据去重技术的分布式存储方法的步骤。权　利　要　求　书 2/2 页 3 CN 115374064 A 3

专利 基于可证明数据去重技术的分布式存储方法、存储系统及介质

专利基于可证明数据去重技术的分布式存储方法、存储系统及介质