(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210915910.7
(22)申请日 2022.08.01
(71)申请人 成都卫士通信息产业股份有限公司
地址 610041 四川省成 都市高新区云华路
333号
(72)发明人 张舒黎 陈珊 胡松
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 陈建平
(51)Int.Cl.
G06F 16/13(2019.01)
G06F 16/14(2019.01)
G06F 16/16(2019.01)
G06F 21/60(2013.01)
G06F 21/62(2013.01)
(54)发明名称
文档上传存储 方法、 查询下载方法、 装置、 设
备及介质
(57)摘要
本申请公开了一种文档上传存储 方法、 文档
查询下载方法、 装置、 设备及介质, 包括: 从密钥
管理中心获取第一密钥和第二密钥, 并基于第一
密钥得到衍生密钥; 利用全文搜索引擎客户端中
的安全分词器对待存储文档进行处理以得到索
引素材, 并基于衍生密钥对索引素材进行加密以
得到密文索引素材, 以及利用安全分词器调用密
码模块生 成第三密钥; 利用第三密钥对待存储文
档进行加密以得到密文文档, 并利用第二密钥对
第三密钥加密得到加密后密钥; 将密文索引素
材、 密文文档、 加密后 密钥上传至云服务器, 以便
云服务器通过全文搜索引擎服务端基于密文索
引素材对索引文件进行更新, 以及将密文文档和
加密后密钥存储至存储系统。 提高了云数据存
储、 查询的安全性。
权利要求书3页 说明书13页 附图6页
CN 115269504 A
2022.11.01
CN 115269504 A
1.一种文档上传存 储方法, 其特 征在于, 应用于用户终端, 包括:
从密钥管理中心获取第一密钥和第二密钥, 并基于所述第一密钥得到衍 生密钥;
利用全文搜索引擎客户端中的安全分词器对待存储文档进行处理以得到索引素材, 并
基于所述衍生密钥对所述索引素材进 行加密以得到密 文索引素材, 以及利用所述安全分词
器调用密码模块 生成第三密钥;
利用所述第 三密钥对所述待存储文档进行加密以得到密文文档, 并利用所述第 二密钥
对所述第三密钥加密得到加密后密钥;
将所述密文索引素材、 所述密文文档、 所述加密后密钥上传至云服务器, 以便所述云服
务器通过全文搜索引擎服务端基于所述密文索引素材对索引文件进行更新, 以及将所述密
文文档和所述加密后密钥存 储至存储系统。
2.根据权利要求1所述的文档上传存储方法, 其特征在于, 所述利用全文搜索引擎客户
端中的安全分词器对待存储文档进行 处理以得到索引素材, 并基于所述衍生密钥对所述索
引素材进行加密以得到密文索引素 材, 包括:
利用全文搜索引擎客户端中的安全分词器对待存储文档进行处理以得到倒排索引素
材;
根据所述待存 储文档中的文档元信息生成正 排索引素 材;
基于所述衍生密钥对所述倒排索引素材中的信 息进行加密以得到密文倒 排索引素材,
以及基于所述 衍生密钥对所述 正排索引素 材中的信息进行加密以得到密文正 排索引素 材;
利用所述安全分词器对所述密文倒排索引素材和所述密文正排索引素材进行封装以
得到密文索引素 材。
3.根据权利要求2所述的文档上传存储方法, 其特征在于, 所述利用全文搜索引擎客户
端中的安全分词器对待存 储文档进行处 理以得到倒排索引素 材, 包括:
利用全文搜索引擎客户端中的安全分词器提取出所述待存储文档中的关键字信 息, 并
统计所述关键 字的词频信息, 以及基于所述关键 字从所述待存 储文档中筛 选出摘要信息;
基于所述关键 字信息、 所述词频信息和所述摘要信息得到倒排索引素 材。
4.根据权利要求3所述的文档上传存储方法, 其特征在于, 所述根据所述待存储文档中
的文档元信息生成正 排信息素 材, 包括:
根据所述待存储文档中的文档元信 息得到域信 息, 并基于所述域信 息得到正排信 息素
材; 其中, 所述 域信息包括标题、 日期、 作者、 时间中的任意 一种或几种信息 。
5.根据权利要求4所述的文档上传存储方法, 其特征在于, 所述基于所述第 一密钥得到
衍生密钥, 包括:
利用密钥派生算法从所述第一密钥得到第一衍生密钥、 第二衍生密钥和第三衍生密
钥;
相应的, 所述基于所述衍生密钥对所述倒排索引素材中的信 息进行加密以得到密文倒
排索引素 材, 包括:
基于预设杂凑算法利用所述第一衍生密钥对所述关键字信息进行加密得到密文关键
字, 基于保序加密算法利用所述第二衍生密钥对所述词 频信息进行加密得到密文词 频, 利
用所述第三 衍生密钥对所述摘要信息进行加密得到密文摘要;
基于所述密文关键 字、 所述密文词频、 所述密文摘要得到密文倒排素 材;权 利 要 求 书 1/3 页
2
CN 115269504 A
2相应的, 所述基于所述衍生密钥对所述正排索引素材中的信 息进行加密以得到密文正
排索引素 材, 包括:
利用所述第 三衍生密钥对所述域信 息进行加密得到密文域信 息, 并基于所述密文域信
息得到密文正 排索引素 材。
6.根据权利要求5所述的文档上传存储方法, 其特征在于, 所述将所述密文索引素材、
所述密文文档、 所述加密后密钥传输至云服务器, 以便所述云服务器通过全文搜索引擎服
务端基于所述密文索引素 材对索引文件进行 更新, 包括:
将所述密文索引素材、 所述密文文档、 所述加密后密钥传输至云服务器, 以便所述云服
务器通过全文搜索引擎服务端中与所述安全分词器对应的自定义安全分词器对所述密文
索引素材进 行解析, 以得到所述密 文关键字、 所述密 文词频、 所述密 文摘要和所述密 文域信
息;
通过所述全文搜索引擎服务端将所述密文关键字和所述密文域信息按照预设存放规
则存储至相应的索引文件中, 并基于所述密文词 频和所述密文摘要构建倒排词 频文件, 以
及将所述倒排词频文件按照所述密文词频从大至小的顺序进行存 储。
7.一种文档查询下 载方法, 其特 征在于, 应用于用户终端, 包括:
获取待下载密文文档的查询内容, 并利用全文搜索引擎客户端中的安全分词器对所述
查询内容进行处理以得到加密关键字; 其中, 所述待下载密文文档为利用如权利要求1至6
任一项所述的文档上传存 储方法存 储的密文 文档;
将所述加密关键字传输至云服务器, 以便所述云服务器通过全文搜索引擎服务端基于
所述加密关键字匹配出目标密文文档集, 并利用预先定义的保序加密打分机制从所述目标
密文文档集中筛选出预设数量个密文文档, 以及完成预设数量个所述密 文文档的排序以得
到密文文档排序结果, 然后基于预设数量个所述密文 文档得到相应的密文 展示信息;
获取所述云服务器发送的所述密文文档排序 结果和所述密文展示信 息, 并从密钥管理
中心获取第一密钥和第二密钥, 并基于所述第一密钥得到衍 生密钥;
基于所述衍生密钥对所述密文展示信 息进行解密以得到解密后信 息, 以及基于所述解
密后信息和所述密文文档排序结果从所述云服务器下载相 应的密文文档和与所述密文文
档对应的加密后密钥, 以便利用所述第二密钥对所述加密后密钥进行解密得到第三密钥,
并利用所述第三密钥对所述密文 文档进行解密。
8.根据权利要求7所述的文档查询下载方法, 其特征在于, 所述基于预设数量个所述密
文文档得到相应的密文 展示信息, 包括:
从预设数量个所述密文文档提取出每个所述密文文档对应的密文摘要、 密文标题、 密
文作者、 密 文时间, 并对 所述密文摘要、 所述密 文标题、 所述密 文作者、 所述密 文时间进 行封
装, 以得到密文 展示信息 。
9.一种文档上传存 储装置, 其特 征在于, 应用于用户终端, 包括:
密钥获取模块, 用于从密钥管理中心获取第一密钥和第二密钥, 并基于所述第一密钥
得到衍生密钥;
素材获取模块, 用于利用全文搜索引擎客户端中的安全分词器对待存储文档进行处理
以得到索引素材, 并基于所述衍生密钥对所述索引素材进 行相应的加密处理得到密 文索引
素材;权 利 要 求 书 2/3 页
3
CN 115269504 A
3
专利 文档上传存储方法、查询下载方法、装置、设备及介质
文档预览
中文文档
23 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:44上传分享