(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211312098.5
(22)申请日 2022.10.25
(71)申请人 陕西融盛知识产权平台有限公司
地址 710076 陕西省西安市高新区丈 八四
路20号神州数码西安科技园4栋26层D
区
(72)发明人 李扩拉
(74)专利代理 机构 西安嘉思特知识产权代理事
务所(普通 合伙) 6123 0
专利代理师 辛菲
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/33(2019.01)
G06F 16/31(2019.01)
G06F 16/35(2019.01)G06F 40/216(2020.01)
G06F 40/253(2020.01)
G06F 40/279(2020.01)
G06F 40/30(2020.01)
(54)发明名称
一种基于Elasticsearch的专利检索统计引
擎
(57)摘要
本发明公开了一种基于Elasticsearch的专
利检索统计引擎, 包括: 标准请求参数获取模块,
用于获取标准请求参数; Elasticsearch查询语
句转换模块, 用于将标准请求参数转换为
Elasticsear ch查询语句; 专利检索模 块, 用于利
用Elasticsearch查询语句在Elasticsearch中
进行专利检索; 标准响应结果获得模块, 用于将
Elasticsear ch检索结果转换为标准 响应结果输
出; 本发明定义了一种专利检索统计的接口规
范, 基于Elasticsear ch实现专利检索统计引擎,
能处理包括复杂条件检索、 多维数据统计分析、
专利去重文档合并和异步专利检索等在内的多
种专利检索统计需求。
权利要求书3页 说明书28页 附图4页
CN 115481234 A
2022.12.16
CN 115481234 A
1.一种基于 Elasticsearc h的专利检索统计引擎, 其特 征在于, 包括:
标准请求参数获取模块, 用于获取标准请求参数; 其中, 所述标准请求参数表征待处理
的专利检索统计需求的属 性信息; 所述专利检索统计需求包括复杂条件检索、 多维数据 统
计分析、 专利去重文档合并和异步专利检索; 所述标准请求参数 的结构是针对检索输入预
先定义的标准的数据结构;
Elasticse arch查询语句转换模块, 用于利用标准请求参数与 Elasticsearch查询语句
的逻辑对应关系, 将所述标准请求 参数转换为Elasticsearc h查询语句;
专利检索模块, 用于利用所述Elasticsearch查询语句在Elasticsearch中进行专利检
索, 得到Elasticsearc h检索结果;
标准响应结果获得模块, 用于将所述Elasticsearch检索结果转换为标准响应结果输
出; 其中, 所述标准响应结果的结构是针对检索输出 预先定义的标准的数据结构。
2.根据权利要求1所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述
标准请求 参数的结构, 包括:
索引名indexName、 专利检索表达式searchExpr、 排序属性sortField、 数据偏移
offset、 数据限制li mit、 统计字段列表stati sticsFieldLi st、 去重字段collapseField、 异
步检索编号asyncSearchId和异步检索需求async; 其中, 所述排序属性sortField包括排序
字段名fieldName和排序方向reverseOrder; 异步检索需求async的值表示是否进行异步检
索;
所述标准响应结果的结构, 包括:
专利文档列表docList、 命中数count、 去重命中数countAfterCollapse、 统计数据
statisticsData、 异步检索编号asyncSearc hId和异步检索状态asyncSearc hStatus。
3.根据权利要求2所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述
Elasticsearch查询语句转换模块利用标准请求参数与Elasticsearch查询语句的逻辑对
应关系, 将所述标准请求 参数转换为Elasticsearc h查询语句的过程, 包括:
将所述标准请求参数中searchExpr的值利用预设的专利检索表达式语句转换方法转
换为Elasticsearc h查询语句, 并赋值到Query DSL中的query属性上;
将所述标准请求参数中sortField的值转换为Elasticsearch查询语句中排序语句的
格式, 并赋值到Query DSL的sort属性上;
将所述标准请求 参数中of fset的值赋值到Query DSL中的from属性上;
将所述标准请求 参数中limit的值赋值到Query DSL中的size属性上;
针对所述标准请求参数 中statisticsFieldList内 的每个统计, 基于Elasticse arch中
的terms分组聚合函数, 将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句
的格式, 构造对应的JSON对象, 并赋值到Query DSL的aggs属性上;
将所述标准请求参数中collapseField的值转换为Elasticsearch查询 语句中去重查
询语句的格式, 并赋值到Query DSL的collapse属性上。
4.根据权利要求3所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述
将所述标准请求参数中searchExpr的值利用预设 的专利检索表达式语句转换方法转换为
Elasticsearc h查询语句, 包括:
利用预先构 建的分词器解析searchExpr中专利检索表达式对应的字符串, 得到解析出权 利 要 求 书 1/3 页
2
CN 115481234 A
2的多个分词; 其中, searchExpr中的专利检索表达式、 所述分词器基于预先定义的可扩展的
专利检索表达式语法结构 构建;
基于所述专利检索表达式语法结构, 将所述多个分词处 理为标准语法节点的列表;
根据所述标准语法节点的列表生成标准语法树;
利用预先构建的语法转换器, 将所述标准语法树 转换为Elasticsearc h查询语句。
5.根据权利要求3所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述
针对所述标准请求参数中statisticsFieldList内的每个统计, 基于Elasticsearch中的
terms分组聚合函数, 将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句的
格式, 构造对应的JSON对象, 并赋值到Query DSL的aggs属性上, 包括:
针对所述标准请求参数中statisticsFieldList内的每个统计, 若该统计为单级维度,
利用Elasticsearch中的terms分组聚合函数将该单级维度统计对应的字段值转换为
Elasticsearch查询语句的格式, 得到该单级维度统计对应的Elasticsearch聚合查询语
句; 其中, stati sticsFieldList内的每一项 为统计字段stati sticsField, 代表一个独立的
统计;
针对所述标准请求参数中statisticsFieldList内的每个统计, 若该统计为多级维度,
将该多级维度统计下不同单级维度利用Elasticsearch中的terms分组聚合函数分别得到
的Elasticsearch聚合查询语句按顺序嵌套, 合并得到该多级维度统计对应的
Elasticsearc h聚合查询语句;
针对每个统计, 以该统计的统计字段为key, 对应的Elasticsearch聚合查询语句为
value, 构造成一个JSON对象, 并赋值到Query DSL的aggs属性上。
6.根据权利要求5所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 若所
述标准请求参数中含有collapseField的值, 所述针对所述标准请求参数中
statisticsFieldLi st内的每个统计, 基于Elasticsearch中的terms分组聚合函数, 将该统
计对应的值转换为Elasticsearch查询语句中聚合查询语句的格式, 构造对应的JSON对象,
并赋值到Query DSL的aggs属性上的过程中, 还需要在每个单级维度对应的Elasticsearch
聚合查询语句中加入cardi nality聚合函数实现去重计数。
7.根据权利要求3所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述
将所述标准请求参数中collapseField的值转换为Elasticsearch查询语句中去重查询语
句的格式, 并赋值到Query DSL的collap se属性上之后, 所述Elasticsearch查询语句转换
模块还用于:
在转换得到的Elasticsearch去重查询语句中加入cardinality聚合函数, 对符合所述
Elasticsearch去重查询语句对应的检索条件的专利进行去重计数, 以获得去重后的专利
总数。
8.根据权利要求1~7任一项所述的基于Elasticsearch 的专利检索统计引擎, 其特征
在
专利 一种基于Elasticsearch的专利检索统计引擎
文档预览
中文文档
36 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:45:04上传分享