standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211312098.5 (22)申请日 2022.10.25 (71)申请人 陕西融盛知识产权平台有限公司 地址 710076 陕西省西安市高新区丈 八四 路20号神州数码西安科技园4栋26层D 区 (72)发明人 李扩拉  (74)专利代理 机构 西安嘉思特知识产权代理事 务所(普通 合伙) 6123 0 专利代理师 辛菲 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/33(2019.01) G06F 16/31(2019.01) G06F 16/35(2019.01)G06F 40/216(2020.01) G06F 40/253(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) (54)发明名称 一种基于Elasticsearch的专利检索统计引 擎 (57)摘要 本发明公开了一种基于Elasticsearch的专 利检索统计引擎, 包括: 标准请求参数获取模块, 用于获取标准请求参数; Elasticsearch查询语 句转换模块, 用于将标准请求参数转换为 Elasticsear ch查询语句; 专利检索模 块, 用于利 用Elasticsearch查询语句在Elasticsearch中 进行专利检索; 标准响应结果获得模块, 用于将 Elasticsear ch检索结果转换为标准 响应结果输 出; 本发明定义了一种专利检索统计的接口规 范, 基于Elasticsear ch实现专利检索统计引擎, 能处理包括复杂条件检索、 多维数据统计分析、 专利去重文档合并和异步专利检索等在内的多 种专利检索统计需求。 权利要求书3页 说明书28页 附图4页 CN 115481234 A 2022.12.16 CN 115481234 A 1.一种基于 Elasticsearc h的专利检索统计引擎, 其特 征在于, 包括: 标准请求参数获取模块, 用于获取标准请求参数; 其中, 所述标准请求参数表征待处理 的专利检索统计需求的属 性信息; 所述专利检索统计需求包括复杂条件检索、 多维数据 统 计分析、 专利去重文档合并和异步专利检索; 所述标准请求参数 的结构是针对检索输入预 先定义的标准的数据结构; Elasticse arch查询语句转换模块, 用于利用标准请求参数与 Elasticsearch查询语句 的逻辑对应关系, 将所述标准请求 参数转换为Elasticsearc h查询语句; 专利检索模块, 用于利用所述Elasticsearch查询语句在Elasticsearch中进行专利检 索, 得到Elasticsearc h检索结果; 标准响应结果获得模块, 用于将所述Elasticsearch检索结果转换为标准响应结果输 出; 其中, 所述标准响应结果的结构是针对检索输出 预先定义的标准的数据结构。 2.根据权利要求1所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述 标准请求 参数的结构, 包括: 索引名indexName、 专利检索表达式searchExpr、 排序属性sortField、 数据偏移 offset、 数据限制li mit、 统计字段列表stati sticsFieldLi st、 去重字段collapseField、 异 步检索编号asyncSearchId和异步检索需求async; 其中, 所述排序属性sortField包括排序 字段名fieldName和排序方向reverseOrder; 异步检索需求async的值表示是否进行异步检 索; 所述标准响应结果的结构, 包括: 专利文档列表docList、 命中数count、 去重命中数countAfterCollapse、 统计数据 statisticsData、 异步检索编号asyncSearc hId和异步检索状态asyncSearc hStatus。 3.根据权利要求2所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述 Elasticsearch查询语句转换模块利用标准请求参数与Elasticsearch查询语句的逻辑对 应关系, 将所述标准请求 参数转换为Elasticsearc h查询语句的过程, 包括: 将所述标准请求参数中searchExpr的值利用预设的专利检索表达式语句转换方法转 换为Elasticsearc h查询语句, 并赋值到Query  DSL中的query属性上; 将所述标准请求参数中sortField的值转换为Elasticsearch查询语句中排序语句的 格式, 并赋值到Query  DSL的sort属性上; 将所述标准请求 参数中of fset的值赋值到Query  DSL中的from属性上; 将所述标准请求 参数中limit的值赋值到Query  DSL中的size属性上; 针对所述标准请求参数 中statisticsFieldList内 的每个统计, 基于Elasticse arch中 的terms分组聚合函数, 将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句 的格式, 构造对应的JSON对象, 并赋值到Query  DSL的aggs属性上; 将所述标准请求参数中collapseField的值转换为Elasticsearch查询 语句中去重查 询语句的格式, 并赋值到Query  DSL的collapse属性上。 4.根据权利要求3所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述 将所述标准请求参数中searchExpr的值利用预设 的专利检索表达式语句转换方法转换为 Elasticsearc h查询语句, 包括: 利用预先构 建的分词器解析searchExpr中专利检索表达式对应的字符串, 得到解析出权 利 要 求 书 1/3 页 2 CN 115481234 A 2的多个分词; 其中, searchExpr中的专利检索表达式、 所述分词器基于预先定义的可扩展的 专利检索表达式语法结构 构建; 基于所述专利检索表达式语法结构, 将所述多个分词处 理为标准语法节点的列表; 根据所述标准语法节点的列表生成标准语法树; 利用预先构建的语法转换器, 将所述标准语法树 转换为Elasticsearc h查询语句。 5.根据权利要求3所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述 针对所述标准请求参数中statisticsFieldList内的每个统计, 基于Elasticsearch中的 terms分组聚合函数, 将该统计对应的值转换为Elasticsearch查询语句中聚合查询语句的 格式, 构造对应的JSON对象, 并赋值到Query  DSL的aggs属性上, 包括: 针对所述标准请求参数中statisticsFieldList内的每个统计, 若该统计为单级维度, 利用Elasticsearch中的terms分组聚合函数将该单级维度统计对应的字段值转换为 Elasticsearch查询语句的格式, 得到该单级维度统计对应的Elasticsearch聚合查询语 句; 其中, stati sticsFieldList内的每一项 为统计字段stati sticsField, 代表一个独立的 统计; 针对所述标准请求参数中statisticsFieldList内的每个统计, 若该统计为多级维度, 将该多级维度统计下不同单级维度利用Elasticsearch中的terms分组聚合函数分别得到 的Elasticsearch聚合查询语句按顺序嵌套, 合并得到该多级维度统计对应的 Elasticsearc h聚合查询语句; 针对每个统计, 以该统计的统计字段为key, 对应的Elasticsearch聚合查询语句为 value, 构造成一个JSON对象, 并赋值到Query  DSL的aggs属性上。 6.根据权利要求5所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 若所 述标准请求参数中含有collapseField的值, 所述针对所述标准请求参数中 statisticsFieldLi st内的每个统计, 基于Elasticsearch中的terms分组聚合函数, 将该统 计对应的值转换为Elasticsearch查询语句中聚合查询语句的格式, 构造对应的JSON对象, 并赋值到Query  DSL的aggs属性上的过程中, 还需要在每个单级维度对应的Elasticsearch 聚合查询语句中加入cardi nality聚合函数实现去重计数。 7.根据权利要求3所述的基于Elasticsearch 的专利检索统计引擎, 其特征在于, 所述 将所述标准请求参数中collapseField的值转换为Elasticsearch查询语句中去重查询语 句的格式, 并赋值到Query  DSL的collap se属性上之后, 所述Elasticsearch查询语句转换 模块还用于: 在转换得到的Elasticsearch去重查询语句中加入cardinality聚合函数, 对符合所述 Elasticsearch去重查询语句对应的检索条件的专利进行去重计数, 以获得去重后的专利 总数。 8.根据权利要求1~7任一项所述的基于Elasticsearch 的专利检索统计引擎, 其特征 在

PDF文档 专利 一种基于Elasticsearch的专利检索统计引擎

文档预览
中文文档 36 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于Elasticsearch的专利检索统计引擎 第 1 页 专利 一种基于Elasticsearch的专利检索统计引擎 第 2 页 专利 一种基于Elasticsearch的专利检索统计引擎 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:45:04上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。