(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210043450.3
(22)申请日 2022.01.14
(71)申请人 中国建设银行股份有限公司
地址 100033 北京市西城区金融大街25号
(72)发明人 杨朴
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
代理人 宋兴 黄健
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/2455(2019.01)
G06F 40/177(2020.01)
G06F 40/30(2020.01)
G06N 3/02(2006.01)
(54)发明名称
运维知识在线问答方法、 装置、 电子设备及
存储介质
(57)摘要
本申请提供一种运维知识在线问答方法、 装
置、 电子设备及存储介质。 涉及计算机技术领域,
该方法包括: 获取用户运维问题; 对用户运维问
题基于人工神经网络ANN模型或者嵌套pattern
进行问题泛化, 并分别在运维知识图谱数据库中
进行模板匹配生成第一运维知识答案, 在ES数据
库中进行搜索生成多个第二运维知识答案; 按照
第一运维知识答案在第二运维知识之前的第一
排序策略, 以及多个第二运维答案的点击调权排
序策略, 推送目标运维知识答案。 本申请的方法,
提升了检索准确率, 并精准触达结果, 实现从传
统知识库到智能知识库的跃升。 并且在建立运维
知识图谱数据库时针对非结构化数据采用无
schema文本抽取 策略, 降低图谱构建成本 。
权利要求书3页 说明书12页 附图5页
CN 114385830 A
2022.04.22
CN 114385830 A
1.一种运维知识在线问答方法, 应用搜索问答系统, 所述搜索问答系统用于针对用户
运维问题向用户推送运维知识答案, 其特 征在于, 包括:
获取用户运维问题;
对所述用户运维问题基于人工神经网络ANN模型或者嵌套pattern进行问题泛化, 并分
别在运维知识图谱数据库中进 行模板匹配生成第一运 维知识答案, 在分布式搜索ES数据库
中进行搜索生成多个第二 运维知识答案;
按照所述第 一运维知识答案在所述第 二运维知识之前的第 一排序策略, 以及多个所述
第二运维答案的点击调权排序策略, 对多个运维知识答案进行排序, 并推送所述多个运维
知识答案中的目标运 维知识答案, 所述多个运维知识答案包括所述第一运维知识答案和所
述第二运 维知识答案, 所述点击调权排序策略用于根据多个所述第二运 维知识答案的点击
量对多个所述第二 运维知识答案进行排序。
2.根据权利要求1所述的方法, 其特 征在于, 在所述获取用户运维问题之前, 还 包括:
获取运维知识数据集 合, 所述运维知识数据集 合包括结构化数据和非结构化数据;
根据运维知识数据的多级主题对所述运维知识数据集合进行场景归类, 并对所述运维
知识数据集 合进行标注;
分别对标注后的所述结构化数据进行知识引入、 属性映射、 数据清洗和数据融合, 对标
注后的所述 非结构化数据进行知识抽取、 属性映射、 数据清洗和数据融合, 生成所述运 维知
识图谱数据库。
3.根据权利 要求2所述的方法, 其特征在于, 所述非结构化数据包括Excel数据表, 所述
对标注后的所述非结构化数据进行知识抽取, 包括:
按照所述Excel数据表的行头或列头的顺序遍历所述Excel数据表;
确定所述Excel数据表各 行之间或各列之间的内容重复度;
按照所述内容重复度, 确定所述Excel数据表的主谓宾S PO三元组, 以进行知识抽取。
4.根据权利要求3所述的方法, 其特征在于, 所述运维知识图谱数据库包括运维知识图
谱实体库和运维知识图谱属性库, 所述方法还 包括:
对所述运维知识图谱实体库和所述运维知识图谱属性库进行别名配置, 确定所述运维
知识图谱数据库的同义词表。
5.根据权利要求1 ‑4任一项所述的方法, 其特 征在于, 所述 点击调权排序策略, 包括:
确定在所述用户运维问题下, 不同用户对多个所述第二 运维知识答案的点击量;
利用各所述第二 运维知识答案的点击量确定各 所述第二 运维知识答案的权 重;
按照各所述第二 运维知识答案的权 重大小, 对多个所述第二 运维知识答案进行排序。
6.根据权利要求5所述的方法, 其特 征在于, 还 包括:
若多个所述第 二运维知识答案 中存在新的运维知识答案, 则将所述新的运维知识答案
的权重设置为预设值, 所述 新的运维知识答案加入所述ES数据库的时间小于预设时间。
7.根据权利要求5所述的方法, 其特 征在于, 还 包括:
对所述用户运维问题进行统计分析;
将超过第一预设数量的所述用户运维问题标记为热点知识, 并将所述热点知识存储在
所述运维知识图谱数据库的热门运维知识库中。
8.一种运维知识在线问答装置, 其特 征在于, 包括:权 利 要 求 书 1/3 页
2
CN 114385830 A
2获取模块, 用于获取用户运维问题;
生成模块, 用于对所述用户运维 问题基于人工神经网络ANN模型或者嵌套pattern进行
问题泛化, 并分别在运维知识图谱数据库中进行模板匹配生成第一运维知识答案, 在分布
式搜索ES数据库中进行搜索生成多个第二 运维知识答案;
推送模块, 用于按照所述第一运维知识答案在所述第二运维知识之前的第一排序策
略, 以及多个所述第二运 维答案的点击调权排序策略, 对多个运 维知识答案进行排序, 并推
送所述多个运维知识 答案中的目标运 维知识答案, 所述多个运维知识答案包括所述第一运
维知识答案和所述第二运 维知识答案, 所述点击调权排序策略用于根据多个所述第二运 维
知识答案的点击量对多个所述第二 运维知识答案进行排序。
9.根据权利要求8所述的装置, 其特 征在于, 还 包括第一处 理模块,
获取模块, 还用于获取运维知识数据集合, 所述运维知识数据集合包括结构化数据和
非结构化数据;
所述第一处理模块, 用于根据运维知识数据的多级主题对所述运维知识数据集合进行
场景归类, 并对所述 运维知识数据集 合进行标注;
所述第一处理模块, 还用于分别对标注后的所述结构化数据进行知识引入、 属性映射、
数据清洗和数据融合, 对标注后的所述非结构化数据进 行知识抽取、 属性映射、 数据 清洗和
数据融合, 生成所述 运维知识图谱数据库。
10.根据权利要求9所述的装置, 其特征在于, 所述非结构化数据包括Excel数据表, 所
述第一处 理模块具体用于:
按照所述Excel数据表的行头或列头的顺序遍历所述Excel数据表;
确定所述Excel数据表各 行之间或各列之间的内容重复度;
按照所述内容重复度, 确定所述Excel数据表的主谓宾S PO三元组, 以进行知识抽取。
11.根据权利要求10所述的装置, 其特征在于, 所述运维知识图谱数据库包括运维知识
图谱实体库和运维知识图谱属性库, 所述第一处 理模块, 还用于:
对所述运维知识图谱实体库和所述运维知识图谱属性库进行别名配置, 确定所述运维
知识图谱数据库的同义词表。
12.根据权利要求8 ‑11任一项所述的装置, 其特 征在于, 推送模块, 还用于:
确定在所述用户运维问题下, 不同用户对多个所述第二 运维知识答案的点击量;
利用各所述第二 运维知识答案的点击量确定各 所述第二 运维知识答案的权 重;
按照各所述第二 运维知识答案的权 重大小, 对多个所述第二 运维知识答案进行排序。
13.根据权利要求12所述的装置, 其特 征在于, 所述推送模块还用于:
若多个所述第 二运维知识答案 中存在新的运维知识答案, 则将所述新的运维知识答案
的权重设置为预设值, 所述 新的运维知识答案加入所述ES数据库的时间小于预设时间。
14.根据权利要求12所述的装置, 其特 征在于, 还 包括:
第二处理模块, 用于对所述用户运维问题进行统计分析; 将超过第一预设数量的所述
用户运维问题标记为热点知识, 并将所述热点知识存储在所述运 维知识图谱数据库的热门
运维知识库中。
15.一种电子设备, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器;
所述存储器存储计算机执 行指令;权 利 要 求 书 2/3 页
3
CN 114385830 A
3
专利 运维知识在线问答方法、装置、电子设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:54上传分享