(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211165513.9
(22)申请日 2022.09.23
(71)申请人 中国电子科技 集团公司第十 研究所
地址 610000 四川省成 都市金牛区茶店子
东街48号
(72)发明人 李春豹 崔莹 代翔 戴礼灿
刘鑫 雋兆波 杨露
(74)专利代理 机构 成都九鼎天元知识产权代理
有限公司 51214
专利代理师 周浩杰
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06F 16/332(2019.01)
G06F 40/194(2020.01)G06F 40/253(2020.01)
(54)发明名称
一种面向多类型知识库的多引擎智能问答
系统
(57)摘要
本发明公开了一种面向多类型知识库的多
引擎智能问答系统, 属于多引擎智能问答系统构
建领域, 包括: 复杂问题理解模块、 人机多轮交互
模块、 智能问答引擎模块、 多源答案融合模块。 本
发明解决现有问答系统中存在的用户问题理解
不透彻、 数据知识来源类型单一、 多源答案融合
困难、 多轮交互问答能力匮乏、 答案信息验证难
等问题, 以实现更便捷、 更可信的全面、 高效、 精
准的信息获取。
权利要求书3页 说明书11页 附图6页
CN 115238101 A
2022.10.25
CN 115238101 A
1.一种面向多类型知识库的多引 擎智能问答系统, 其特征在于, 包括复杂问题理解模
块、 人机多轮交 互模块、 智能问答引擎模块、 多源答案融合模块;
所述复杂问题理解模块, 对输入问题的真实意图进行识别与分类, 纠正、 补全输入问
题, 输出修 正后问题、 问题意图识别分类结果、 问题核心信息;
所述人机多轮交互模块, 针对复杂问题理解模块输出的修正后问题, 结合修正后问题
所属主题、 对应主题规则模板和基于深度强化学习的人机对话管理策略, 完成用户与问答
系统的多轮对话, 结合多问答引擎完成答案查找;
所述智能问答引擎模块, 针对问答对库、 文档库、 知识图谱和数据库表分别设计对应的
问答引擎, 并利用业务问答知识库数据、 修正后问题、 问题 意图分类结果和问题核心信息作
为输入, 输出为用户问题对应的一个或多个候选答案、 答案 置信度及其 答案来源;
所述多源答案 融合模块, 针对问答引擎输出的候选答案、 答案置信度及答案来源集合,
利用候选答案可信度评估 模型分配各答案 权重, 完成最终答案及其 来源的获取。
2.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 包括
答案获取 过程可视化模块和答案 评价反馈与训练优化模块;
所述答案获取过程可视化模块, 将用户可理解的中间结果以可视化形式展现给用户,
同时将答案对应文档、 知识图谱或数据库表中的记录展示出来供用户对给定答案进行验证
与确认;
所述答案评价反馈与训练优化模块, 供用户对给定答案进行评价打分与错误答案纠正
反馈, 并将用户反馈的结果直接存入问答对库中, 同时将用户反馈的历史问题、 答案及其来
源组织为训练语料, 对问答模型进行定时或定量训练优化。
3.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述
复杂问题理解模块包括子模块: 语种识别模块、 语音识别模块、 纠错模块、 指代消解模块、 核
心信息抽取模块、 推荐模块和分类模块;
所述语种识别模块, 针对用户语音输入的问题进行语种识别;
所述语音识别模块, 对特定语种的语音问题转写为中文自然语言描述, 将语音转写得
到自然语言描述文本问题;
所述纠错模块, 对输入或语音转写得到的文本进行字词纠错、 事实性纠错与语法纠错;
所述指代消解模块, 在用户输入问题中出现的代词、 语气助词以及省略的实体进行指
代消解, 将指代消解后的问题作为复杂问题理解 转写的问题输出;
所述核心信 息抽取模块, 对问题中的实体信 息、 实体间关系、 关键词和短语进行识别与
抽取作为用户问题核心信息;
所述推荐模块, 计算用户输入问题与历史问题集或典型问题库的相似度, 结合提问频
次进行相似问题和热点问题推荐;
所述分类模块, 针对不同任务的输入问题, 将用户问题意图进行分类, 分类的类别包括
事实描述类、 属性查询类、 数据计算类和统计分析类, 问题 意图识别分类的结果用于指导智
能问答引擎实现选择问答策略。
4.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述
结合修正后问题所属主题、 对应主题规则模板和基于深度强化学习的人机对话管理策略,
具体包括: 对修正后问题进行主题判定, 若 上下文问题不属于同一主题完成主题切换, 即记权 利 要 求 书 1/3 页
2
CN 115238101 A
2录当前问题为新问题, 否则判断当前问题是否需要进行对话完善 问题: 若需要通过人机对
话完善问题, 则结合预设槽位信息进 行缺失要素分析, 并生成自然语言问句发送给用户, 待
用户回应后, 判断必要槽位填充是否已经完成, 若未完成则重复所述结合预设槽位信息进
行缺失要素分析, 并生成自然语言问句发送给用户的步骤; 若填槽完成, 则输出补 全后新问
题。
5.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 在所
述智能问答引擎模块中,
问答对库问答引擎, 利用基于ES检索的粗排序和基于用户问题核心信息的精排序, 并
与问答对库中问题计算相似度, 并将相似度最高的问题对应答案返回给用户;
和/或,
面向文档库的问答引擎, 针对自由文档设计为二阶段网络模型, 第一阶段基于BM25检
索、 最长公共子串和问题核心信息完成相关文档筛选, 第二阶段将用户问题和筛选得到的
相关文档同时输入到预训练模型、 注意力网络和指针网络构建的模型中, 估计出答案的开
始位置和结束位置作为问题的答案;
和/或,
知识图谱问答引擎, 利用面向用户问题的实体识别与关系抽取结果, 再利用Bert ‑
BiLSTM、 CRF模型和序列生成模型查询图谱获取答案;
数据库表问答引擎, 利用seq2seq自然语言文本转SQL, 并结合规则模板生成SQL查询语
句, 完成用户问题对应答案的精确获取。
6.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述
候选答案可信度评估模型, 采用多线程方式同时请求不同意图问题对应问答引擎, 最先返
回满足所述对应问答引擎设定的答案阈值的答案即为最 终候选答案; 或等待 所有引擎均获
得答案及其可信度后, 提取问题和 答案中的核心实体, 将其分隔连接后一同输入预训练模
型提取特征后输入MLP网络和归一 化层给出各候选答案的置信度得分得到最终候选答案;
此外, 还能够将修正后 新问题和最终候选答案一起输入序列到序列模型中完成自然语
言描述的答案生成: 其中, 编码器完成输入文本的嵌入编码并计算状态值作为解码器模块
的初始状态; 拼接编 码器输出和隐层状态结合Luong注 意力机制计算; 解码 器则结合编码 器
输入状态、 上下文向量和解码器历史输入预测当前输出词典的概率分布, 损失函数则采用
逻辑斯蒂与标签间的稀疏归一 化交叉熵损失。
7.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述
智能问答引擎模块, 包括阅读理解问答引擎; 在阅读理解问答引擎中: 首先面向Elastic
Search库, 针对修正后新问题完成基于IK分词 ‑BM25算法的检索, 获取排序的前k个文档数
据, k为整数; 然后, 结合问题 ‑篇章最长公共子串和核心信息中专有实体进行再筛选, 得到
排序的前n个文档数据, n为整 数; 然后, 将排序的前n个文档按照512长度进 行分段并与问题
连接输入Bert中文预训练模型中完成对段落的筛选; 然后, 将问题与筛选后的段落连接后
输入Bert中文预训练模型和Attention网络, 提取问题 ‑段落的联合特征表示; 最后, 输入
Pointer网络层估计各 段落中答案的开始位置及跨度。
8.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 包括
面向业务问答知识库, 将修正后问题输入智能问答引擎, 结合问题意图识别分类结果, 选择权 利 要 求 书 2/3 页
3
CN 115238101 A
3
专利 一种面向多类型知识库的多引擎智能问答系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:41:28上传分享