(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211165513.9 (22)申请日 2022.09.23 (71)申请人 中国电子科技 集团公司第十 研究所 地址 610000 四川省成 都市金牛区茶店子 东街48号 (72)发明人 李春豹 崔莹 代翔 戴礼灿  刘鑫 雋兆波 杨露  (74)专利代理 机构 成都九鼎天元知识产权代理 有限公司 51214 专利代理师 周浩杰 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 40/194(2020.01)G06F 40/253(2020.01) (54)发明名称 一种面向多类型知识库的多引擎智能问答 系统 (57)摘要 本发明公开了一种面向多类型知识库的多 引擎智能问答系统, 属于多引擎智能问答系统构 建领域, 包括: 复杂问题理解模块、 人机多轮交互 模块、 智能问答引擎模块、 多源答案融合模块。 本 发明解决现有问答系统中存在的用户问题理解 不透彻、 数据知识来源类型单一、 多源答案融合 困难、 多轮交互问答能力匮乏、 答案信息验证难 等问题, 以实现更便捷、 更可信的全面、 高效、 精 准的信息获取。 权利要求书3页 说明书11页 附图6页 CN 115238101 A 2022.10.25 CN 115238101 A 1.一种面向多类型知识库的多引 擎智能问答系统, 其特征在于, 包括复杂问题理解模 块、 人机多轮交 互模块、 智能问答引擎模块、 多源答案融合模块; 所述复杂问题理解模块, 对输入问题的真实意图进行识别与分类, 纠正、 补全输入问 题, 输出修 正后问题、 问题意图识别分类结果、 问题核心信息; 所述人机多轮交互模块, 针对复杂问题理解模块输出的修正后问题, 结合修正后问题 所属主题、 对应主题规则模板和基于深度强化学习的人机对话管理策略, 完成用户与问答 系统的多轮对话, 结合多问答引擎完成答案查找; 所述智能问答引擎模块, 针对问答对库、 文档库、 知识图谱和数据库表分别设计对应的 问答引擎, 并利用业务问答知识库数据、 修正后问题、 问题 意图分类结果和问题核心信息作 为输入, 输出为用户问题对应的一个或多个候选答案、 答案 置信度及其 答案来源; 所述多源答案 融合模块, 针对问答引擎输出的候选答案、 答案置信度及答案来源集合, 利用候选答案可信度评估 模型分配各答案 权重, 完成最终答案及其 来源的获取。 2.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 包括 答案获取 过程可视化模块和答案 评价反馈与训练优化模块; 所述答案获取过程可视化模块, 将用户可理解的中间结果以可视化形式展现给用户, 同时将答案对应文档、 知识图谱或数据库表中的记录展示出来供用户对给定答案进行验证 与确认; 所述答案评价反馈与训练优化模块, 供用户对给定答案进行评价打分与错误答案纠正 反馈, 并将用户反馈的结果直接存入问答对库中, 同时将用户反馈的历史问题、 答案及其来 源组织为训练语料, 对问答模型进行定时或定量训练优化。 3.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述 复杂问题理解模块包括子模块: 语种识别模块、 语音识别模块、 纠错模块、 指代消解模块、 核 心信息抽取模块、 推荐模块和分类模块; 所述语种识别模块, 针对用户语音输入的问题进行语种识别; 所述语音识别模块, 对特定语种的语音问题转写为中文自然语言描述, 将语音转写得 到自然语言描述文本问题; 所述纠错模块, 对输入或语音转写得到的文本进行字词纠错、 事实性纠错与语法纠错; 所述指代消解模块, 在用户输入问题中出现的代词、 语气助词以及省略的实体进行指 代消解, 将指代消解后的问题作为复杂问题理解 转写的问题输出; 所述核心信 息抽取模块, 对问题中的实体信 息、 实体间关系、 关键词和短语进行识别与 抽取作为用户问题核心信息; 所述推荐模块, 计算用户输入问题与历史问题集或典型问题库的相似度, 结合提问频 次进行相似问题和热点问题推荐; 所述分类模块, 针对不同任务的输入问题, 将用户问题意图进行分类, 分类的类别包括 事实描述类、 属性查询类、 数据计算类和统计分析类, 问题 意图识别分类的结果用于指导智 能问答引擎实现选择问答策略。 4.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述 结合修正后问题所属主题、 对应主题规则模板和基于深度强化学习的人机对话管理策略, 具体包括: 对修正后问题进行主题判定, 若 上下文问题不属于同一主题完成主题切换, 即记权 利 要 求 书 1/3 页 2 CN 115238101 A 2录当前问题为新问题, 否则判断当前问题是否需要进行对话完善 问题: 若需要通过人机对 话完善问题, 则结合预设槽位信息进 行缺失要素分析, 并生成自然语言问句发送给用户, 待 用户回应后, 判断必要槽位填充是否已经完成, 若未完成则重复所述结合预设槽位信息进 行缺失要素分析, 并生成自然语言问句发送给用户的步骤; 若填槽完成, 则输出补 全后新问 题。 5.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 在所 述智能问答引擎模块中, 问答对库问答引擎, 利用基于ES检索的粗排序和基于用户问题核心信息的精排序, 并 与问答对库中问题计算相似度, 并将相似度最高的问题对应答案返回给用户; 和/或, 面向文档库的问答引擎, 针对自由文档设计为二阶段网络模型, 第一阶段基于BM25检 索、 最长公共子串和问题核心信息完成相关文档筛选, 第二阶段将用户问题和筛选得到的 相关文档同时输入到预训练模型、 注意力网络和指针网络构建的模型中, 估计出答案的开 始位置和结束位置作为问题的答案; 和/或, 知识图谱问答引擎, 利用面向用户问题的实体识别与关系抽取结果, 再利用Bert ‑ BiLSTM、 CRF模型和序列生成模型查询图谱获取答案; 数据库表问答引擎, 利用seq2seq自然语言文本转SQL, 并结合规则模板生成SQL查询语 句, 完成用户问题对应答案的精确获取。 6.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述 候选答案可信度评估模型, 采用多线程方式同时请求不同意图问题对应问答引擎, 最先返 回满足所述对应问答引擎设定的答案阈值的答案即为最 终候选答案; 或等待 所有引擎均获 得答案及其可信度后, 提取问题和 答案中的核心实体, 将其分隔连接后一同输入预训练模 型提取特征后输入MLP网络和归一 化层给出各候选答案的置信度得分得到最终候选答案; 此外, 还能够将修正后 新问题和最终候选答案一起输入序列到序列模型中完成自然语 言描述的答案生成: 其中, 编码器完成输入文本的嵌入编码并计算状态值作为解码器模块 的初始状态; 拼接编 码器输出和隐层状态结合Luong注 意力机制计算; 解码 器则结合编码 器 输入状态、 上下文向量和解码器历史输入预测当前输出词典的概率分布, 损失函数则采用 逻辑斯蒂与标签间的稀疏归一 化交叉熵损失。 7.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 所述 智能问答引擎模块, 包括阅读理解问答引擎; 在阅读理解问答引擎中: 首先面向Elastic   Search库, 针对修正后新问题完成基于IK分词 ‑BM25算法的检索, 获取排序的前k个文档数 据, k为整数; 然后, 结合问题 ‑篇章最长公共子串和核心信息中专有实体进行再筛选, 得到 排序的前n个文档数据, n为整 数; 然后, 将排序的前n个文档按照512长度进 行分段并与问题 连接输入Bert中文预训练模型中完成对段落的筛选; 然后, 将问题与筛选后的段落连接后 输入Bert中文预训练模型和Attention网络, 提取问题 ‑段落的联合特征表示; 最后, 输入 Pointer网络层估计各 段落中答案的开始位置及跨度。 8.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统, 其特征在于, 包括 面向业务问答知识库, 将修正后问题输入智能问答引擎, 结合问题意图识别分类结果, 选择权 利 要 求 书 2/3 页 3 CN 115238101 A 3

.PDF文档 专利 一种面向多类型知识库的多引擎智能问答系统

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种面向多类型知识库的多引擎智能问答系统 第 1 页 专利 一种面向多类型知识库的多引擎智能问答系统 第 2 页 专利 一种面向多类型知识库的多引擎智能问答系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:28上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。