专利一种面向多类型知识库的多引擎智能问答系统 -在线下载 -AI解读-standardshub.tech

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211165513.9 (22)申请日 2022.09.23 (71)申请人中国电子科技集团公司第十研究所地址 610000 四川省成都市金牛区茶店子东街48号 (72)发明人李春豹　崔莹　代翔　戴礼灿　刘鑫　雋兆波　杨露　 (74)专利代理机构成都九鼎天元知识产权代理有限公司 51214 专利代理师周浩杰 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/332(2019.01) G06F 40/194(2020.01)G06F 40/253(2020.01) (54)发明名称一种面向多类型知识库的多引擎智能问答系统 (57)摘要本发明公开了一种面向多类型知识库的多引擎智能问答系统，属于多引擎智能问答系统构建领域，包括：复杂问题理解模块、人机多轮交互模块、智能问答引擎模块、多源答案融合模块。本发明解决现有问答系统中存在的用户问题理解不透彻、数据知识来源类型单一、多源答案融合困难、多轮交互问答能力匮乏、答案信息验证难等问题，以实现更便捷、更可信的全面、高效、精准的信息获取。权利要求书3页说明书11页附图6页 CN 115238101 A 2022.10.25 CN 115238101 A 1.一种面向多类型知识库的多引擎智能问答系统，其特征在于，包括复杂问题理解模块、人机多轮交互模块、智能问答引擎模块、多源答案融合模块；所述复杂问题理解模块，对输入问题的真实意图进行识别与分类，纠正、补全输入问题，输出修正后问题、问题意图识别分类结果、问题核心信息；所述人机多轮交互模块，针对复杂问题理解模块输出的修正后问题，结合修正后问题所属主题、对应主题规则模板和基于深度强化学习的人机对话管理策略，完成用户与问答系统的多轮对话，结合多问答引擎完成答案查找；所述智能问答引擎模块，针对问答对库、文档库、知识图谱和数据库表分别设计对应的问答引擎，并利用业务问答知识库数据、修正后问题、问题意图分类结果和问题核心信息作为输入，输出为用户问题对应的一个或多个候选答案、答案置信度及其答案来源；所述多源答案融合模块，针对问答引擎输出的候选答案、答案置信度及答案来源集合，利用候选答案可信度评估模型分配各答案权重，完成最终答案及其来源的获取。 2.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，包括答案获取过程可视化模块和答案评价反馈与训练优化模块；所述答案获取过程可视化模块，将用户可理解的中间结果以可视化形式展现给用户，同时将答案对应文档、知识图谱或数据库表中的记录展示出来供用户对给定答案进行验证与确认；所述答案评价反馈与训练优化模块，供用户对给定答案进行评价打分与错误答案纠正反馈，并将用户反馈的结果直接存入问答对库中，同时将用户反馈的历史问题、答案及其来源组织为训练语料，对问答模型进行定时或定量训练优化。 3.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，所述复杂问题理解模块包括子模块：语种识别模块、语音识别模块、纠错模块、指代消解模块、核心信息抽取模块、推荐模块和分类模块；所述语种识别模块，针对用户语音输入的问题进行语种识别；所述语音识别模块，对特定语种的语音问题转写为中文自然语言描述，将语音转写得到自然语言描述文本问题；所述纠错模块，对输入或语音转写得到的文本进行字词纠错、事实性纠错与语法纠错；所述指代消解模块，在用户输入问题中出现的代词、语气助词以及省略的实体进行指代消解，将指代消解后的问题作为复杂问题理解转写的问题输出；所述核心信息抽取模块，对问题中的实体信息、实体间关系、关键词和短语进行识别与抽取作为用户问题核心信息；所述推荐模块，计算用户输入问题与历史问题集或典型问题库的相似度，结合提问频次进行相似问题和热点问题推荐；所述分类模块，针对不同任务的输入问题，将用户问题意图进行分类，分类的类别包括事实描述类、属性查询类、数据计算类和统计分析类，问题意图识别分类的结果用于指导智能问答引擎实现选择问答策略。 4.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，所述结合修正后问题所属主题、对应主题规则模板和基于深度强化学习的人机对话管理策略，具体包括：对修正后问题进行主题判定，若上下文问题不属于同一主题完成主题切换，即记权　利　要　求　书 1/3 页 2 CN 115238101 A 2录当前问题为新问题，否则判断当前问题是否需要进行对话完善问题：若需要通过人机对话完善问题，则结合预设槽位信息进行缺失要素分析，并生成自然语言问句发送给用户，待用户回应后，判断必要槽位填充是否已经完成，若未完成则重复所述结合预设槽位信息进行缺失要素分析，并生成自然语言问句发送给用户的步骤；若填槽完成，则输出补全后新问题。 5.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，在所述智能问答引擎模块中，问答对库问答引擎，利用基于ES检索的粗排序和基于用户问题核心信息的精排序，并与问答对库中问题计算相似度，并将相似度最高的问题对应答案返回给用户；和/或，面向文档库的问答引擎，针对自由文档设计为二阶段网络模型，第一阶段基于BM25检索、最长公共子串和问题核心信息完成相关文档筛选，第二阶段将用户问题和筛选得到的相关文档同时输入到预训练模型、注意力网络和指针网络构建的模型中，估计出答案的开始位置和结束位置作为问题的答案；和/或，知识图谱问答引擎，利用面向用户问题的实体识别与关系抽取结果，再利用Bert ‑ BiLSTM、 CRF模型和序列生成模型查询图谱获取答案；数据库表问答引擎，利用seq2seq自然语言文本转SQL，并结合规则模板生成SQL查询语句，完成用户问题对应答案的精确获取。 6.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，所述候选答案可信度评估模型，采用多线程方式同时请求不同意图问题对应问答引擎，最先返回满足所述对应问答引擎设定的答案阈值的答案即为最终候选答案；或等待所有引擎均获得答案及其可信度后，提取问题和答案中的核心实体，将其分隔连接后一同输入预训练模型提取特征后输入MLP网络和归一化层给出各候选答案的置信度得分得到最终候选答案；此外，还能够将修正后新问题和最终候选答案一起输入序列到序列模型中完成自然语言描述的答案生成：其中，编码器完成输入文本的嵌入编码并计算状态值作为解码器模块的初始状态；拼接编码器输出和隐层状态结合Luong注意力机制计算；解码器则结合编码器输入状态、上下文向量和解码器历史输入预测当前输出词典的概率分布，损失函数则采用逻辑斯蒂与标签间的稀疏归一化交叉熵损失。 7.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，所述智能问答引擎模块，包括阅读理解问答引擎；在阅读理解问答引擎中：首先面向Elastic Search库，针对修正后新问题完成基于IK分词 ‑BM25算法的检索，获取排序的前k个文档数据， k为整数；然后，结合问题 ‑篇章最长公共子串和核心信息中专有实体进行再筛选，得到排序的前n个文档数据， n为整数；然后，将排序的前n个文档按照512长度进行分段并与问题连接输入Bert中文预训练模型中完成对段落的筛选；然后，将问题与筛选后的段落连接后输入Bert中文预训练模型和Attention网络，提取问题 ‑段落的联合特征表示；最后，输入 Pointer网络层估计各段落中答案的开始位置及跨度。 8.根据权利要求1所述的面向多类型知识库的多引擎智能问答系统，其特征在于，包括面向业务问答知识库，将修正后问题输入智能问答引擎，结合问题意图识别分类结果，选择权　利　要　求　书 2/3 页 3 CN 115238101 A 3

专利 一种面向多类型知识库的多引擎智能问答系统

专利一种面向多类型知识库的多引擎智能问答系统