standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211245565.7 (22)申请日 2022.10.12 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 张浩 陈明浩 张舒沁  (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 梁瑜 黄健 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 问答语句检索方法、 装置、 电子设备及存储 介质 (57)摘要 本申请提供一种问答语句检索方法、 装置、 电子设备及存储介质, 通过获取第一提问语句, 第一提问语句为基于自然语言的字符串; 将第一 提问语句输入语句处理模型, 得到预设语料库内 的各待选语句的匹配值, 匹配值表征待选语句作 为第一提问语句的回答语句的合理程度, 其中, 语句处理模型用于根据第一提问语句在至少两 个评估维度下的特征信息, 生 成各待选语句对应 的匹配值; 基于各待选语句的匹配值, 得到目标 回答语句。 由于语句处理模型能够解析第一提问 语句在多个评估维度下的特征信息, 并基于各评 估维度下的特征信息对语料库中的待选语句作 为回答语句的合理程度进行评估, 使得到的匹配 值能够兼顾多个评估维度下的特征, 提高匹配准 确性和命中率。 权利要求书2页 说明书13页 附图5页 CN 115510194 A 2022.12.23 CN 115510194 A 1.一种问答语句检索方法, 其特 征在于, 所述方法包括: 获取第一 提问语句, 所述第一 提问语句为基于自然语言的字符串; 将所述第一提问语句输入语句处理模型, 得到预设语料库内的各待选语句的匹配值, 所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程度, 其中, 所述 语句处理模型用于根据所述第一提问语句在至少两个评估维度下的特征信息, 生成各待选 语句对应的匹配值; 基于各所述待选语句的匹配值, 得到目标回答语句。 2.根据权利要求1所述的方法, 其特征在于, 所述语句处理模型包括多任务层和输出 层, 所述将所述第一提问语句输入语句处理模型, 得到预设语料库内的各待选语句的匹配 值, 包括: 通过所述多任务层, 获取 所述第一 提问语句在目标评估维度上的第一特 征信息; 通过所述输出层, 处理所述第 一特征信 息和各所述待选语句在所述目标评估维度 下的 第二特征信息, 得到各 所述第二特 征信息对应的匹配值。 3.根据权利要求2所述的方法, 其特征在于, 所述目标评估维度包括语句相似性维度和 语义相关性维度; 通过所述输出层, 处理所述第一特征信息和各所述待选语句在所述 目标 评估维度下的第二特 征信息, 得到各 所述第二特 征信息对应的匹配值, 包括: 通过所述输出层, 计算所述第 一特征信 息与所述第 二特征信 息的语句相似度, 和/或语 义相关度, 得到各 所述第二特 征信息对应的匹配值。 4.根据权利要求2所述的方法, 其特征在于, 所述语句处理模型还包括共享层, 所述方 法还包括: 通过所述共享层, 对所述第一提问语句进行编码, 得到第一提问语句中的各字词单元 对应的嵌入向量, 所述嵌入向量表征 所述字词单 元在所述第一 提问语句中的上 下文信息 。 5.根据权利要求4所述的方法, 其特征在于, 所述共享层包括第一共享层和第二共享 层, 所述第一共享层用于提取 所述第一 提问语句中的各字词单 元对应的词向量; 所述第二共享层用于基于Transformer编码器, 将所述词向量 转换为所述嵌入向量。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取至少两个目标任务对应的样本数据, 所述目标任务用于确定对应评估维度 下的回 答语句; 基于所述样本数据对预设的多任务模型进行训练, 得到所述语句处 理模型。 7.根据权利要求6所述的方法, 其特征在于, 基于所述样本数据对预设的多任务模型进 行训练, 得到所述语句处 理模型, 包括: 基于所述样本数据, 分别对预设的至少两个多任务模型进行训练, 生成对应的第一多 任务模型; 基于各所述第一多任务模型集 合, 进行知识蒸馏, 得到所述语句处 理模型。 8.一种问答语句检索装置, 其特 征在于, 包括: 接收模块, 用于获取第一 提问语句, 所述第一 提问语句为基于自然语言的字符串; 处理模块, 用于将所述第一提问语句输入语句处理模型, 得到预设语料库内的各待选 语句的匹配值, 所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程 度, 其中, 所述语句处理模型用于根据所述第一提问语句在至少 两个评估维度下 的特征信权 利 要 求 书 1/2 页 2 CN 115510194 A 2息, 生成各待选语句对应的匹配值; 输出模块, 用于基于各 所述待选语句的匹配值, 得到目标回答语句。 9.一种电子设备, 其特 征在于, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 以实现如权利要求1至7中任一项 所述的问答语句检索方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 执行指令, 所述计算机执行指 令被处理器执行时用于实现如权利要求 1至7中任一项 所述的 问答语句检索方法。权 利 要 求 书 2/2 页 3 CN 115510194 A 3

PDF文档 专利 问答语句检索方法、装置、电子设备及存储介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 问答语句检索方法、装置、电子设备及存储介质 第 1 页 专利 问答语句检索方法、装置、电子设备及存储介质 第 2 页 专利 问答语句检索方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:45:05上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。