standard download
文库搜索
切换导航
首页
频道
仅15元无限下载
联系我们
问题反馈
首页
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211245565.7 (22)申请日 2022.10.12 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 张浩 陈明浩 张舒沁 (74)专利代理 机构 北京同立钧成知识产权代理 有限公司 1 1205 专利代理师 梁瑜 黄健 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/332(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 问答语句检索方法、 装置、 电子设备及存储 介质 (57)摘要 本申请提供一种问答语句检索方法、 装置、 电子设备及存储介质, 通过获取第一提问语句, 第一提问语句为基于自然语言的字符串; 将第一 提问语句输入语句处理模型, 得到预设语料库内 的各待选语句的匹配值, 匹配值表征待选语句作 为第一提问语句的回答语句的合理程度, 其中, 语句处理模型用于根据第一提问语句在至少两 个评估维度下的特征信息, 生 成各待选语句对应 的匹配值; 基于各待选语句的匹配值, 得到目标 回答语句。 由于语句处理模型能够解析第一提问 语句在多个评估维度下的特征信息, 并基于各评 估维度下的特征信息对语料库中的待选语句作 为回答语句的合理程度进行评估, 使得到的匹配 值能够兼顾多个评估维度下的特征, 提高匹配准 确性和命中率。 权利要求书2页 说明书13页 附图5页 CN 115510194 A 2022.12.23 CN 115510194 A 1.一种问答语句检索方法, 其特 征在于, 所述方法包括: 获取第一 提问语句, 所述第一 提问语句为基于自然语言的字符串; 将所述第一提问语句输入语句处理模型, 得到预设语料库内的各待选语句的匹配值, 所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程度, 其中, 所述 语句处理模型用于根据所述第一提问语句在至少两个评估维度下的特征信息, 生成各待选 语句对应的匹配值; 基于各所述待选语句的匹配值, 得到目标回答语句。 2.根据权利要求1所述的方法, 其特征在于, 所述语句处理模型包括多任务层和输出 层, 所述将所述第一提问语句输入语句处理模型, 得到预设语料库内的各待选语句的匹配 值, 包括: 通过所述多任务层, 获取 所述第一 提问语句在目标评估维度上的第一特 征信息; 通过所述输出层, 处理所述第 一特征信 息和各所述待选语句在所述目标评估维度 下的 第二特征信息, 得到各 所述第二特 征信息对应的匹配值。 3.根据权利要求2所述的方法, 其特征在于, 所述目标评估维度包括语句相似性维度和 语义相关性维度; 通过所述输出层, 处理所述第一特征信息和各所述待选语句在所述 目标 评估维度下的第二特 征信息, 得到各 所述第二特 征信息对应的匹配值, 包括: 通过所述输出层, 计算所述第 一特征信 息与所述第 二特征信 息的语句相似度, 和/或语 义相关度, 得到各 所述第二特 征信息对应的匹配值。 4.根据权利要求2所述的方法, 其特征在于, 所述语句处理模型还包括共享层, 所述方 法还包括: 通过所述共享层, 对所述第一提问语句进行编码, 得到第一提问语句中的各字词单元 对应的嵌入向量, 所述嵌入向量表征 所述字词单 元在所述第一 提问语句中的上 下文信息 。 5.根据权利要求4所述的方法, 其特征在于, 所述共享层包括第一共享层和第二共享 层, 所述第一共享层用于提取 所述第一 提问语句中的各字词单 元对应的词向量; 所述第二共享层用于基于Transformer编码器, 将所述词向量 转换为所述嵌入向量。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取至少两个目标任务对应的样本数据, 所述目标任务用于确定对应评估维度 下的回 答语句; 基于所述样本数据对预设的多任务模型进行训练, 得到所述语句处 理模型。 7.根据权利要求6所述的方法, 其特征在于, 基于所述样本数据对预设的多任务模型进 行训练, 得到所述语句处 理模型, 包括: 基于所述样本数据, 分别对预设的至少两个多任务模型进行训练, 生成对应的第一多 任务模型; 基于各所述第一多任务模型集 合, 进行知识蒸馏, 得到所述语句处 理模型。 8.一种问答语句检索装置, 其特 征在于, 包括: 接收模块, 用于获取第一 提问语句, 所述第一 提问语句为基于自然语言的字符串; 处理模块, 用于将所述第一提问语句输入语句处理模型, 得到预设语料库内的各待选 语句的匹配值, 所述匹配值表征所述待选语句作为所述第一提问语句的回答语句的合理程 度, 其中, 所述语句处理模型用于根据所述第一提问语句在至少 两个评估维度下 的特征信权 利 要 求 书 1/2 页 2 CN 115510194 A 2息, 生成各待选语句对应的匹配值; 输出模块, 用于基于各 所述待选语句的匹配值, 得到目标回答语句。 9.一种电子设备, 其特 征在于, 包括: 处 理器, 以及与所述处 理器通信连接的存 储器; 所述存储器存储计算机执 行指令; 所述处理器执行所述存储器存储的计算机执行指令, 以实现如权利要求1至7中任一项 所述的问答语句检索方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 执行指令, 所述计算机执行指 令被处理器执行时用于实现如权利要求 1至7中任一项 所述的 问答语句检索方法。权 利 要 求 书 2/2 页 3 CN 115510194 A 3
专利 问答语句检索方法、装置、电子设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-24 00:45:05
上传分享
举报
下载
原文档
(772.0 KB)
分享
友情链接
T-CAMETA 001006.3—2022 工业网关 第3部分:面向数控系统的工业网关测评技术规范.pdf
GB-T 37804-2019 冬小麦苗情长势监测规范.pdf
GB-T 29920-2013 电工用稀土高铁铝合金杆.pdf
DB3305-T 197-2021 绿水青山就是金山银山 生态资源数字化建设与应用指南 湖州市.pdf
GB-T 19668.7-2022 信息技术服务 监理 第7部分:监理工作量度量要求.pdf
GM-T 0056-2018 多应用载体密码应用接口规范.pdf
T-CSTM 00790.4—2022 汽车用薄钢板 第4部分:双向拉伸试验十字形拉伸试样.pdf
数据备份与恢复管理规范.pdf
LY-T 1923-2020 室内木质门.pdf
阿里云 专有云企业版 云平台 同城容灾用户指南 2022.pdf
JR-T0138-2016 银团贷款业务技术指南.pdf
NB-T 10805—2021 水电工程溃坝洪水与非恒定流计算规范.pdf
GB-T 29246-2017 信息安全管理体系 概述与词汇.pdf
GB-T 21050-2019 信息安全技术网络交换机安全技术要求.pdf
CCSP OSG 云安全专业认证 第三版 中文.pdf
GA-T 1390.5-2017 信息安全技术 网络安全等级保护基本要求 第5部门 工业控制系统安全扩展要求.pdf
GB-T 32907-2016 信息安全技术 SM4分组密码算法.pdf
DB3301-T 71—2018 数字城管系统运维服务规范 杭州市.pdf
GB-T 19002-2018 质量管理体系GB-T 19001—2016应用指南.pdf
T-CGCC 7—2017 焙烤食品用糖浆.pdf
1
/
21
评价文档
赞助2.5元 点击下载(772.0 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。