standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211402578.0 (22)申请日 2022.11.10 (71)申请人 广州小鹏汽车 科技有限公司 地址 510000 广东省广州市天河区岑村松 岗大街8号 (72)发明人 韩传宇 宋旭阳 赵耀 易晖  翁志伟  (74)专利代理 机构 北京清亦华知识产权代理事 务所(普通 合伙) 11201 专利代理师 雷玉龙 (51)Int.Cl. G10L 15/18(2013.01) G10L 15/06(2013.01) G10L 15/22(2006.01) G10L 15/26(2006.01)G06F 40/30(2020.01) G06F 16/332(2019.01) G06F 16/33(2019.01) (54)发明名称 语音交互方法、 服 务器和存 储介质 (57)摘要 本发明公开了一种语音交互方法、 服务器和 存储介质。 该语音交互方法包括: 接收车辆转发 的语音请求, 对语音请求进行下游逻辑处理; 在 对语音请求进行下游逻辑处理同时, 发送异步请 求, 以根据上下文特征对语音请求进行第一语义 拒识, 得到第一语义拒识结果; 在接收到下游逻 辑处理结果后, 发送同步请求, 以根据下游逻辑 处理结果和第一语义拒识结果对语音请求进行 第二语义拒识, 得到第二语义拒识结果; 将第二 语义拒识结果下发至车辆以完成语音交互。 本发 明根据上下文特征对语音请求进行第一语义拒 识并根据第一语义拒识结果和下游逻辑处理结 果对语音请求进行第二语义拒识得到第二语义 拒识结果, 进而完成语音交互, 能够降低语音交 互过程的端到端时延。 权利要求书2页 说明书13页 附图4页 CN 115457945 A 2022.12.09 CN 115457945 A 1.一种语音交 互方法, 其特 征在于, 包括: 接收车辆转发的语音请求, 对所述语音请求进行 下游逻辑处 理; 在对所述语音请求进行所述下游逻辑处理同时, 发送异步请求, 以根据上下文特征对 所述语音请求进行第一语义拒识, 得到第一语义拒识结果; 在接收到下游逻辑处理结果后, 发送同步请求, 以根据所述下游逻辑处理结果和所述 第一语义拒识结果对所述语音请求进行第二语义拒识, 得到第二语义拒识结果; 将所述第二语义拒识结果下发至所述车辆以完成语音交 互。 2.根据权利要求1所述的语音交互方法, 其特征在于, 所述接收车辆转发的语音请求, 对所述语音请求进行 下游逻辑处 理, 包括: 将所述语音请求发送至中控服务以使所述中控服务将所述语音请求发送至对话系统 下游服务进行入参处 理, 由所述对话系统下游服 务实现所述下游逻辑处 理。 3.根据权利要求2所述的语音交互方法, 其特征在于, 所述将所述语音请求发送至 中控 服务以使 所述中控服务将所述语音请求 发送至对话系统下游服务进行入参处理, 由所述对 话系统下游服 务实现所述下游逻辑处 理, 包括: 将所述语音请求发送至所述中控服务以使所述中控服务将所述语音请求发送至对话 系统下游服务进行自然语言理解、 对话管理和/或业务机器人入参, 从而由所述对话系统下 游服务实现自然语言理解、 对话管理和业 务机器人对应的业 务逻辑处 理。 4.根据权利要求1所述的语音交互方法, 其特征在于, 所述接收车辆转发的语音请求, 对所述语音请求进行 下游逻辑处 理的步骤之后, 所述语音交 互方法包括: 通过中控服务将所述语音请求的语音识别文本特征发送至上下文服务, 以将所述语音 识别文本特 征作为所述上 下文特征存入数据存 储服务。 5.根据权利要求4所述的语音交互方法, 其特征在于, 所述在对所述语音请求进行所述 下游逻辑处理同时, 发送异 步请求, 以根据上下文 特征对所述语音请求进 行第一语义拒识, 得到第一语义拒识结果的步骤之前, 所述语音交 互方法包括: 在对所述语音请求进行下游逻辑处理同时, 将所述语音请求发送至声学拒识服务进行 处理, 以得到声学 特征; 根据所述声学 特征对所述语音请求进行拒识得到声学拒识结果; 将所述声学特征和所述声学拒识结果发送至所述上下文服务, 以将所述声学特征和所 述声学拒识结果作为上 下文特征存入所述数据存 储服务。 6.根据权利要求5所述的语音交互方法, 其特征在于, 所述在对所述语音请求进行所述 下游逻辑处理同时, 发送异 步请求, 以根据上下文 特征对所述语音请求进 行第一语义拒识, 得到第一语义拒识结果, 包括: 通过所述中控服 务发送所述异步请求至语义拒识服 务进行入参; 通过所述语义拒识服务获取所述语音识别文本特征、 所述声学特征和所述声学拒识结 果对所述语音请求进行第一语义拒识, 得到第一语义拒识结果。 7.根据权利要求6所述的语音交互方法, 其特征在于, 所述在对所述语音请求进行所述 下游逻辑处理同时, 发送异 步请求, 以根据上下文 特征对所述语音请求进 行第一语义拒识, 得到第一语义拒识结果的步骤之后, 所述语音交 互方法包括: 将所述第一语义拒识结果存 入所述数据存 储服务。权 利 要 求 书 1/2 页 2 CN 115457945 A 28.根据权利要求7所述的语音交互方法, 其特征在于, 所述在接收到下游逻辑处理结果 后, 发送同步请求, 以根据所述下游逻辑处理结果和所述第一语义拒识结果对所述语音请 求进行第二语义拒识, 得到第二语义拒识结果, 包括: 在接收到所述下游逻辑处理结果后, 通过所述中控服务基于所述下游逻辑处理结果发 送所述同步请求至语义拒识服 务进行入参; 通过所述语义拒识服 务获取所述数据存 储服务的所述第一语义拒识结果; 根据所述第 一语义拒识结果和所述下游逻辑处理结果进行第 二语义拒识, 融合得到第 二语义拒识结果。 9.一种服务器, 其特征在于, 所述服务器包括处理器和存储器, 所述存储器上存储有计 算机程序, 当所述计算机程序被所述处理器执行时, 实现权利要求 1‑8任一项所述的语音交 互方法。 10.一种包含有计算机程序的非易失性计算机可读存储介质, 其特征在于, 当所述计算 机程序被一个或多个处 理器执行时, 实现权利要求1 ‑8任一项所述的语音交 互方法。权 利 要 求 书 2/2 页 3 CN 115457945 A 3

PDF文档 专利 语音交互方法、服务器和存储介质

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 语音交互方法、服务器和存储介质 第 1 页 专利 语音交互方法、服务器和存储介质 第 2 页 专利 语音交互方法、服务器和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:45:04上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。