standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210854964.7 (22)申请日 2022.07.20 (71)申请人 河南职业 技术学院 地址 450046 河南省郑州市郑东 新区龙子 湖高校园区平安大道 210号 (72)发明人 汤宁 王盛 薛庆利 朱卫敏  崔艳霞 樊星  (74)专利代理 机构 徐州创荣知识产权代理事务 所(普通合伙) 32353 专利代理师 李丰刚 (51)Int.Cl. G10L 25/51(2013.01) G10L 25/60(2013.01) G10L 21/02(2013.01) G10L 15/26(2006.01)H04N 5/225(2006.01) G06F 16/73(2019.01) G09B 5/06(2006.01) (54)发明名称 一种基于云计算的英语发音纠错方法及装 置 (57)摘要 本发明一种基于云计算的英语发音纠错方 法及装置公开了一种通过边缘云和 中心云对用 户英文语句的待测发音音 频进行处理, 确定发音 不准确的音素后, 将该音素对应的对比发音口型 影像发送给用户终端的英语发音纠错方法及装 置。 能够有效减轻用户终端的运行压力, 提高数 据处理速度。 能够找出用户发音不准确的音素并 通过对比发音口型影像帮助用户纠正发音偏差。 能够降低对用户终端的存储能力和数据处理系 统的要求。 其特征在于包括音频及发音口型获取 装置、 中心云、 边缘云以及用户终端, 所述音频及 发音口型获取装置, 戴置于用户头上使用, 用于 获取用户英文语句的待测发音音频以及发音口 型影像。 权利要求书2页 说明书5页 附图5页 CN 115116473 A 2022.09.27 CN 115116473 A 1.一种基于云计算的英语发音纠错装置, 包括音频及发音口型获取装置、 中心云、 边缘 云以及用户终端, 其特征在于: 所述音频及发音口型获取装置, 戴置于用户头上使用, 用于 获取用户英文语句的待测发音音频以及发音口型影像, 所述音频及发音口型获取装置和用 户终端之间建立信号交互, 所述边缘云和所述音频及发音口型获取装置之间建立信号交 互, 用于对所述待测发音音频以及发音口型影像进行预处理, 去除待测发音音频以及发音 口型影像中的噪音, 并将去噪后的待测发音音频输入训练后的语音识别深度学习网络模 型, 获取待测发音音频的音素序列; 所述边缘云将待测发音音频转化 成英文文本; 所述边缘 云将所述标准口型影像和待测发音口型影像进行拼接, 形成对比发音口型影像; 用户终端: 所述用户终端和边缘云之 间建立信号交互, 所述用户终端接收所述边缘云转化后的英文文 本, 由用户对转化后的英文文本进行纠正和确认; 所述用户终端接 收所述对比发音口型影 像; 中心云: 所述中心云和边缘云建立信号交互, 所述中心云在所述纠正后的英文文本和标 准数据库之间建立映射关系, 获取英文文本的标准语音音素, 同时获取英文文本的标准口 型影像; 所述中心云将所述待测发音音频的音素序列和标准语音音素进行对比, 以判断用 户发音是否准确, 所述中心云确定发音不准确的待测发音音频的音素, 将该音素 的标准口 型影像和该音素的待测发音口型影 像一同发送给边 缘云。 2.一种基于云计算的英语发音纠错方法, 其特 征在于: 具体包括以下步骤: 1) 音频及发音口型获取装置获取用户英语语句的发音音频以及发音口型影像, 并将待 测发音音频以及发音口型影像发送给用户终端, 用户终端将待测发音音频以及发音口型影 像发送给边 缘云; 2) 所述边缘云接收所述待测发音音频以及发音口型影像后, 对所述待测发音音频以及 发音口型影 像进行预处理, 去除待测发音 音频以及发音口型影 像中的噪音; 3) 所述边缘云将待测发音音频输入训练后的语音识别深度 学习网络模型, 获取待测发 音音频的音素序列, 并将所述音素序列发送给中心云; 4) 所述边缘云将待测发音音频转化成英文文本, 将转化后的英文文本传输给用户终 端, 由用户对转化后的英文文本进行纠正和确认, 所述边缘云将纠正后的英文文本发送给 中心云; 5) 所述中心云接收所述纠正后的英文文本后, 在英文文本和标准数据库之间建立映射 关系, 获取英文 文本的标准语音 音素, 同时获取英文 文本的标准口型影 像; 6) 所述中心云将所述待测发音音频的音素序列和标准语音音素进行对比, 以判断用户 发音是否准确, 所述中心云确定发音不准确的待测发音音频的音素, 将该音素 的标准口型 影像和该音素的待测发音口型影 像一同发送给边 缘云; 7) 所述边缘云将所述标准口型影像和待测发音口型影像进行拼接, 形成对比发音口型 影像, 并将所述对比发音口型影 像发送给用户终端; 8) 所述用户终端接收所述对比发音口型影像后由用户确定自身英语发音的口型偏差, 对该音素的发音 进行纠正。 3.根据权利要求2所述的一种基于云计算的英语发音纠错方法, 其特征在于所述发音 口型影像为用户嘴部区域发音时的影 像。 4.根据权利要求2所述的一种基于云计算的英语发音纠错方法, 其特征在于所述噪音 包括用户发音前的无效音频和口型影 像以及用户发音后的无效音频和口型影 像。权 利 要 求 书 1/2 页 2 CN 115116473 A 25.根据权利要求1所述的一种基于云计算的英语发音纠错装置, 其特征在于所述音频 及发音口型获取装置由头盔、 第一调节杆、 摄像头外壳、 第二调节杆、 耳麦、 第一连接块、 锁 紧螺纹套、 第二连接块、 摄像头、 第一连接杆和第二连接杆组成, 头盔上置有可调节角度的 耳麦, 所述耳麦和用户终端建立信号交互, 所述头盔上置有第一调节杆, 所述头盔上置有第 二调节杆, 所述第一调节杆端部置有第一连接块, 所述第一连接块上套置有锁紧螺纹套, 所 述锁紧螺纹套和第一连接块螺纹连接, 所述第二调节杆端部置有第二连接块, 摄像头外壳 一侧置有第一连接杆, 所述第一连接杆一端和摄像头外壳相连接, 另一端通过轴承和第一 连接块转动连接, 所述摄像头外壳另一侧置有第二连接杆, 所述第二连接杆一端和摄像头 外壳相连接, 另一端通过轴承和 第二连接块转动连接, 所述摄像头外壳上置有摄像头, 所述 摄像头和用户终端建立信号交 互。 6.根据权利要求5所述的一种基于云计算的英语发音纠错装置, 其特征在于所述第一 调节杆和第二调节杆关于 头盔对称分布。 7.根据权利要求6所述的一种基于云计算的英语发音纠错装置, 其特征在于所述第一 调节杆为 L型结构。 8.根据权利要求6所述的一种基于云计算的英语发音纠错装置, 其特征在于所述第二 调节杆为 L型结构。 9.根据权利要求7所述的一种基于云计算的英语发音纠错装置, 其特征在于所述第一 调节杆和第二调节杆均为随意弯曲杆。 10.根据权利要求5所述的一种基于云计算的英语发音纠错装置, 其特征在于所述摄像 头外壳为矩形 结构。权 利 要 求 书 2/2 页 3 CN 115116473 A 3

PDF文档 专利 一种基于云计算的英语发音纠错方法及装置

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于云计算的英语发音纠错方法及装置 第 1 页 专利 一种基于云计算的英语发音纠错方法及装置 第 2 页 专利 一种基于云计算的英语发音纠错方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:02:50上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。