专利 一种基于云计算的英语发音纠错方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210854964.7 (22)申请日 2022.07.20 (71)申请人河南职业技术学院地址 450046 河南省郑州市郑东新区龙子湖高校园区平安大道 210号 (72)发明人汤宁　王盛　薛庆利　朱卫敏　崔艳霞　樊星　 (74)专利代理机构徐州创荣知识产权代理事务所(普通合伙) 32353 专利代理师李丰刚 (51)Int.Cl. G10L 25/51(2013.01) G10L 25/60(2013.01) G10L 21/02(2013.01) G10L 15/26(2006.01)H04N 5/225(2006.01) G06F 16/73(2019.01) G09B 5/06(2006.01) (54)发明名称一种基于云计算的英语发音纠错方法及装置 (57)摘要本发明一种基于云计算的英语发音纠错方法及装置公开了一种通过边缘云和中心云对用户英文语句的待测发音音频进行处理，确定发音不准确的音素后，将该音素对应的对比发音口型影像发送给用户终端的英语发音纠错方法及装置。能够有效减轻用户终端的运行压力，提高数据处理速度。能够找出用户发音不准确的音素并通过对比发音口型影像帮助用户纠正发音偏差。能够降低对用户终端的存储能力和数据处理系统的要求。其特征在于包括音频及发音口型获取装置、中心云、边缘云以及用户终端，所述音频及发音口型获取装置，戴置于用户头上使用，用于获取用户英文语句的待测发音音频以及发音口型影像。权利要求书2页说明书5页附图5页 CN 115116473 A 2022.09.27 CN 115116473 A 1.一种基于云计算的英语发音纠错装置，包括音频及发音口型获取装置、中心云、边缘云以及用户终端，其特征在于：所述音频及发音口型获取装置，戴置于用户头上使用，用于获取用户英文语句的待测发音音频以及发音口型影像，所述音频及发音口型获取装置和用户终端之间建立信号交互，所述边缘云和所述音频及发音口型获取装置之间建立信号交互，用于对所述待测发音音频以及发音口型影像进行预处理，去除待测发音音频以及发音口型影像中的噪音，并将去噪后的待测发音音频输入训练后的语音识别深度学习网络模型，获取待测发音音频的音素序列；所述边缘云将待测发音音频转化成英文文本；所述边缘云将所述标准口型影像和待测发音口型影像进行拼接，形成对比发音口型影像；用户终端：所述用户终端和边缘云之间建立信号交互，所述用户终端接收所述边缘云转化后的英文文本，由用户对转化后的英文文本进行纠正和确认；所述用户终端接收所述对比发音口型影像；中心云：所述中心云和边缘云建立信号交互，所述中心云在所述纠正后的英文文本和标准数据库之间建立映射关系，获取英文文本的标准语音音素，同时获取英文文本的标准口型影像；所述中心云将所述待测发音音频的音素序列和标准语音音素进行对比，以判断用户发音是否准确，所述中心云确定发音不准确的待测发音音频的音素，将该音素的标准口型影像和该音素的待测发音口型影像一同发送给边缘云。 2.一种基于云计算的英语发音纠错方法，其特征在于：具体包括以下步骤： 1）音频及发音口型获取装置获取用户英语语句的发音音频以及发音口型影像，并将待测发音音频以及发音口型影像发送给用户终端，用户终端将待测发音音频以及发音口型影像发送给边缘云； 2）所述边缘云接收所述待测发音音频以及发音口型影像后，对所述待测发音音频以及发音口型影像进行预处理，去除待测发音音频以及发音口型影像中的噪音； 3）所述边缘云将待测发音音频输入训练后的语音识别深度学习网络模型，获取待测发音音频的音素序列，并将所述音素序列发送给中心云； 4）所述边缘云将待测发音音频转化成英文文本，将转化后的英文文本传输给用户终端，由用户对转化后的英文文本进行纠正和确认，所述边缘云将纠正后的英文文本发送给中心云； 5）所述中心云接收所述纠正后的英文文本后，在英文文本和标准数据库之间建立映射关系，获取英文文本的标准语音音素，同时获取英文文本的标准口型影像； 6）所述中心云将所述待测发音音频的音素序列和标准语音音素进行对比，以判断用户发音是否准确，所述中心云确定发音不准确的待测发音音频的音素，将该音素的标准口型影像和该音素的待测发音口型影像一同发送给边缘云； 7）所述边缘云将所述标准口型影像和待测发音口型影像进行拼接，形成对比发音口型影像，并将所述对比发音口型影像发送给用户终端； 8）所述用户终端接收所述对比发音口型影像后由用户确定自身英语发音的口型偏差，对该音素的发音进行纠正。 3.根据权利要求2所述的一种基于云计算的英语发音纠错方法，其特征在于所述发音口型影像为用户嘴部区域发音时的影像。 4.根据权利要求2所述的一种基于云计算的英语发音纠错方法，其特征在于所述噪音包括用户发音前的无效音频和口型影像以及用户发音后的无效音频和口型影像。权　利　要　求　书 1/2 页 2 CN 115116473 A 25.根据权利要求1所述的一种基于云计算的英语发音纠错装置，其特征在于所述音频及发音口型获取装置由头盔、第一调节杆、摄像头外壳、第二调节杆、耳麦、第一连接块、锁紧螺纹套、第二连接块、摄像头、第一连接杆和第二连接杆组成，头盔上置有可调节角度的耳麦，所述耳麦和用户终端建立信号交互，所述头盔上置有第一调节杆，所述头盔上置有第二调节杆，所述第一调节杆端部置有第一连接块，所述第一连接块上套置有锁紧螺纹套，所述锁紧螺纹套和第一连接块螺纹连接，所述第二调节杆端部置有第二连接块，摄像头外壳一侧置有第一连接杆，所述第一连接杆一端和摄像头外壳相连接，另一端通过轴承和第一连接块转动连接，所述摄像头外壳另一侧置有第二连接杆，所述第二连接杆一端和摄像头外壳相连接，另一端通过轴承和第二连接块转动连接，所述摄像头外壳上置有摄像头，所述摄像头和用户终端建立信号交互。 6.根据权利要求5所述的一种基于云计算的英语发音纠错装置，其特征在于所述第一调节杆和第二调节杆关于头盔对称分布。 7.根据权利要求6所述的一种基于云计算的英语发音纠错装置，其特征在于所述第一调节杆为 L型结构。 8.根据权利要求6所述的一种基于云计算的英语发音纠错装置，其特征在于所述第二调节杆为 L型结构。 9.根据权利要求7所述的一种基于云计算的英语发音纠错装置，其特征在于所述第一调节杆和第二调节杆均为随意弯曲杆。 10.根据权利要求5所述的一种基于云计算的英语发音纠错装置，其特征在于所述摄像头外壳为矩形结构。权　利　要　求　书 2/2 页 3 CN 115116473 A 3

专利 一种基于云计算的英语发音纠错方法及装置

专利一种基于云计算的英语发音纠错方法及装置