standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211064160.3 (22)申请日 2022.09.01 (71)申请人 成都知道创宇信息技 术有限公司 地址 610000 四川省成 都市高新区中国(四 川)自由贸易试验区天府大道北段28 号C座9楼 (72)发明人 牟波 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 专利代理师 杜杨 (51)Int.Cl. G06V 10/774(2022.01) G06V 20/62(2022.01) G06V 30/19(2022.01) G06V 40/16(2022.01) (54)发明名称 一种模型训练方法、 装置、 电子设备及存储 介质 (57)摘要 本发明的实施例提供了一种模 型训练方法、 装置、 电子设备及存储介质, 方法包括: 通过确定 教师模型和学生模型, 确定初始训练样本数据, 逐步将学生模型中的第二模块将教师模型中的 第一模块进行替换, 每次替换后均进行训练, 得 到新的教师模 型, 直到最新得到的新的教师模型 中的第一模块均被学生模型中的第二模块替换, 得到训练好的目标模型, 实现逐步用学生模型的 模块替换掉教师模型中的模块, 并训练替换模块 后的教师模 型, 从而实现学生模 型学习迁移来自 教师模型的监督信息, 有效降低学生模型学习所 需要的训练数据数量, 减少训练时间并且提高学 生模型的精度。 权利要求书2页 说明书9页 附图4页 CN 115359321 A 2022.11.18 CN 115359321 A 1.一种模型训练方法, 其特 征在于, 所述方法包括: 确定教师模型和学生模型; 确定初始训练样本数据, 其中, 所述初始训练样本数据为训练所述教师模型所使用的 训练样本数据; 将所述教师模型中的部分第 一模块替换为与所述学生模型中对应的第 二模块, 得到更 新后的教师模型, 其中, 所述教师模型包括多个第一模块, 所述学生模型包括多个第二模 块; 基于所述初始训练样本数据对所述更新后的教师模型进行训练, 得到新的教师模型; 返回执行所述将所述教师模型中的部分第一模块替换为与所述学生模型中对应的第 二模块, 得到更新后的教师模型至所述基于所述初始训练样本数据对所述更新后的教师模 型进行训练的步骤, 直到最新得到的新的教师模型中的第一模块均被所述学生模型中的第 二模块替换, 得到训练好的目标模型, 其中, 所述目标模型中的模块为所述学生模型中的第 二模块。 2.根据权利要求1所述的方法, 其特征在于, 所述将所述教师模型中的部分第 一模块替 换为与所述学生模型中对应的第二模块, 得到更新后的教师模型的步骤, 包括: 基于伯努利分布方式, 控制将所述教师模型中的第 一模块替换为与 所述学生模型中对 应的第二模块的替换概 率; 基于所述替换概率, 将所述教师模型中的部分第 一模块替换为与所述学生模型中对应 的第二模块, 得到更新后的教师模型。 3.根据权利要求2所述的方法, 其特 征在于, 所述伯努利分布方式满足以下公式: pd=min(1, θ(t) )=min(1,kt=b); 其中, b是初始替换率, k是 大于0的系数, t是替换次数。 4.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 将待检测数据输入至所述目标模型, 得到预测数据; 将所述预测数据进行清洗, 得到第一训练数据; 基于所述第一训练数据对所述目标模型进行训练。 5.根据权利要求1所述的方法, 其特征在于, 所述基于所述初始训练样本数据对所述更 新后的教师模型进行训练, 得到新的教师模型的步骤, 包括: 基于交叉熵损失函数, 确定所述初始训练样本数据的真实标签与预测标签的损失; 基于所述损失对所述更新后的教师模型的参数进行调整, 以获得新的教师模型; 返回执行所述基于交叉熵损失函数, 确定所述初始训练样本数据的真实标签与预测标 签的损失至所述基于所述损失对所述更新后的教师模型的参数进 行调整, 以获得新的教师 模型的步骤, 直至 达到预设训练次数, 得到新的教师模型。 6.根据权利要求5所述的方法, 其特 征在于, 所述交叉熵损失函数满足以下公式: L=‑∑j∈|X|∑c∈C[[zj=c]·logP(zj=c∣ xj)]; 其中xj∈X为第j个初始训练样本, X为初始训练样本集合, zj为初始训练样本的真实标 签, c为初始样本的类标签, C为初始训练样本集合的类标签集合, P为初始训练样本的真实 标签与预测标签的概 率差值。 7.根据权利要求4所述的方法, 其特征在于, 所述将所述预测数据进行清洗, 得到第一权 利 要 求 书 1/2 页 2 CN 115359321 A 2训练数据的步骤, 包括: 确定所述预测数据的置信度值; 将置信度小于阈值的第一预测数据进行 人工审核; 接收人工审核后的第一预测数据; 将人工审核后的所述第一预测数据, 作为第一训练数据。 8.一种模型训练装置, 其特 征在于, 所述装置包括: 第一确定模块, 用于确定教师模型和学生模型; 第二确定模块, 用于确定初始训练样本数据, 其中, 所述初始训练样本数据为训练所述 教师模型 所使用的训练样本数据; 替换模块, 用于将所述教师模型中的部分第 一模块替换为与 所述学生模型中对应的第 二模块, 得到更新后的教师模型, 其中, 所述教师模型包括多个第一模块, 所述学生模型包 括多个第二模块; 训练模块, 用于基于所述初始训练样本数据对所述更新后的教师模型进行训练, 得到 新的教师模型; 执行模块, 用于返回执行所述将所述教师模型中的部分第 一模块替换为与 所述学生模 型中对应的第二模块, 得到更新后的教师模型至所述基于所述初始训练样本数据对所述更 新后的教师模型进行训练的步骤, 直到最新得到的新的教师模型中的第一模块均被所述学 生模型中的第二模块替换, 得到训练好的目标模型, 其中, 所述目标模型中的模块为所述学 生模型中的第二模块。 9.一种电子设备, 其特征在于, 包括存储器和 处理器, 所述存储器存储有计算机程序, 所述处理器执行所述计算机程序时实现权利要求1 ‑7任一项所述方法的步骤。 10.一种存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被处理器执行 时实现权利要求1 ‑7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 115359321 A 3
专利 一种模型训练方法、装置、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 16:17:16
上传分享
举报
下载
原文档
(718.3 KB)
分享
友情链接
GB-T 36549-2018 电化学储能电站运行指标及评价.pdf
T-CSTM 00236—2020 化学试剂 农残级甲醇.pdf
GB-T 24262-2009 石油物探仪器环境试验及可靠性要求.pdf
GB-T 27011-2019 合格评定 认可机构要求.pdf
T-ZZB 1845—2020 散热器恒温控制阀.pdf
DB5301-T 82-2023 农业废弃物 冷库蔬菜废弃物处置规范 昆明市.pdf
ISO 31101 2023 Robotics — Application services provided by service robots — Safety man.pdf
JY-T 0584-2020 扫描电子显微镜分析方法通则.pdf
T-CEC 656—2022 电力行业职业技能标准 光伏发电运维值班员.pdf
QC-T 556-2023 汽车制动器温度测量方法及热电偶安装要求.pdf
GB-T 16903.2-2023 标志用图形符号表示规则 第2部分:公共信息图形符号的通用符号要素.pdf
GB-T 36989-2018 用超声流量计测量液态烃流量.pdf
GB-T 18175-2014 水处理剂缓蚀性能的测定 旋转挂片法.pdf
GB-T 4240-2019 不锈钢丝.pdf
ISO 5393 2017 Rotary tools for threaded fasteners — Performance test method.pdf
GB-T 42860-2023 运载火箭运输通用要求.pdf
T-CIECCPA 010—2020 节能诊断数据结构化处理规范.pdf
DB22-T 2256-2018 杂交粳稻不育系鉴定规程 吉林省.pdf
GB-T 12971.1-2023 电力牵引用接触线 第1部分:铜及铜合金接触线.pdf
ISO27001-2013 安言咨询.pdf
1
/
3
16
评价文档
赞助2元 点击下载(718.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。