(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210965690.9
(22)申请日 2022.08.12
(65)同一申请的已公布的文献号
申请公布号 CN 115042191 A
(43)申请公布日 2022.09.13
(73)专利权人 季华实验室
地址 528200 广东省佛山市南海区桂城街
道环岛南路28号
(72)发明人 杨远达 林才纺 赵旭东 张梦瑶
(74)专利代理 机构 佛山市海融科创知识产权代
理事务所(普通 合伙) 44377
专利代理师 许家裕
(51)Int.Cl.
B25J 9/16(2006.01)(56)对比文件
CN 114670210 A,202 2.06.28
CN 112677156 A,2021.04.20
WO 202108610 6 A1,2021.0 5.06
CN 1097326 05 A,2019.0 5.10
审查员 潘玉芬
(54)发明名称
预训练模型微调训练方法、 装置、 电子设备
及存储介质
(57)摘要
本申请属于机械臂控制技术领域, 公开了一
种预训练模型微调训练方法、 装置、 电子设备及
存储介质, 通过采集机械臂在摩 擦力补偿模型不
参与控制过程的条件下执行工作任务时的运动
指令数据, 以对摩擦力补偿模型的安全性进行检
测; 若摩擦力补偿模型安全, 则多次采集微调数
据集对摩 擦力补偿模型进行调整训练, 以得到对
应的优化模 型和损失函数值; 根据优化模型和对
应的损失函数值, 进行备选最优模型更新处理;
对最新的备选最优模型进行实际运行测试, 根据
测试结果进行最优模型的更新处理; 从而可高效
地完成对经过预训练的摩擦力补偿模型的微调
训练, 以提高摩擦力补偿模型与实际应用该摩擦
力补偿模型的机械臂的匹配度, 从而提高控制精
度。
权利要求书2页 说明书15页 附图2页
CN 115042191 B
2022.11.08
CN 115042191 B
1.一种预训练模型微调训练方法, 用于对经过预训练 的摩擦力补偿模型进行在线微调
训练, 所述摩擦力补偿模型为机 械臂的摩擦力补偿模型, 其特 征在于, 包括 步骤:
A1.采集机械臂在所述摩擦力补偿模型不参与控制过程的条件下执行工作任务时的运
动指令数据, 以对所述摩擦力补偿模型的安全性进行检测;
A2.若所述摩擦力补偿模型安全, 则多次采集微调数据集以对所述摩擦力补偿模型进
行调整训练, 以得到各次调整训练后的优化模型和对应的损失函数值;
A3.在每完成一次所述调整训练后, 根据所述优化模型和对应的所述损失函数值, 进行
备选最优 模型更新处理;
A4.在每次更新所述备选最优模型后, 对最新的所述备选最优模型进行实际运行测试,
根据测试 结果进行最优 模型的更新处 理。
2.根据权利要求1所述的预训练模型微调训练方法, 其特 征在于, 步骤A1包括:
采集机械臂在所述摩擦力补偿模型不参与控制过程的条件下重复执行至少一次所述
工作任务时的运动指令数据, 得到 至少一组所述 运动指令数据;
分别把各组所述运动指令数据输入所述摩擦力补偿模型, 以获取所述摩擦力补偿模型
对应输出的补偿力矩数值;
若至少一个所述补偿力矩数值不符合预设安全指标, 则判定所述摩擦力补偿模型不安
全, 否则, 判定所述摩擦力补偿模型安全。
3.根据权利要求1所述的预训练模型微调训练方法, 其特 征在于, 步骤A 2包括:
循环地采集微调数据集以对所述摩擦力补偿模型进行调整训练, 直到调整训练 的次数
达到预设的次数阈值, 或者, 直到实际运行测试表明最新的最优模型 的摩擦力补偿效果满
足预设补偿效果指标。
4.根据权利要求1所述的预训练模型微调训练方法, 其特征在于, 所述采集微调数据集
以对所述摩擦力补偿模型进行调整训练的步骤 包括:
采集机械臂在所述摩擦力补偿模型不参与控制过程的条件下多次执行所述工作任务
时的训练输入数据, 形成一个所述微调数据集; 所述训练输入数据包括运动指令数据和运
动反馈数据;
把所述微调数据集按预设比例分成训练集和 测试集;
使用所述训练集对所述摩擦力补偿模型进行调整训练以得到优化模型和对应的损失
函数值, 并用所述测试集对所述优化模型进行测试。
5.根据权利要求1所述的预训练模型微调训练方法, 其特 征在于, 步骤A3包括:
若当前仅完成一 次所述调 整训练, 则以本次调 整训练对应的所述优化模型作为备选最
优模型;
若当前完成多于一 次所述调整训练, 则对比本次调整训练对应的所述损失函数值与当
前的最优模型对应的所述损失函数值, 并在对比结果满足第一预设更新条件时, 用本次调
整训练对应的所述优化模型 更新所述备选最优 模型。
6.根据权利要求5所述的预训练模型微调训练方法, 其特 征在于, 步骤A4包括:
A401.使所述机械臂在最新的所述备选最优模型参与控制过程的条件下执行所述工作
任务, 以获取摩擦力补偿效果评价指标值;
A402.若当前仅完成一次所述调整训练, 则用最 新的所述备选最优 模型作为 最优模型;权 利 要 求 书 1/2 页
2
CN 115042191 B
2A403.若当前完成多于一次所述调整训练, 则对比最新的所述备选最优模型的所述摩
擦力补偿效果评价指标值和当前的最优模型的所述摩擦力 补偿效果评价指标值, 并在 对比
结果满足第二预设更新条件时, 用最 新的所述备选最优 模型更新所述 最优模型。
7.根据权利要求6所述的预训练模型微调训练方法, 其特征在于, 步骤A401之前, 还包
括步骤:
采集机械臂在所述摩擦力补偿模型不参与控制过程的条件下执行所述工作任务时的
训练输入数据, 以对最 新的所述备选最优 模型的安全性进行检测;
步骤A401包括:
若最新的所述备选最优模型安全, 才使所述机械臂在最新的备选最优模型参与控制过
程的条件下 执行所述工作任务, 以获取摩擦力补偿效果评价指标值。
8.一种预训练模型微调训练装置, 用于对经过预训练 的摩擦力补偿模型进行在线微调
训练, 所述摩擦力补偿模型为机 械臂的摩擦力补偿模型, 其特 征在于, 包括:
安全检测模块, 用于采集机械臂在所述摩擦力补偿模型不参与控制过程的条件下执行
工作任务时的运动指令数据, 以对所述摩擦力补偿模型的安全性进行检测;
训练模块, 用于在所述摩擦力补偿模型安全时, 多次采集微调数据集以对所述摩擦力
补偿模型进行调整训练, 以得到各次调整训练后的优化模型和对应的损失函数值;
第一更新模块, 用于在每完成一次所述调整训练后, 根据所述优化模型和对应的所述
损失函数值, 进行 备选最优 模型更新处理;
第二更新模块, 用于在每次更新所述备选最优模型后, 对最新的所述备选最优模型进
行实际运行测试, 根据测试 结果进行最优 模型的更新处 理。
9.一种电子设备, 其特征在于, 包括处理器和存储器, 所述存储器存储有所述处理器可
执行的计算机程序, 所述处理器执行所述计算机程序时, 运行如权利要求 1‑7任一项所述预
训练模型微调训练方法中的步骤。
10.一种存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被处理器执
行时运行如权利要求1 ‑7任一项所述预训练模型微调训练方法中的步骤。权 利 要 求 书 2/2 页
3
CN 115042191 B
3
专利 预训练模型微调训练方法、装置、电子设备及存储介质
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 16:14:39上传分享