(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211282973.X (22)申请日 2022.10.20 (71)申请人 北京理工大 学 地址 100081 北京市海淀区中关村南大街5 号 (72)发明人 詹玉峰 王家盛 齐天宇 翟弟华  张元 吴楚格 夏元清  (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 韩雪梅 (51)Int.Cl. G06F 9/50(2006.01) G06N 3/08(2006.01) G06N 3/10(2006.01) G06N 20/00(2019.01) (54)发明名称 一种边缘智能优化方法和装置 (57)摘要 本发明涉及一种边缘智能优化方法和装置。 本发明提供的边缘智能优化方法, 基于模型参 数、 训练的轮数、 通信时间、 闲时CPU占用率和训 练能耗构建环 境的本轮状态, 各个边缘设备根据 本轮状态中的对应轮数信息参与联邦训练, 采集 本地模型参数、 通信时间、 闲时CPU利用率和训练 能耗等信息, 更新本轮状态, 使得环境转移到下 一个状态。 边缘设备不断与环境进行交互, 产生 大量轨迹信息用于策略模型的更新, 直至策略模 型收敛, 以根据每个设备的计算速度、 训练能耗、 通信时间, 分配不同的联邦训练轮数, 进而达到 平衡计算异构和减少能耗 开销的目的。 权利要求书3页 说明书10页 附图2页 CN 115357402 A 2022.11.18 CN 115357402 A 1.一种边 缘智能优化方法, 其特 征在于, 包括: 步骤100: 获取中央模型和策略模型, 并指定全局训练参数; 所述中央模型和所述策略 模型植入在中央服务器中; 所述全局训练参数包括: 边缘设备的总数量、 阈值时间、 批大小 和训练轮数; 步骤101: 基于所述训练轮数确定参与本轮训练的边 缘设备, 得到参与设备集 合; 步骤102: 获取本地数据样本; 步骤103: 所述参与设备集合中的边缘设备接收所述中央模型和所述训练轮数, 在满足 所述阈值时间的条件下, 利用所述本地数据样本以所述批大小更新本地模型 的参数; 所述 本地模型植入在边 缘设备中; 步骤104: 采集本地信息, 并基于所述本地信息构建环境的本轮状态; 所述环境的本轮 状态包括: 本地模型的参数、 通信时间、 CPU利用率和训练能耗; 步骤105: 更新所述环境的本轮状态, 并基于更新后的环境的本轮状态中本地模型的参 数和所述本地数据样本聚合所述中央模型, 得到聚合中央模型; 步骤106: 确定所述聚合中央模型的精度; 步骤107: 根据 所述聚合中央模型的精度、 更新后的所述环境的本轮状态中的通信时间 和更新后的所述环境的本轮 状态中的训练能耗确定所述策略模型的回报值; 步骤108: 根据 更新后的所述环境的本轮状态, 利用所述策略模型为每一参与本轮训练 的边缘设备生成一个正态分布; 步骤109: 对所述正态分布进行采样得到新的训练轮数分配信息, 并返回执行步骤103, 直至超过所述阈值时间时, 获取决策轨迹信息; 所述决策轨迹信息包括多 条决策轨迹; 每一 所述决策轨 迹均包括: 环境的本轮 状态、 策略模型的回报值和训练轮数; 步骤110: 利用所述决策轨迹信息更新所述策略模型, 并返回执行步骤100, 直至更新后 的策略模型收敛至最优解时, 得到联邦训练的优化模型。 2.根据权利要求1所述的边缘智能优化方法, 其特征在于, 所述基于所述训练轮数确定 参与本轮训练的边 缘设备, 得到参与设备集 合, 具体包括: 基于所述训练轮数为 边缘设备分配对应的训练轮数; 当为边缘设备分配的训练轮数为0时, 该边缘设备不参与本轮训练; 当为边缘设备分配 的训练轮数不 为0时, 该边 缘设备按照分配的训练轮数参与本轮训练; 获取参与本轮训练的边 缘设备生成所述 参与设备集 合。 3.根据权利要求1所述的边缘智能优化方法, 其特征在于, 在获取中央模型和策略模型 之后, 还包括: 对所述中央模型和所述策略模型进行初始化处 理。 4.根据权利要求1所述的边缘智能优化方法, 其特征在于, 所述确定所述 聚合中央模型 的精度, 具体包括: 获取测试集; 采用测试集确定所述聚合中央模型的精度。 5.根据权利要求1所述的边 缘智能优化方法, 其特 征在于, 所述聚合中央模型为:权 利 要 求 书 1/3 页 2 CN 115357402 A 2; 式中, 为第t+1轮的聚合 中央模型, 为第i个边缘设备的数据样本, 为第i 个边缘设备的数据样本的数量, D为所有边缘设备的数据样本的数量总和, , N表示边缘设备的总数量, 为第t轮第 i个边缘设备的本地模型的参数, Qt为第t轮参与 设备集合中边缘设备的数量。 6.根据权利要求1所述的边 缘智能优化方法, 其特 征在于, 所述策略模型的回报值 为: ; 式中, 为第t轮策略模型的回报值, 为第t轮聚合中央模型的精度, 为第t‑1轮 聚合中央模型的精度, 为第t轮第i个边缘设备的通信时间, 为第t轮第i个边缘设备 的训练能耗, 为第一权重系数, 为第二权重系数, 为第三权重系数, Qt为第t轮参与 设备集合中边缘设备的数量。 7.一种边 缘智能优化装置, 其特 征在于, 包括: 中央服 务器和边 缘设备; 所述中央服 务器与所述 边缘设备进行信息交 互; 所述中央服务器中植入有中央模型和策略模型; 所述中央服务器用于指定全局训练参 数, 基于所述训练轮数确定参与本轮训练的边缘设备, 得到参与设备集合; 所述全局训练参 数包括: 边 缘设备的总数量、 阈值时间、 批大小和训练轮数; 所述边缘设备中植入有本地模型; 所述参与设备集合中的边缘设备接收所述中央服务 器中的中央模型和所述训练轮数, 在满足所述阈值时间的条件下, 利用本地数据样本以所 述批大小更新本地模型的参数; 所述中央服务器用于采集本地信息, 并基于所述本地信息构建环境的本轮状态; 所述 环境的本轮 状态包括: 本地模型的参数、 通信时间、 CPU利用率和训练能耗; 所述中央服务器用于更新所述环境的本轮状态, 并基于更新后的环境的本轮状态中本 地模型的参数和所述本地数据样本聚合所述中央模型, 得到聚合中央模型; 所述中央服 务器用于获取测试集, 并采用测试集确定所述聚合中央模型的精度; 所述中央服务器用于根据所述 聚合中央模型的精度、 更新后的所述环境的本轮状态中 的通信时间和更新后的所述环境的本轮 状态中的训练能耗确定所述策略模型的回报值; 所述中央服务器用于根据更新后的所述环境的本轮状态, 利用所述策略模型为每一参 与本轮训练的边 缘设备生成一个正态分布; 所述中央服务器用于对所述正态分布进行采样得到新的训练轮数分配信 息, 并将得到权 利 要 求 书 2/3 页 3 CN 115357402 A 3

PDF文档 专利 一种边缘智能优化方法和装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种边缘智能优化方法和装置 第 1 页 专利 一种边缘智能优化方法和装置 第 2 页 专利 一种边缘智能优化方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:46上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。