(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211261286.X (22)申请日 2022.10.14 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 毛丽雯 卢成业 南方  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张思淼 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/10(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种用于员工离职倾向预测的模型训练方 法及装置 (57)摘要 本申请公开一种用于员工离职倾向预测的 模型训练方法, 包括: 将员工数据样本进行预处 理得到不完整数据样本, 并将不完整数据样本进 行预填补后加入到模型训练的过程中, 有效提高 了员工数据样本的利用率, 将填补数据作为变 量, 在模型训练的过程中动态更新, 通过计算代 价函数更新模 型的参数, 逐渐降低了预填补带来 的估计误差, 实现了对与不完整数据样本中缺失 数据的填补, 得到的预测模型不仅能够预测离职 倾向率, 当输入模型的员工基本信息不完整时, 还可以获得完整的员工数据, 使用完整的员工数 据进行预测, 提高了员工 离职预测的准确率。 权利要求书2页 说明书9页 附图5页 CN 115511199 A 2022.12.23 CN 115511199 A 1.一种用于员工 离职倾向预测的模型训练方法, 其特 征在于, 所述方法包括: 对员工数据样本进行预处理, 得到不完整数据样本; 其中, 所述不完整数据样本 中的员 工数据缺失挽留难度和至少一项员工基本信息; 对所述不完整数据样本中的缺失数据进行预填补, 得到输入数据样本, 并在所述输入 数据样本中标记填补数据的位置; 将所述输入数据样本输入模型训练, 对所述填补数据进行更新得到预测数据样本, 并 根据所述预测数据样本计算离职倾向率; 根据代价函数对所述模型进行优化; 其中, 所述代价函数是由所述员工数据样本和所 述预测数据样本计算得到的; 将第m次训练得到的预测数据样本作为第m+1次训练的输入数据样本, 输入所述模型进 行训练, 直至训练次数达到阈值n时, 将第n次训练后的模型保存为预测模型; 其中, 所述预 测模型通过对所述填补数据的更新获得完整员工数据, 并根据所述完整员工数据预测所述 离职倾向率。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述不完整数据样本 中的缺失数据 进行预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置包括: 将所述不完整数据样本按照4:1的比例划分为训练集和测试集, 对所述训练集中的缺 失数据进行 预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置 。 3.根据权利要求2所述的方法, 其特征在于, 在所述直至训练次数达到阈值n时, 将第n 次训练后的模型保存为预测模型之后进一 步包括: 对所述测试集中的缺失数据进行 预填补, 得到测试 数据样本; 将所述测试 数据样本 输入所述预测模型, 得到所述预测数据样本和所述离职倾向率; 根据所述挽留难度与挽留因素之间的对应关系, 将所述预测数据样本中的挽留难度转 换为所述挽留因素; 其中, 所述挽留因素与所述挽留难度一 一对应; 将所述挽留因素和所述离职倾向率可视化输出, 以便企业及时采取相对应的措施。 4.根据权利要求1所述的方法, 其特征在于, 在所述对员工数据样本进行预处理, 得到 不完整数据样本之前进一 步包括: 收集员工数据, 生成初始数据样本; 对所述初始数据样本进行数据清洗, 删除与预测员工离职无关的信息, 并对字符串型 数据进行数值化处理, 对离散型数据进 行二值化处理, 对连续性数据进 行归一化处理, 得到 所述员工数据样本 。 5.根据权利要求1所述的方法, 其特征在于, 所述对员工数据样本进行预处理, 得到不 完整数据样本包括: 删除员工数据样本 中的每条员工数据的挽留难度, 并在每条员工数据中随机删除至少 一项员工基本信息, 得到不完整数据样本 。 6.一种用于员工 离职倾向预测的模型训练装置, 其特 征在于, 所述装置包括: 数据预处理单元, 用于: 对员工数据样本进行预处理, 得到不完整数据样本; 其中, 所述 不完整数据样本中的员工数据缺失挽留难度和至少一项员工基本信息; 数据预填补单元, 用于: 对所述不完整数据样本中的缺失数据进行预填补, 得到输入数 据样本, 并在所述输入数据样本中标记填补数据的位置;权 利 要 求 书 1/2 页 2 CN 115511199 A 2模型训练单元, 用于: 将所述输入数据样本输入模型训练, 对所述填补数据进行更新得 到预测数据样本, 并根据所述预测数据样本计算离职倾向率; 模型优化单元, 用于: 根据代价函数对所述模型进行优化; 其中, 所述代价函数是由所 述员工数据样本和所述预测数据样本计算得到的; 所述模型训练单元还用于: 将第m次训练得到的预测数据样本作为第m+1次训练的输入 数据样本, 输入所述模型进 行训练, 直至训练 次数达到阈值n时, 将第n次训练后的模型保存 为预测模 型; 其中, 所述预测模 型通过对所述填补数据的更新获得完整员工数据, 并根据所 述完整员工数据预测所述离职倾向率。 7.根据权利要求6所述的装置, 其特 征在于, 所述数据预填补单 元还用于: 将所述不完整数据样本按照4:1的比例划分为训练集和测试集, 对所述训练集中的缺 失数据进行 预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述装置进一 步包括: 模型测试 单元, 用于: 对所述测试集中的缺失数据进行 预填补, 得到测试 数据样本; 所述模型测试单元还用于: 将所述测试数据样本输入所述预测模型, 得到所述预测数 据样本和所述离职倾向率; 所述模型测试单元还用于: 根据所述挽留难度与挽留因素之间的对应关系, 将所述预 测数据样本中的挽留难度转换为所述挽留因素; 其中, 所述挽留因素与所述挽留难度一一 对应; 所述模型测试单元还用于: 将所述挽留因素和所述离职倾向率可视化输出, 以便企业 及时采取相对应的措施。 9.根据权利要求6所述的装置, 其特 征在于, 所述装置进一 步包括: 数据清洗单 元, 用于: 收集员工数据, 生成初始数据样本; 所述数据清洗单元还用于: 对所述初始数据样本进行数据清洗, 删除与预测员工离职 无关的信息, 并对字符串 型数据进行数值化处理, 对离散型数据进 行二值化处理, 对连续性 数据进行归一 化处理, 得到所述员工数据样本 。 10.根据权利要求6所述的装置, 其特 征在于, 所述数据预处 理单元还用于: 删除员工数据样本 中的每条员工数据的挽留难度, 并在每条员工数据中随机删除至少 一项员工基本信息, 得到不完整数据样本 。权 利 要 求 书 2/2 页 3 CN 115511199 A 3

PDF文档 专利 一种用于员工离职倾向预测的模型训练方法及装置

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用于员工离职倾向预测的模型训练方法及装置 第 1 页 专利 一种用于员工离职倾向预测的模型训练方法及装置 第 2 页 专利 一种用于员工离职倾向预测的模型训练方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。