(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210584714.6 (22)申请日 2022.05.27 (65)同一申请的已公布的文献号 申请公布号 CN 114676167 A (43)申请公布日 2022.06.28 (73)专利权人 太平金融科技 服务 (上海) 有限公 司深圳分公司 地址 518048 广东省深圳市福田区新洲路 立交桥西北侧新洲广场华丰大厦第3 层B1-A (72)发明人 唐文  (74)专利代理 机构 华进联合专利商标代理有限 公司 44224 专利代理师 姜晓云 (51)Int.Cl. G06F 16/2455(2019.01) G06K 9/62(2022.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01) G06Q 40/08(2012.01) (56)对比文件 CN 113988221 A,202 2.01.28CN 112613983 A,2021.04.0 6 CN 113570259 A,2021.10.2 9 CN 112330048 A,2021.02.0 5 CN 110991474 A,2020.04.10 US 9171259 B1,2015.10.27 CN 10802 2146 A,2018.0 5.11 CN 109299961 A,2019.02.01 V.Umayaparvathi 等.A ttribute Selection and Customer C hurn Predicti on in Telecom I ndustry. 《2016 I nternati onal Conference o n Data Mi ning and Advanced Computing》 .2016,1-7. 韦泽鲲等.基于随机森林的流 量多特征提取 与分类研究. 《传感器与微系统》 .2016,第3 5卷 (第12期),5 5-59. 高洋.基于数据挖掘的电信客户流失预测系 统研究. 《中国优秀硕士学位 论文全文数据库信 息科技辑》 .2014,(第02期),I138- 346. 王惠.财经新闻AP P用户流失预测. 《中国优 秀硕士学位 论文全文数据库信息科技 辑》 .2021, (第03期),I138-208. (续) 审查员 廖雯雯 (54)发明名称 用户存留模 型的训练方法、 用户存留预测方 法和装置 (57)摘要 本申请涉及一种用户存留模 型的训练方法、 用户存留预测方法和装置。 所述训练方法包括: 获取原始用户数据; 对原始用户数据进行分类, 得到对应各维度的初始用户特征; 对 各维度对应 的初始用户特征进行特征分组处理, 得到对应各 维度的初始用户特征的分组特征; 根据各分组特 征的重要性指标, 从各维度的分组特征中确定目 标特征; 基于目标特征进行初始用户存留模型的 训练, 得到训练后的用户存留模型。 采用本方法 能够提升用户存留预测的准确性。 [转续页] 权利要求书3页 说明书15页 附图5页 CN 114676167 B 2022.08.30 CN 114676167 B (56)对比文件 季林华.基尼系数计算中统计分组方法的探 讨. 《江苏统计》 .20 03,(第8期),11-12. R.Prashanth 等.High Ac curacy Predictive Model ling for Customer C hurn Predicti on in Telecom I ndustry. 《2017 Internati onal Conference o n Machine Learning and Data Mi ning in Pattern Recognition》 .2017,391-402.2/2 页 2[接上页] CN 114676167 B1.一种用户存留模型的训练方法, 其特 征在于, 所述训练方法包括: 获取原始用户数据; 对所述原 始用户数据进行分类, 得到对应各维度的初始用户特 征; 对各维度对应的初始用户特征进行特征分组处理, 得到对应各维度的初始用户特征的 分组特征; 根据各分组特 征的重要性指标, 从各维度的分组特 征中确定目标 特征; 基于所述目标 特征进行初始用户存留模型的训练, 得到训练后的用户存留模型; 所述对各维度对应的初始用户特征进行特征分组处理, 得到对应各维度的初始用户特 征的分组特 征, 包括: 基于各维度的初始用户特 征, 确定对应各维度特 征分组处理的特征分组边界; 根据所述特征分组边界, 对对应维度的初始用户特征进行分组, 得到对应的各分组特 征; 所述基于各维度的初始用户特征, 确定对应各维度特征分组处理的特征分组边界, 包 括: 对各维度的初始用户特 征进行排序, 得到排序后的初始用户特 征; 确定排序后的初始用户特征中任意相邻初始用户特征为参考特征, 并确定对应各所述 参考特征的特征分裂点; 从所述特征分裂点中确定特征分界点, 并将所述特征分界点作为特征分组边界, 包括: 逐个计算每个特征分裂点的Gi ni值, 并选取最大的Gi ni值作为特 征分界点; 所述从所述特 征分裂点中确定特 征分界点, 包括: 确定各所述特征分裂点的分裂系数; 基于所述分裂系数, 确定对应所述 排序后的初始用户特 征的特征分界点; 根据所述特征分裂点对所述排序后的初始用户特征进行拆分, 并将拆分后的初始用户 特征作为排序后的初始用户特征, 继续确定对应的特征分界点, 直至得到预设数量的特征 分界点; 所述根据各分组特 征的重要性指标, 从各维度的分组特 征中确定目标 特征, 包括: 基于各分组特征, 确定对应的用户存留信 息量以及用户流失信 息量, 其中, 所述用户存 留信息量是指各分组特征中存留用户的信息熵的大小, 所述用户流 失信息量是指各分组特 征中流失用户的信息熵的大小; 根据所述用户存留信息量以及用户流失信息量, 得到各分组特 征的重要性指标; 确定满足预设指标 条件的分组特 征为目标 特征。 2.根据权利要求1所述的训练方法, 其特征在于, 所述对各维度对应的初始用户特征进 行特征分组处理, 得到对应各维度的初始用户特 征的分组特 征之前, 还 包括: 对各维度的初始用户特征进行数据类型的识别, 确定对应各维度的初始用户特征的数 据类型; 基于各所述数据类型, 对各所述初始用户特征进行数据转换和/或缺失填充预处理, 得 到预处理后的各初始用户特 征; 所述对各维度对应的初始用户特征进行特征分组处理, 得到对应各维度的初始用户特 征的分组特 征, 包括:权 利 要 求 书 1/3 页 2 CN 114676167 B 3

.PDF文档 专利 用户存留模型的训练方法、用户存留预测方法和装置

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用户存留模型的训练方法、用户存留预测方法和装置 第 1 页 专利 用户存留模型的训练方法、用户存留预测方法和装置 第 2 页 专利 用户存留模型的训练方法、用户存留预测方法和装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 00:16:10上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。