(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210584714.6
(22)申请日 2022.05.27
(65)同一申请的已公布的文献号
申请公布号 CN 114676167 A
(43)申请公布日 2022.06.28
(73)专利权人 太平金融科技 服务 (上海) 有限公
司深圳分公司
地址 518048 广东省深圳市福田区新洲路
立交桥西北侧新洲广场华丰大厦第3
层B1-A
(72)发明人 唐文
(74)专利代理 机构 华进联合专利商标代理有限
公司 44224
专利代理师 姜晓云
(51)Int.Cl.
G06F 16/2455(2019.01)
G06K 9/62(2022.01)
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06Q 40/08(2012.01)
(56)对比文件
CN 113988221 A,202 2.01.28CN 112613983 A,2021.04.0 6
CN 113570259 A,2021.10.2 9
CN 112330048 A,2021.02.0 5
CN 110991474 A,2020.04.10
US 9171259 B1,2015.10.27
CN 10802 2146 A,2018.0 5.11
CN 109299961 A,2019.02.01
V.Umayaparvathi 等.A ttribute
Selection and Customer C hurn Predicti on
in Telecom I ndustry. 《2016 I nternati onal
Conference o n Data Mi ning and Advanced
Computing》 .2016,1-7.
韦泽鲲等.基于随机森林的流 量多特征提取
与分类研究. 《传感器与微系统》 .2016,第3 5卷
(第12期),5 5-59.
高洋.基于数据挖掘的电信客户流失预测系
统研究. 《中国优秀硕士学位 论文全文数据库信
息科技辑》 .2014,(第02期),I138- 346.
王惠.财经新闻AP P用户流失预测. 《中国优
秀硕士学位 论文全文数据库信息科技 辑》 .2021,
(第03期),I138-208. (续)
审查员 廖雯雯
(54)发明名称
用户存留模 型的训练方法、 用户存留预测方
法和装置
(57)摘要
本申请涉及一种用户存留模 型的训练方法、
用户存留预测方法和装置。 所述训练方法包括:
获取原始用户数据; 对原始用户数据进行分类,
得到对应各维度的初始用户特征; 对 各维度对应
的初始用户特征进行特征分组处理, 得到对应各
维度的初始用户特征的分组特征; 根据各分组特
征的重要性指标, 从各维度的分组特征中确定目
标特征; 基于目标特征进行初始用户存留模型的
训练, 得到训练后的用户存留模型。 采用本方法
能够提升用户存留预测的准确性。
[转续页]
权利要求书3页 说明书15页 附图5页
CN 114676167 B
2022.08.30
CN 114676167 B
(56)对比文件
季林华.基尼系数计算中统计分组方法的探
讨. 《江苏统计》 .20 03,(第8期),11-12.
R.Prashanth 等.High Ac curacy Predictive Model ling for Customer C hurn
Predicti on in Telecom I ndustry. 《2017
Internati onal Conference o n Machine
Learning and Data Mi ning in Pattern
Recognition》 .2017,391-402.2/2 页
2[接上页]
CN 114676167 B1.一种用户存留模型的训练方法, 其特 征在于, 所述训练方法包括:
获取原始用户数据;
对所述原 始用户数据进行分类, 得到对应各维度的初始用户特 征;
对各维度对应的初始用户特征进行特征分组处理, 得到对应各维度的初始用户特征的
分组特征;
根据各分组特 征的重要性指标, 从各维度的分组特 征中确定目标 特征;
基于所述目标 特征进行初始用户存留模型的训练, 得到训练后的用户存留模型;
所述对各维度对应的初始用户特征进行特征分组处理, 得到对应各维度的初始用户特
征的分组特 征, 包括:
基于各维度的初始用户特 征, 确定对应各维度特 征分组处理的特征分组边界;
根据所述特征分组边界, 对对应维度的初始用户特征进行分组, 得到对应的各分组特
征;
所述基于各维度的初始用户特征, 确定对应各维度特征分组处理的特征分组边界, 包
括:
对各维度的初始用户特 征进行排序, 得到排序后的初始用户特 征;
确定排序后的初始用户特征中任意相邻初始用户特征为参考特征, 并确定对应各所述
参考特征的特征分裂点;
从所述特征分裂点中确定特征分界点, 并将所述特征分界点作为特征分组边界, 包括:
逐个计算每个特征分裂点的Gi ni值, 并选取最大的Gi ni值作为特 征分界点;
所述从所述特 征分裂点中确定特 征分界点, 包括:
确定各所述特征分裂点的分裂系数;
基于所述分裂系数, 确定对应所述 排序后的初始用户特 征的特征分界点;
根据所述特征分裂点对所述排序后的初始用户特征进行拆分, 并将拆分后的初始用户
特征作为排序后的初始用户特征, 继续确定对应的特征分界点, 直至得到预设数量的特征
分界点;
所述根据各分组特 征的重要性指标, 从各维度的分组特 征中确定目标 特征, 包括:
基于各分组特征, 确定对应的用户存留信 息量以及用户流失信 息量, 其中, 所述用户存
留信息量是指各分组特征中存留用户的信息熵的大小, 所述用户流 失信息量是指各分组特
征中流失用户的信息熵的大小;
根据所述用户存留信息量以及用户流失信息量, 得到各分组特 征的重要性指标;
确定满足预设指标 条件的分组特 征为目标 特征。
2.根据权利要求1所述的训练方法, 其特征在于, 所述对各维度对应的初始用户特征进
行特征分组处理, 得到对应各维度的初始用户特 征的分组特 征之前, 还 包括:
对各维度的初始用户特征进行数据类型的识别, 确定对应各维度的初始用户特征的数
据类型;
基于各所述数据类型, 对各所述初始用户特征进行数据转换和/或缺失填充预处理, 得
到预处理后的各初始用户特 征;
所述对各维度对应的初始用户特征进行特征分组处理, 得到对应各维度的初始用户特
征的分组特 征, 包括:权 利 要 求 书 1/3 页
2
CN 114676167 B
3
专利 用户存留模型的训练方法、用户存留预测方法和装置
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:16:10上传分享