(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211279020.8 (22)申请日 2022.10.19 (71)申请人 山东省商业 集团有限公司 地址 250000 山东省济南市历下区经十路 9777号 (72)发明人 王强 娄海凤 王文雯  (74)专利代理 机构 山东明宇知信知识产权代理 事务所(普通 合伙) 3732 9 专利代理师 张永辉 (51)Int.Cl. G06F 16/9535(2019.01) G06F 40/194(2020.01) G06F 40/30(2020.01) G06K 9/62(2022.01) G06N 3/08(2006.01)G06N 20/00(2019.01) (54)发明名称 一种多业态企业潜在客户识别方法 (57)摘要 本发明提供一种多业态企业潜在客户识别 方法, 属于 数据处理技术领域, 包括: 将各业态的 会员数据进行数据融合; 基于机器学习算法技术 识别目标业态的潜在价值的融合会员; 基于深度 学习预测目标业态中单一会员的潜在价值; 建立 推荐模型, 根据会员的价值等级向目标业态中的 会员发送推荐信息; 根据用户针对推荐信息的反 馈内容和反馈数量, 更新会员在目标业态的价值 等级; 根据价值等级变化情况, 对反馈的多篇推 荐信息的内容相似度进行分析。 本发 明能够识别 出目标业态潜在价值会员的愿景的可行性方法, 帮助产业进行 更精准的会员营销。 权利要求书3页 说明书10页 附图1页 CN 115357802 A 2022.11.18 CN 115357802 A 1.一种多业态企业潜在客户识别方法, 其特 征在于, 包括: 将各业态的会员数据进行数据融合, 包括: 利用用户唯一标识技术, 将各业态的会员数 据进行数据融合, 确定至少共同存在于任意两个业态的融合会员, 以及仅存在于任意一业 态中的单一会员; 利用文本识别技术实现标签统一, 根据融合会员的会员标签构造全业态 会员全方位画像; 基于机器学习算法技术识别目标业态的潜在价值的融合会员, 包括: 根据融合会员的 全方位画像, 采用K ‑Means聚类算法对融合会员分配价值等级; 根据分配的融合会员的价值 等级, 确定目标业态中具有潜在价 值的融合会员; 基于深度学习预测目标业态中单一会员的潜在价 值, 包括: 以融合会员群体为训练集、 测试集, 以目标业态的会员标签为特征变量, 以融合会员在 目标业态的价值等级为响应变量, 在训练集上基于stacking建立多分类预测模型, 使用 XGBoost、 LightGBM、 GDBT算法, 利用训练集进行建模、 拟合、 预测, 完成第一层模型, 再将第 一层模型的预测结果作为输入 特征变量, 且将价值等级作为响应变量, 以Bayes分类器作为 元分类器, Bayes分类器经过训练之后, 得到完整的多分类预测模型; 在测试集上对所建预 测模型进行验证, 并将验证通过 的预测模型运用到目标业态中的单一会员上, 以单一会员 在目标业态的价值等级为响应变量, 以目标业态的会员标签为特征变量, 预测目标业态中 单一会员的价 值等级; 建立推荐模型, 根据会员的价值等级向目标业态中的会员发送推荐信息; 根据用户针 对推荐信息的反馈内容和反馈数量, 更新会员 在目标业态的价值等级; 根据价值等级变化 情况, 对反馈的多篇推荐信息的相似度进行分析, 根据相似推荐信息的共同点更新会员全 方位画像。 2.根据权利要求1所述的方法, 其特征在于, 所述利用文本识别技术实现标签统一, 根 据融合会员的会员标签构造全业态会员全方位画像, 包括: 基于全业态数据构建会员全方位的画像, 设定会员标签包括事实标签和分析类标签, 所述事实标签包括属性标签和行为标签; 针对各业态存储会员 信息的数据库进行文本识别, 通过字符特征提取的方式获取符合 会员标签的内容, 填充到对应的会员标签中。 3.根据权利要求1所述的方法, 其特征在于, 所述采用K ‑Means聚类算法对融合会员分 配价值等级, 包括: 步骤1、 获取任意一个业态的数据集Data1数据, 利用归一化公式进行归一化处理, 归一 化公式为: ; 其中, X为Data1中t个标签中的任一标签, n为数据集Data1中样本数量, 归一化处理后的 样本为m1,m2,…,mn, 其中mi=(mi1,mi2,...,mit); 步骤2、 获取 预设的聚类 类别个数 K; 步骤3、 随机选定一个样本点作为第一个聚类中心C1, 其值记作m1计算第一个聚类中心 c1与其余n‑1个样本点的欧氏距离: ;权 利 要 求 书 1/3 页 2 CN 115357802 A 2从这n‑1个距离中选择最大距离所对应的样本点即 所对应样本点作 为第二个聚类中心C2, 即 , 其值记作 m2, 计算C2与n‑2个样本m3,…,mn的欧 式距离D(c2,mi),i=3,4,n; 分别比较m3,…,mn到C1和C2的距离, 选m3,…,mn到C1和C2的最小距离的最大值所对应的 样本点作为第三个聚类中心C3, , 依次进行下去, 直到选取出k个 聚类中心{c1,c2,…,ck}为止, 并将这 k个聚类中心所对应的类记为{C1,C2,…,Ck}; 步骤4、 分别计算每个样本点与k个聚类中心的欧式距离D(ck,mi), 将样本点归到最小距 离所对应的类别中, 即归到 所对应的类别中, 重新分配后的类别仍记为 {C1,C2,…,Ck}, 此时每 个类别中样本的个数记为{n1,n2,…,nn}; 步骤5、 计算每个类别中所有样本点的平均值 , 并将其作为新的聚类中 心, 仍记为{c1,c2,…,ck}; 步骤6、 给定容忍阈值 ε, 计算代价 函数值:  ; 其中mi(k)的上标(k)表示第k类, 计算前后两次迭代的代价函数值的减少量, 若减少量低 于容忍阈值 ε, 则判断算法收敛, 则该聚类算法结束; 若不低于容忍阈值 ε, 则算法不收敛, 转 到步骤4进行循环迭代, 直到 聚类算法收敛, 最终所得{C1,C2,…,Ck}作为k个融合会员价值 等级。 4.根据权利要求1所述的方法, 其特征在于, 所述建立推荐模型, 根据会员的价值等级 向目标业态中的会员发送推荐信息, 包括: 建立推荐模型, 根据目标业态中会员的价值等级确定推荐信息的发送渠道和发送周 期, 所述推荐模 型为S=W*X+E*Y, 其中, S为价值等级, W为预设的发送渠道的权重值, E为发送 周期的权重值; X为输出的发送渠道的预设值, Y为输出的发送周期对应的预设值, X、 Y为正 整数; 得到至少一个组合解的X、 Y, 在多个组合解中选择X、 Y差值最小的一组作 为最终XY进行 输出。 5.根据权利要求1所述的方法, 其特征在于, 所述根据用户针对推荐信 息的反馈内容和 反馈数量, 更新会员在目标业态的价 值等级, 包括: 对反馈内容设定至少一个反馈等级R, 并设置反馈等级R的标记a, 标记a为 “+”表示接受 推荐, 标记a为 “‑”表示不接收推荐; 定期接收用户在上一周期内针对该推荐信息的反馈内容和反馈次数F, 根据反馈内容 确定反馈等级R, 输入反馈模型:  T=[(a*R*F)/e], 其中, [ ]表示取整函数, e为等级变化阈 值, T为该周期用户在目标业态中价 值等级的变化 量。 6.根据权利要求1所述的方法, 其特征在于, 所述根据价值等级变化情况, 对反馈的多权 利 要 求 书 2/3 页 3 CN 115357802 A 3

PDF文档 专利 一种多业态企业潜在客户识别方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多业态企业潜在客户识别方法 第 1 页 专利 一种多业态企业潜在客户识别方法 第 2 页 专利 一种多业态企业潜在客户识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:47上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。