standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210875772.4 (22)申请日 2022.07.25 (71)申请人 数效 (深圳) 科技有限公司 地址 518100 广东省深圳市宝安区航城街 道三围社区航城大道159号航城创新 创业园A2栋211 (72)发明人 彭飞凌 刘玲玲  (51)Int.Cl. G06F 16/9535(2019.01) G06F 21/62(2013.01) G06K 9/62(2022.01) G06F 9/451(2018.01) G06F 3/0481(2022.01) (54)发明名称 一种用户画像优化方法 (57)摘要 本申请提供一种用户画像优化方法, 包括: 获取用户数据并进行有效性检验; 用户原始数据 进行向量化处理; 根据用户画 像向量构建用户元 画像; 使用用户数据建立一般用户标签画像; 通 过聚类距离判定画像标签确定度; 根据标签内容 划分用户标签种类; 根据元画 像接受度类型决定 用户画像交互方式; 通过分析用户接受度, 判断 可交互画像的类别、 层级和数量; 根据不同场景 类别设计进行不同的标签交互; 用户对自我画像 标签进行交互修正; 针对用户修改后的画像, 进 行双重推荐置信度检验; 根据用户交互行为重新 定义用户画像 接受类型。 权利要求书3页 说明书7页 附图1页 CN 115248896 A 2022.10.28 CN 115248896 A 1.一种用户画像优化方法, 其特 征在于, 所述方法包括: 获取用户数据并进行有效性检验; 用户原始数据进行向量化处理; 根据用户画像向量 构建用户元画像; 使用用户数据建立一般用户标签画像; 通过聚类距离判定画像标签确定 度; 根据标签内容划分用户标签种类; 根据元画像接受度类型决定用户画像交互方式; 通过 分析用户接受度, 判断可 交互画像的类别、 层级和数量; 根据不同场景类别设计进 行不同的 标签交互; 用户对自我画像标签进行 交互修正; 针对用户修改后的画像, 进行双重推荐置信 度检验; 根据用户交 互行为重新定义用户画像接受类型。 2.根据权利要求1所述的方法, 其中, 所述获取用户数据并进行有效性检验, 包括: 绘制用户画像, 需要多维用户数据, 根据用户画像使用需要, 确定数据收集维度; 若用 户不允许访问个人数据, 或不接受进 行交互推荐, 则放弃为用户画像, 放弃进 行用户画像交 互; 若用户允许访问个人数据, 愿意进行交互推荐, 则获取用户基本个人数据, 用户隐私偏 好设置, 以及用户行为习惯数据; 对数据进行预处理, 通过数据冲突判断, 检测用户数据是 否完整, 对用户数据进行 数据清洗 。 3.根据权利要求1所述的方法, 其中, 所述用户原 始数据进行向量 化处理, 包括: 获取用户原始数据, 判断数据是否与用户隐私偏好设置、 画像交互偏好、 年龄、 性别、 学 历、 地域相关, 如果数据相关, 则将数据划分为用户客观数据; 如果数据与浏览内容、 浏览时 间、 浏览频率相关, 则将数据划分为用户行为数据; 用户客观数据采用独热码将离散型变量 数据化, 用向量化处理, 获取用户客观信息向量; 用户行为数据采用统计方法, 对用户行为 数据进行加权求和, 排列用户行为数据, 建立用户行为偏好向量; 将用户客观信息向量和用 户行为偏好向量组合, 构成用户画像向量, 作为用户画像数据基础。 4.根据权利要求1所述的方法, 其中, 所述 根据用户画像向量构建用户元画像, 包括: 随机选择相同数量开启用户画像交互和关闭用户画像交互 的用户; 从选择用户的用户 画像向量中, 获取用户客观数据中用户隐私偏好设置、 画像交互偏好、 年龄、 性别、 学历、 地 域相关数据, 作为用户分类数据; 对用户分类数据进行归一化处理, 去除取值尺度的影响; 将用户分类数据投射到高维数据 空间中, 假设存在高维超平面, 按照用户是否支持进行用 户画像交互维度进行划分; 分别计算用户分类数据与假设超平面之间的距离, 所有用户与 平面之间的距离和记作; 以分类器作为分类条件, 获得高维超平面也就是支持向量; 根据用 户向量与支持向量的距离, 小于设定的阈值, 则划分为不确定型, 大于设定的阈值, 且在支 持向量正向, 则划分为积极型, 大于 设定的阈值, 且在支持向量负向, 则划分为保守型; 不同 类别用户对于用户画像交互接受度不同; 将用户交互支持判断结果和用户基本数据组合, 建立用户元画像。 5.根据权利要求1所述的方法, 其中, 所述使用 用户数据建立 一般用户标签画像, 包括: 对所有用户, 获取用户画像向量, 选择用户画像方向, 针对每一维度 方向数据进行聚类 分析, 获取聚类中心向量; 选择聚类中心设定阈值范围内用户的用户客观信息 向量和用户 行为偏好向量; 将用户客观信息向量按照独热码规则, 反推出离散型变量, 提取离散型变量 名称; 提取用户行为偏好向量中设定阈值排名之前 的用户浏览主题; 对离散型变量名称进 行统计分析, 以重复最多的字词 作为用户基本标签; 对用户浏览主题进 行统计分析, 以重复 最多的浏览主图作为用户行为标签; 将用户基本标签和用户行为标签整合, 构建一般用户 画像。权 利 要 求 书 1/3 页 2 CN 115248896 A 26.根据权利要求1所述的方法, 其中, 所述 通过聚类距离判定画像标签确定度, 包括: 获取聚类中心向量以及用户画像向量, 计算用户画像向量与聚类中心 的欧式距离; 根 据距离大小, 衡量用户标签的确定度; 距离小于设定的阈值, 则判定用户标签为确定性标 签; 距离大于 设定的阈值, 则判定用户标签为模糊类标签; 将标签判定结果添加到一般用户 画像中, 标识一般用户画像的标签, 重构为 一般用户画像。 7.根据权利要求1所述的方法, 其中, 所述 根据标签内容划分用户标签种类, 包括: 对于一般用户画像中的画像标签进行自然语言分析处理, 判断标签是否涉及关键信 息; 若标签涉及营销类信息, 将标签归入营销类标签中; 若标签涉及个人隐私信息, 需要额 外判断标签是否属于确定性标签; 如果属于模糊类标签, 展示可能引起用户反感, 则拒绝在 用户画像交 互过程中展示; 将其 他不涉及关键信息的标签, 归 入通用类标签。 8.根据权利要求1所述的方法, 其中, 所述根据元画像接受度类型 决定用户画像交互方 式, 包括: 根据元画像中将用户划分为保守型, 积极型, 不确定型三类; 不同类型元画像的用户, 对于用户画像交互行为接受度不一致, 需要设计不同的交互方式; 积极型用户愿意接受全 面用户画像交互, 不确定型用户愿意接受部分交互方式, 保守型不愿意接受公开用户画像 交互方式; 对于积极型用户, 提供展示用户画像标签, 增加、 减少用户标签机会, 以及用户自 定义画像标签的主动交互机会; 对于不确定型用户, 选择展示部 分用户画像标签、 增删用户 标签的主动交互方式; 对于保守型用户, 由系统进 行后台数据画像, 用户对不满意标签进 行 删除, 但无法添加和修改标签, 减少用户画像交互参与度, 由画像系统收集数据, 调整用户 画像; 对于模糊类、 个人隐私、 营销类标签交 互, 提供弹窗询问的交 互模式。 9.根据权利要求1所述的方法, 其中, 所述通过分析用户接受度, 判断可交互画像的类 别、 层级和数量, 包括: 根据用户对于用户画像交互 的元画像分类, 每个用户展示出的用户画像标签 内容和详 细程度也有 所不同; 对于 保守型用户, 不进 行主动用户画像交互, 推荐算法按照设置正常运 行; 对于不确定型用户, 提供营销类标签, 通用类标签, 不提供隐私类标签; 对于积极型用 户, 提供所有类别标签; 根据用户接受度判定用户画像交互标签提供数量和标签层级, 接受 度越高, 标签提供 数量越多, 标签层级越深入。 10.根据权利要求1所述的方法, 其中, 所述根据不同场景类别设计进行不同的标签交 互, 包括: 采集交互场景的地址信息, 从地址信息数据库中检索判断是否为常见场景, 识别场景 类型; 若地址信息不在检索范围内, 采集进行用户画像交互的场景信息、 标题文字, 通过统 计分析识别得出出现频率最高的文字, 判断场景主题; 根据主题将交互场景进行划分成为 营销类、 隐私类、 通用类场景, 不同的场景主题进行不同类别标签交互; 若用户存在与场景 主题一致的标签, 则在此类场景下, 进行标签交互; 根据用户元画像接受度类型, 选择对应 的交互方式。 11.根据权利要求1所述的方法, 其中, 所述用户对自我画像标签进行交 互修正, 包括: 用户通过主动修改和被动调整两种方式影响修改个人画像; 系统主动进行用户画像交 互, 根据一般用户画像给出确定性用户标签, 通过弹窗确认或者信息栏展示方式呈现; 用户 根据个人兴趣爱好和基本信息, 主动选择适合自身 形象的画像标签; 对于积极型用户, 提供权 利 要 求 书 2/3 页 3 CN 115248896 A 3

PDF文档 专利 一种用户画像优化方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种用户画像优化方法 第 1 页 专利 一种用户画像优化方法 第 2 页 专利 一种用户画像优化方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:50上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。