(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210875772.4
(22)申请日 2022.07.25
(71)申请人 数效 (深圳) 科技有限公司
地址 518100 广东省深圳市宝安区航城街
道三围社区航城大道159号航城创新
创业园A2栋211
(72)发明人 彭飞凌 刘玲玲
(51)Int.Cl.
G06F 16/9535(2019.01)
G06F 21/62(2013.01)
G06K 9/62(2022.01)
G06F 9/451(2018.01)
G06F 3/0481(2022.01)
(54)发明名称
一种用户画像优化方法
(57)摘要
本申请提供一种用户画像优化方法, 包括:
获取用户数据并进行有效性检验; 用户原始数据
进行向量化处理; 根据用户画 像向量构建用户元
画像; 使用用户数据建立一般用户标签画像; 通
过聚类距离判定画像标签确定度; 根据标签内容
划分用户标签种类; 根据元画 像接受度类型决定
用户画像交互方式; 通过分析用户接受度, 判断
可交互画像的类别、 层级和数量; 根据不同场景
类别设计进行不同的标签交互; 用户对自我画像
标签进行交互修正; 针对用户修改后的画像, 进
行双重推荐置信度检验; 根据用户交互行为重新
定义用户画像 接受类型。
权利要求书3页 说明书7页 附图1页
CN 115248896 A
2022.10.28
CN 115248896 A
1.一种用户画像优化方法, 其特 征在于, 所述方法包括:
获取用户数据并进行有效性检验; 用户原始数据进行向量化处理; 根据用户画像向量
构建用户元画像; 使用用户数据建立一般用户标签画像; 通过聚类距离判定画像标签确定
度; 根据标签内容划分用户标签种类; 根据元画像接受度类型决定用户画像交互方式; 通过
分析用户接受度, 判断可 交互画像的类别、 层级和数量; 根据不同场景类别设计进 行不同的
标签交互; 用户对自我画像标签进行 交互修正; 针对用户修改后的画像, 进行双重推荐置信
度检验; 根据用户交 互行为重新定义用户画像接受类型。
2.根据权利要求1所述的方法, 其中, 所述获取用户数据并进行有效性检验, 包括:
绘制用户画像, 需要多维用户数据, 根据用户画像使用需要, 确定数据收集维度; 若用
户不允许访问个人数据, 或不接受进 行交互推荐, 则放弃为用户画像, 放弃进 行用户画像交
互; 若用户允许访问个人数据, 愿意进行交互推荐, 则获取用户基本个人数据, 用户隐私偏
好设置, 以及用户行为习惯数据; 对数据进行预处理, 通过数据冲突判断, 检测用户数据是
否完整, 对用户数据进行 数据清洗 。
3.根据权利要求1所述的方法, 其中, 所述用户原 始数据进行向量 化处理, 包括:
获取用户原始数据, 判断数据是否与用户隐私偏好设置、 画像交互偏好、 年龄、 性别、 学
历、 地域相关, 如果数据相关, 则将数据划分为用户客观数据; 如果数据与浏览内容、 浏览时
间、 浏览频率相关, 则将数据划分为用户行为数据; 用户客观数据采用独热码将离散型变量
数据化, 用向量化处理, 获取用户客观信息向量; 用户行为数据采用统计方法, 对用户行为
数据进行加权求和, 排列用户行为数据, 建立用户行为偏好向量; 将用户客观信息向量和用
户行为偏好向量组合, 构成用户画像向量, 作为用户画像数据基础。
4.根据权利要求1所述的方法, 其中, 所述 根据用户画像向量构建用户元画像, 包括:
随机选择相同数量开启用户画像交互和关闭用户画像交互 的用户; 从选择用户的用户
画像向量中, 获取用户客观数据中用户隐私偏好设置、 画像交互偏好、 年龄、 性别、 学历、 地
域相关数据, 作为用户分类数据; 对用户分类数据进行归一化处理, 去除取值尺度的影响;
将用户分类数据投射到高维数据 空间中, 假设存在高维超平面, 按照用户是否支持进行用
户画像交互维度进行划分; 分别计算用户分类数据与假设超平面之间的距离, 所有用户与
平面之间的距离和记作; 以分类器作为分类条件, 获得高维超平面也就是支持向量; 根据用
户向量与支持向量的距离, 小于设定的阈值, 则划分为不确定型, 大于设定的阈值, 且在支
持向量正向, 则划分为积极型, 大于 设定的阈值, 且在支持向量负向, 则划分为保守型; 不同
类别用户对于用户画像交互接受度不同; 将用户交互支持判断结果和用户基本数据组合,
建立用户元画像。
5.根据权利要求1所述的方法, 其中, 所述使用 用户数据建立 一般用户标签画像, 包括:
对所有用户, 获取用户画像向量, 选择用户画像方向, 针对每一维度 方向数据进行聚类
分析, 获取聚类中心向量; 选择聚类中心设定阈值范围内用户的用户客观信息 向量和用户
行为偏好向量; 将用户客观信息向量按照独热码规则, 反推出离散型变量, 提取离散型变量
名称; 提取用户行为偏好向量中设定阈值排名之前 的用户浏览主题; 对离散型变量名称进
行统计分析, 以重复最多的字词 作为用户基本标签; 对用户浏览主题进 行统计分析, 以重复
最多的浏览主图作为用户行为标签; 将用户基本标签和用户行为标签整合, 构建一般用户
画像。权 利 要 求 书 1/3 页
2
CN 115248896 A
26.根据权利要求1所述的方法, 其中, 所述 通过聚类距离判定画像标签确定度, 包括:
获取聚类中心向量以及用户画像向量, 计算用户画像向量与聚类中心 的欧式距离; 根
据距离大小, 衡量用户标签的确定度; 距离小于设定的阈值, 则判定用户标签为确定性标
签; 距离大于 设定的阈值, 则判定用户标签为模糊类标签; 将标签判定结果添加到一般用户
画像中, 标识一般用户画像的标签, 重构为 一般用户画像。
7.根据权利要求1所述的方法, 其中, 所述 根据标签内容划分用户标签种类, 包括:
对于一般用户画像中的画像标签进行自然语言分析处理, 判断标签是否涉及关键信
息; 若标签涉及营销类信息, 将标签归入营销类标签中; 若标签涉及个人隐私信息, 需要额
外判断标签是否属于确定性标签; 如果属于模糊类标签, 展示可能引起用户反感, 则拒绝在
用户画像交 互过程中展示; 将其 他不涉及关键信息的标签, 归 入通用类标签。
8.根据权利要求1所述的方法, 其中, 所述根据元画像接受度类型 决定用户画像交互方
式, 包括:
根据元画像中将用户划分为保守型, 积极型, 不确定型三类; 不同类型元画像的用户,
对于用户画像交互行为接受度不一致, 需要设计不同的交互方式; 积极型用户愿意接受全
面用户画像交互, 不确定型用户愿意接受部分交互方式, 保守型不愿意接受公开用户画像
交互方式; 对于积极型用户, 提供展示用户画像标签, 增加、 减少用户标签机会, 以及用户自
定义画像标签的主动交互机会; 对于不确定型用户, 选择展示部 分用户画像标签、 增删用户
标签的主动交互方式; 对于保守型用户, 由系统进 行后台数据画像, 用户对不满意标签进 行
删除, 但无法添加和修改标签, 减少用户画像交互参与度, 由画像系统收集数据, 调整用户
画像; 对于模糊类、 个人隐私、 营销类标签交 互, 提供弹窗询问的交 互模式。
9.根据权利要求1所述的方法, 其中, 所述通过分析用户接受度, 判断可交互画像的类
别、 层级和数量, 包括:
根据用户对于用户画像交互 的元画像分类, 每个用户展示出的用户画像标签 内容和详
细程度也有 所不同; 对于 保守型用户, 不进 行主动用户画像交互, 推荐算法按照设置正常运
行; 对于不确定型用户, 提供营销类标签, 通用类标签, 不提供隐私类标签; 对于积极型用
户, 提供所有类别标签; 根据用户接受度判定用户画像交互标签提供数量和标签层级, 接受
度越高, 标签提供 数量越多, 标签层级越深入。
10.根据权利要求1所述的方法, 其中, 所述根据不同场景类别设计进行不同的标签交
互, 包括:
采集交互场景的地址信息, 从地址信息数据库中检索判断是否为常见场景, 识别场景
类型; 若地址信息不在检索范围内, 采集进行用户画像交互的场景信息、 标题文字, 通过统
计分析识别得出出现频率最高的文字, 判断场景主题; 根据主题将交互场景进行划分成为
营销类、 隐私类、 通用类场景, 不同的场景主题进行不同类别标签交互; 若用户存在与场景
主题一致的标签, 则在此类场景下, 进行标签交互; 根据用户元画像接受度类型, 选择对应
的交互方式。
11.根据权利要求1所述的方法, 其中, 所述用户对自我画像标签进行交 互修正, 包括:
用户通过主动修改和被动调整两种方式影响修改个人画像; 系统主动进行用户画像交
互, 根据一般用户画像给出确定性用户标签, 通过弹窗确认或者信息栏展示方式呈现; 用户
根据个人兴趣爱好和基本信息, 主动选择适合自身 形象的画像标签; 对于积极型用户, 提供权 利 要 求 书 2/3 页
3
CN 115248896 A
3
专利 一种用户画像优化方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:34:50上传分享