专利 一种用户画像优化方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210875772.4 (22)申请日 2022.07.25 (71)申请人数效（深圳）科技有限公司地址 518100 广东省深圳市宝安区航城街道三围社区航城大道159号航城创新创业园A2栋211 (72)发明人彭飞凌　刘玲玲　 (51)Int.Cl. G06F 16/9535(2019.01) G06F 21/62(2013.01) G06K 9/62(2022.01) G06F 9/451(2018.01) G06F 3/0481(2022.01) (54)发明名称一种用户画像优化方法 (57)摘要本申请提供一种用户画像优化方法，包括：获取用户数据并进行有效性检验；用户原始数据进行向量化处理；根据用户画像向量构建用户元画像；使用用户数据建立一般用户标签画像；通过聚类距离判定画像标签确定度；根据标签内容划分用户标签种类；根据元画像接受度类型决定用户画像交互方式；通过分析用户接受度，判断可交互画像的类别、层级和数量；根据不同场景类别设计进行不同的标签交互；用户对自我画像标签进行交互修正；针对用户修改后的画像，进行双重推荐置信度检验；根据用户交互行为重新定义用户画像接受类型。权利要求书3页说明书7页附图1页 CN 115248896 A 2022.10.28 CN 115248896 A 1.一种用户画像优化方法，其特征在于，所述方法包括：获取用户数据并进行有效性检验；用户原始数据进行向量化处理；根据用户画像向量构建用户元画像；使用用户数据建立一般用户标签画像；通过聚类距离判定画像标签确定度；根据标签内容划分用户标签种类；根据元画像接受度类型决定用户画像交互方式；通过分析用户接受度，判断可交互画像的类别、层级和数量；根据不同场景类别设计进行不同的标签交互；用户对自我画像标签进行交互修正；针对用户修改后的画像，进行双重推荐置信度检验；根据用户交互行为重新定义用户画像接受类型。 2.根据权利要求1所述的方法，其中，所述获取用户数据并进行有效性检验，包括: 绘制用户画像，需要多维用户数据，根据用户画像使用需要，确定数据收集维度；若用户不允许访问个人数据，或不接受进行交互推荐，则放弃为用户画像，放弃进行用户画像交互；若用户允许访问个人数据，愿意进行交互推荐，则获取用户基本个人数据，用户隐私偏好设置，以及用户行为习惯数据；对数据进行预处理，通过数据冲突判断，检测用户数据是否完整，对用户数据进行数据清洗。 3.根据权利要求1所述的方法，其中，所述用户原始数据进行向量化处理，包括: 获取用户原始数据，判断数据是否与用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关，如果数据相关，则将数据划分为用户客观数据；如果数据与浏览内容、浏览时间、浏览频率相关，则将数据划分为用户行为数据；用户客观数据采用独热码将离散型变量数据化，用向量化处理，获取用户客观信息向量；用户行为数据采用统计方法，对用户行为数据进行加权求和，排列用户行为数据，建立用户行为偏好向量；将用户客观信息向量和用户行为偏好向量组合，构成用户画像向量，作为用户画像数据基础。 4.根据权利要求1所述的方法，其中，所述根据用户画像向量构建用户元画像，包括: 随机选择相同数量开启用户画像交互和关闭用户画像交互的用户；从选择用户的用户画像向量中，获取用户客观数据中用户隐私偏好设置、画像交互偏好、年龄、性别、学历、地域相关数据，作为用户分类数据；对用户分类数据进行归一化处理，去除取值尺度的影响；将用户分类数据投射到高维数据空间中，假设存在高维超平面，按照用户是否支持进行用户画像交互维度进行划分；分别计算用户分类数据与假设超平面之间的距离，所有用户与平面之间的距离和记作；以分类器作为分类条件，获得高维超平面也就是支持向量；根据用户向量与支持向量的距离，小于设定的阈值，则划分为不确定型，大于设定的阈值，且在支持向量正向，则划分为积极型，大于设定的阈值，且在支持向量负向，则划分为保守型；不同类别用户对于用户画像交互接受度不同；将用户交互支持判断结果和用户基本数据组合，建立用户元画像。 5.根据权利要求1所述的方法，其中，所述使用用户数据建立一般用户标签画像，包括: 对所有用户，获取用户画像向量，选择用户画像方向，针对每一维度方向数据进行聚类分析，获取聚类中心向量；选择聚类中心设定阈值范围内用户的用户客观信息向量和用户行为偏好向量；将用户客观信息向量按照独热码规则，反推出离散型变量，提取离散型变量名称；提取用户行为偏好向量中设定阈值排名之前的用户浏览主题；对离散型变量名称进行统计分析，以重复最多的字词作为用户基本标签；对用户浏览主题进行统计分析，以重复最多的浏览主图作为用户行为标签；将用户基本标签和用户行为标签整合，构建一般用户画像。权　利　要　求　书 1/3 页 2 CN 115248896 A 26.根据权利要求1所述的方法，其中，所述通过聚类距离判定画像标签确定度，包括: 获取聚类中心向量以及用户画像向量，计算用户画像向量与聚类中心的欧式距离；根据距离大小，衡量用户标签的确定度；距离小于设定的阈值，则判定用户标签为确定性标签；距离大于设定的阈值，则判定用户标签为模糊类标签；将标签判定结果添加到一般用户画像中，标识一般用户画像的标签，重构为一般用户画像。 7.根据权利要求1所述的方法，其中，所述根据标签内容划分用户标签种类，包括: 对于一般用户画像中的画像标签进行自然语言分析处理，判断标签是否涉及关键信息；若标签涉及营销类信息，将标签归入营销类标签中；若标签涉及个人隐私信息，需要额外判断标签是否属于确定性标签；如果属于模糊类标签，展示可能引起用户反感，则拒绝在用户画像交互过程中展示；将其他不涉及关键信息的标签，归入通用类标签。 8.根据权利要求1所述的方法，其中，所述根据元画像接受度类型决定用户画像交互方式，包括: 根据元画像中将用户划分为保守型，积极型，不确定型三类；不同类型元画像的用户，对于用户画像交互行为接受度不一致，需要设计不同的交互方式；积极型用户愿意接受全面用户画像交互，不确定型用户愿意接受部分交互方式，保守型不愿意接受公开用户画像交互方式；对于积极型用户，提供展示用户画像标签，增加、减少用户标签机会，以及用户自定义画像标签的主动交互机会；对于不确定型用户，选择展示部分用户画像标签、增删用户标签的主动交互方式；对于保守型用户，由系统进行后台数据画像，用户对不满意标签进行删除，但无法添加和修改标签，减少用户画像交互参与度，由画像系统收集数据，调整用户画像；对于模糊类、个人隐私、营销类标签交互，提供弹窗询问的交互模式。 9.根据权利要求1所述的方法，其中，所述通过分析用户接受度，判断可交互画像的类别、层级和数量，包括: 根据用户对于用户画像交互的元画像分类，每个用户展示出的用户画像标签内容和详细程度也有所不同；对于保守型用户，不进行主动用户画像交互，推荐算法按照设置正常运行；对于不确定型用户，提供营销类标签，通用类标签，不提供隐私类标签；对于积极型用户，提供所有类别标签；根据用户接受度判定用户画像交互标签提供数量和标签层级，接受度越高，标签提供数量越多，标签层级越深入。 10.根据权利要求1所述的方法，其中，所述根据不同场景类别设计进行不同的标签交互，包括: 采集交互场景的地址信息，从地址信息数据库中检索判断是否为常见场景，识别场景类型；若地址信息不在检索范围内，采集进行用户画像交互的场景信息、标题文字，通过统计分析识别得出出现频率最高的文字，判断场景主题；根据主题将交互场景进行划分成为营销类、隐私类、通用类场景，不同的场景主题进行不同类别标签交互；若用户存在与场景主题一致的标签，则在此类场景下，进行标签交互；根据用户元画像接受度类型，选择对应的交互方式。 11.根据权利要求1所述的方法，其中，所述用户对自我画像标签进行交互修正，包括: 用户通过主动修改和被动调整两种方式影响修改个人画像；系统主动进行用户画像交互，根据一般用户画像给出确定性用户标签，通过弹窗确认或者信息栏展示方式呈现；用户根据个人兴趣爱好和基本信息，主动选择适合自身形象的画像标签；对于积极型用户，提供权　利　要　求　书 2/3 页 3 CN 115248896 A 3

专利 一种用户画像优化方法

专利一种用户画像优化方法