(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211183533.9
(22)申请日 2022.09.27
(71)申请人 中国建设银行股份有限公司
地址 100033 北京市西城区金融大街25号
申请人 建信金融科技有限责任公司
(72)发明人 张茂发 贾国琛 韦立鹏 尹泽阳
刘振
(74)专利代理 机构 北京东方亿 思知识产权代理
有限责任公司 1 1258
专利代理师 陈思凡
(51)Int.Cl.
G06Q 10/06(2012.01)
G06K 9/62(2022.01)
G06F 40/284(2020.01)
G06F 40/289(2020.01)
(54)发明名称
企业投诉风险的确定方法、 装置、 设备及计
算机存储介质
(57)摘要
本申请公开了一种企业投诉风险的确定方
法、 装置、 设备及计算机存储介质。 该方法包括获
取企业的第一投诉风险信息和第二投诉风险信
息中的至少一种; 提取第一投诉风险信息的关键
词和第二投诉风险信息的特征词; 根据关键词和
特征词, 分别计算关键词和特征词对应的数值;
根据关键词和特征词, 通过预设决策树, 得到预
设决策树中终结点对应的目标关键词和目标特
征词; 计算目标关键词对应的数值和目标特征词
对应的数值的平均值, 得到预设决策树中终结点
对应的第一预测值; 根据第一预测值, 确定企业
投诉风险的第一预测概率。 根据本申请实施例,
能够提高确定企业投诉风险的精确度。
权利要求书3页 说明书12页 附图2页
CN 115511298 A
2022.12.23
CN 115511298 A
1.一种企业投诉风险的确定方法, 其特 征在于, 包括:
获取企业的第 一投诉风险信 息和第二投诉风险信 息中的至少一种, 所述第 一投诉风险
信息包括投诉举报信息和监管投诉信息中的至少一种, 所述第二投诉风险信息包括 企业信
息、 信用评估信息、 行政检查行为记录信息、 行政强制行为记录信息或行政处罚行为记录信
息中的至少一种;
提取所述第一投诉风险信息的关键词和所述第二投诉风险信息的特 征词;
根据所述关键词和所述特 征词, 分别计算所述关键词和所述特 征词对应的数值;
根据所述关键词和所述特征词, 通过预设决策树, 得到所述预设决策树中终结点对应
的目标关键词和目标 特征词;
计算所述目标关键词对应的数值和所述目标特征词对应的数值的平均值, 得到所述预
设决策树中终结点对应的第一预测值;
根据所述第一预测值, 确定企业投诉风险的第一预测概 率。
2.根据权利要求1所述的方法, 其特征在于, 获取所述第一投诉风险信息时, 所述根据
所述关键词, 计算所述关键词对应的数值, 包括:
基于独热编码, 将所述关键词向量 化为二进制词向量;
根据所述关键词对应的二进制词向量, 确定所述关键词对应的数值。
3.根据权利要求1所述的方法, 其特征在于, 获取所述第二投诉风险信息时; 所述特征
词包括企业信用评估等级; 所述 根据所述特 征词, 计算所述特 征词对应的数值, 包括:
基于标签编码, 根据所述企业信用评估等级, 得到所述企业信用评估等级对应的编码;
根据所述编码, 确定所述企业信用评估等级对应的数值。
4.根据权利要求1所述的方法, 其特征在于, 获取所述第二投诉风险信息时, 所述特征
词包括机构类别和业务范围类型中的至少一种, 所述根据所述特征词, 计算所述特征词对
应的数值, 包括:
基于独热编码, 将所述机构类别和所述业务范围类型中的至少一种向量化为二进制词
向量;
根据所述机构类别和所述业务范围类型中的至少一种对应的二进制词向量, 确定所述
机构类别和所述 业务范围类型中的至少一种对应的数值。
5.根据权利要求1所述的方法, 其特征在于, 获取所述第二投诉风险信息时, 所述特征
词包括经营期限、 企业信用评估分数或企业注册资本分箱中的至少一种, 所述根据所述特
征词, 计算所述特 征词对应的数值, 包括:
将所述经营期限、 所述企业信用评估分数或所述企业注册资本分箱中的至少一种 进行
分段, 得到所述经营期限、 所述企业信用评估分数或所述企业注册资本分箱中的至少一种
对应的数值。
6.根据权利要求2至5中任意一项所述的方法, 其特征在于, 在所述提取所述第一投诉
风险信息的关键词和所述第二投诉风险信息的特 征词之后, 所述方法还 包括:
根据预设衍生类型、 所述预设衍生类型对应的衍生规则, 以及所述关键词和所述特征
词, 生成衍生特征词, 以用于根据所述关键词、 所述特征词和所述衍生特征词, 分别计算所
述关键词、 所述特征词和所述衍生特征词对应的数值, 再根据所述关键词、 所述特征词和所
述衍生特征词, 通过预设决策树, 得到所述预设决策树中终结点对应的目标关键词、 目标特权 利 要 求 书 1/3 页
2
CN 115511298 A
2征词和目标衍生特征词, 再计算所述 目标关键词对应的数值、 所述 目标特征词对应的数值
和所述衍生特征词对应的数值的平均值, 得到所述预设决策树中终结点对应的第二预测
值, 再根据所述第二预测值, 确定企业投诉风险的第二预测概 率。
7.根据权利要求1至5中任意一项所述的方法, 其特征在于, 在所述根据所述关键词和
所述特征词, 通过预设决策树, 得到所述预设决策树中终结点对应的目标关键词和目标特
征词之前, 所述方法包括:
获取企业的历史投诉风险信息, 所述历史投诉风险信息包括历史投诉举报信息、 历史
监管投诉信息、 历史企业信息、 历史信用评估信息、 历史行政检查行为记录信息、 历史行政
强制行为记录信息或历史行政处罚行为记录信息中的至少一种;
提取所述历史 投诉风险信息的关键词和特 征词;
根据所述历史投诉风险信 息的关键词和特征词, 分别计算所述历史投诉风险信 息的关
键词和特 征词对应的数值;
选取所述历史投诉风险信 息的关键词和特征词n中对应数值最大的特征为决策树的决
策节点i, 得到所述决策树的机会节点J和机会节点j;
选取所述J和所述j中对应的预测误差较小的机会节点为所述决策树的决策节点i ‑1,
得到所述决策树的机会节点J ‑1和机会节点j ‑1, 遍历n个关键词和特征词, 直至预测误差小
于或等于预测误差阈值, 得到所述预设决策树。
8.根据权利要求1至6 中任意一项所述的方法, 其特征在于, 根据 所述第一预测值, 确定
企业投诉风险的预测概 率, 包括:
基于预测值和预测概率的对应关系, 确定所述第一预测值对应的预测概率, 得到企业
投诉风险的第一预测概 率。
9.一种企业投诉风险的确定装置, 其特 征在于, 所述装置包括:
获取模块, 用于获取企业的第一投诉风险信息和第二投诉风险信息中的至少一种, 所
述第一投诉风险信息包括投诉举报信息和监管投诉信息中的至少一种, 所述第二投诉风险
信息包括企业信息、 信用评估信息、 行政检查行为记录信息、 行政强制行为记录信息或行政
处罚行为记录信息中的至少一种;
提取模块, 用于提取所述第 一投诉风险信 息的关键词和所述第 二投诉风险信 息的特征
词;
计算模块, 用于根据所述关键词和所述特征词, 分别计算所述关键词和所述特征词对
应的数值;
得到模块, 用于根据 所述关键词和所述特征词, 通过预设决策树, 得到所述预设决策树
中终结点对应的目标关键词和目标 特征词;
所述计算模块, 还用于计算所述目标关键词对应的数值和所述目标特征词对应的数值
的平均值, 得到所述预设决策树中终结点对应的第一预测值;
确定模块, 用于根据所述第一预测值, 确定企业投诉风险的第一预测概 率。
10.一种企业投诉风险的确定设备, 其特征在于, 所述设备包括: 处理器以及存储有计
算机程序指令的存 储器;
所述处理器执行所述计算机程序指令时实现如权利要求1 ‑8任意一项所述的方法。
11.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机权 利 要 求 书 2/3 页
3
CN 115511298 A
3
专利 企业投诉风险的确定方法、装置、设备及计算机存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:52上传分享