(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211189830.4
(22)申请日 2022.09.28
(71)申请人 中国建设银行股份有限公司
地址 100033 北京市西城区金融大街25号
申请人 建信金融科技有限责任公司
(72)发明人 韦立鹏 贾国琛 张茂发 尹泽阳
刘振
(74)专利代理 机构 北京东方亿 思知识产权代理
有限责任公司 1 1258
专利代理师 桂艳球
(51)Int.Cl.
G06Q 10/06(2012.01)
G06F 40/284(2020.01)
G06N 3/08(2006.01)
(54)发明名称
企业的风险评估 方法、 装置、 设备、 存储介质
及程序产品
(57)摘要
本申请公开了一种企业的风险评估方法、 装
置、 设备、 存储介质及程序产品。 该方法包括: 根
据目标企业的舆情信息确定目标 企业的标签, 获
取目标企业的第一特征信息, 第一特征信息为距
离当前的时长不超过第一时长阈值的特征信息,
第一特征信息包括第一监管信息、 第一信用信
息、 第一投诉举报信息和第一舆情信息中的一项
或多项, 从第一特征信息和标签中提取特征字
段, 将特征字段输入训练好的决策树模型, 得到
目标企业对应的风险评估结果。 根据本申请实施
例, 能够提升 针对企业的风险评估的准确性。
权利要求书2页 说明书11页 附图4页
CN 115392787 A
2022.11.25
CN 115392787 A
1.一种风险评估方法, 其特 征在于, 所述方法包括:
根据获取的网络信息构建至少一个特 征词;
根据所述至少一个特 征词中各 特征词的垂直领域构建至少一个特 征词库;
将目标企业的舆情信息拆分为P个第一分词, 并根据词性对所述P个第一分词进行筛
选, 得到至少一个第二分词, P为 正整数;
根据所述至少一个第二分词和所述至少一个特 征词库确定所述目标企业的标签;
获取第一特征信 息, 所述第 一特征信 息为所述目标企业的与第 一时间段对应的特征信
息, 所述特 征信息包括 监管信息、 信用信息、 投诉举报信息和舆情信息中的至少一项;
从所述第一特 征信息和所述目标企业的标签中提取 所述目标企业的特 征字段;
将所述目标企业的特征字段输入训练好的决策树模型, 得到所述目标企业对应的风险
评估结果。
2.根据权利要求1所述的企业的风险评估方法, 其特征在于, 所述将所述特征字段输入
训练好的决策树模型, 得到所述目标企业对应的风险评估结果之前, 所述方法还 包括:
根据N个企业的舆情信息确定所述 N个企业的标签, N 为正整数;
获取第二特征信 息, 所述第 二特征信 息为所述N个企业的第 二时间段对应的特征信 息,
所述第二时间段的起始时间先于所述第一时间段的终止时间;
对所述第二特 征信息进行清洗和转换, 得到第三特 征信息;
通过所述第三特 征信息和所述 N个企业的标签构建所述决策树模型。
3.根据权利要求2所述的企业的风险评估方法, 其特征在于, 所述对所述N条第二特征
信息进行清洗和转换, 包括:
在所述第二特征信 息中存在部分或全部特征字段缺失的目标特征信 息的情况下, 对所
述目标特征信息执 行目标操作;
其中, 所述目标操作为以下任一项:
删除所述目标 特征信息;
根据所述缺失的特征字段的同类数据, 生成所述缺失的特征字段的替代值, 并用所述
替代值替代所述 缺失的特 征字段。
4.根据权利要求1所述的企业的风险评估方法, 其特征在于, 所述根据 所述至少一个第
二分词和所述至少一个特 征词库确定所述目标企业的标签, 包括:
根据所述目标企业的垂直领域确定所述目标企业对应的第一特 征词库;
根据所述第一特 征词库将所述至少一个第二分词向量 化;
根据训练好的自然语言处 理模型、 向量 化的第二分词得到所述目标企业的标签。
5.根据权利要求1所述的企业的风险评估方法, 其特征在于, 所述根据获取的网络信 息
构建至少一个特 征词, 包括:
从所述网络信息中获取 所述N个企业的舆情信息和投诉举报信息;
对所述N个企业的舆情信息和投诉举报信息进行分词处 理, 得到至少一个第三分词;
根据所述至少一个第 三分词的出现次数, 从所述至少一个第 三分词中选取第 一数量的
第三分词作为疑似特 征词;
根据用户的操作确定各 所述疑似特 征词对应的向量, 生成至少一个特 征词。
6.根据权利要求1所述的企业的风险评估方法, 其特征在于, 所述将所述目标企业的特权 利 要 求 书 1/2 页
2
CN 115392787 A
2征字段输入训练好的决策树模型, 得到所述 目标企业对应的风险评估结果之后, 所述方法
还包括:
获取所述目标企业的基本信息;
将所述目标企业对应的风险评估结果和所述目标企业的基本信息相关联;
显示关联后的所述目标企业对应的风险评估结果和所述基本信息 。
7.一种企业的风险评估 装置, 其特 征在于, 所述装置包括:
第一构建模块, 用于根据获取的网络信息构建至少一个特 征词;
第二构建模块, 用于根据所述至少一个特征词中各特征词的垂直领域构建至少一个特
征词库;
拆分模块, 用于将 目标企业的舆情信息拆分为P个第一分词, 并根据词性对所述P个第
一分词进行筛 选, 得到至少一个第二分词;
确定模块, 用于根据 所述至少一个第 二分词和所述至少一个特征词库确定所述目标企
业的标签;
获取模块, 用于获取第一特征信息, 所述第一特征信息为所述目标企业的与第一时间
段对应的特征信息, 所述特征信息包括监管信息、 信用信息、 投诉举报信息和舆情信息中的
至少一项;
提取模块, 用于从所述第 一特征信 息和所述目标企业的标签中提取所述目标企业的特
征字段;
评估模块, 用于将所述目标企业的特征字段输入训练好的决策树模型, 得到所述目标
企业对应的风险评估结果。
8.一种企业的风险评估设备, 其特征在于, 所述企业的风险评估设备包括: 处理器以及
存储有计算机程序指令的存 储器;
所述处理器执行所述计算机程序指令时实现如权利要求1 ‑6中任一项所述的企业的风
险评估方法。
9.一种计算机存储介质, 其特征在于, 所述计算机存储介质上存储有计算机程序指令,
所述计算机程序指 令被处理器执行时实现如权利要求 1‑6中任一项 所述的企业的风险评估
方法。
10.一种计算机程序产品, 其特征在于, 所述计算机程序产品包括计算机程序指令, 所
述计算机程序指令被处理器执行时实现权利要求1 ‑6中任一项所述的企业的风险评估方
法。权 利 要 求 书 2/2 页
3
CN 115392787 A
3
专利 企业的风险评估方法、装置、设备、存储介质及程序产品
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:48上传分享