(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211164313.1
(22)申请日 2022.09.23
(71)申请人 苏州城方信息技 术有限公司
地址 215000 江苏省苏州市工业园区金鸡
湖大道88号人工智能产业园G4-201单
元
(72)发明人 张磊 陶虹 张旭方 熊懿清
(74)专利代理 机构 北京同辉知识产权代理事务
所(普通合伙) 11357
专利代理师 梁语嫣
(51)Int.Cl.
G06Q 10/06(2012.01)
G06Q 10/04(2012.01)
G06F 17/18(2006.01)
G06N 3/08(2006.01)G06N 3/04(2006.01)
G06Q 50/26(2012.01)
(54)发明名称
一种基于多源异构数据融合的金融企业经
营风险预警方法
(57)摘要
本发明涉及一种基于多源异构数据融合的
金融企业经营风险预警方法, 针对 金融企业经营
风险模型构建的数据获取模块, 通过数据获取模
块获取的数据进行分析、 加工后构建特征, 对构
建的特征进行相关性分析获得相关系数, 筛选获
得金融企业经营风险预警模型特征, 融合网格搜
索和交叉验证策略对金融企业经营风险预警模
型进行训练, 根据金融企业经营风险预警模型对
金融企业进行 实时监控, 并提供监管的优先级名
单; 本发明提供的基于多源异构数据融合的金融
企业经营风险预警方法充分挖掘各个预警特征
背后的交叉和掩藏关系, 可以根据模 型得到金融
企业预警的优先级, 大大节约了人力成本, 提升
监管的效率和准确率。
权利要求书2页 说明书7页 附图2页
CN 115545437 A
2022.12.30
CN 115545437 A
1.一种基于多源异构数据融合的金融企业经营风险预警方法, 其特征在于, 包括以下
步骤:
S1、 针对金融企业经 营风险模型构建的数据获取模块;
S2、 对步骤S1中通过 数据获取模块获取的数据进行分析、 加工后构建特 征;
S3、 对步骤S2构建的特征进行相关性分析获得相关系数, 筛选获得金融企业经营风险
预警模型 特征;
S4、 融合网格搜索和交叉验证策略对金融企业经 营风险预警模型进行训练;
S5、 根据金融企业经营风险预警模型对金融企业进行实时监控, 并提供监管的优先级
名单。
2.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述步骤S2中通过数据获取模块获取的数据包括12345热线的工单内容、 企业舆情
信息、 企业工商信息以及公安经侦的经 营异常金融企业名单。
3.根据权利要求2所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述步骤S2中的12345热线的工单内容是通过对12345热线使用 BERT算法进行提
取, 得到被投诉的企业, 再使用BLEU算法对提取的企业进行标准化映射, 最后获取12345热
线中企业被投诉的次数 特征。
4.根据权利要求2所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述步骤S2是将所述企业舆情信息经过tokenizer编码, 并添加特殊字符, 输入
BERT模型获取对企业舆情信息的编码向量, 关注特殊字符对应的输出结果, 将输出结果送
入一个softmax全 连接层进行分类输出, BERT模 型为企业舆情数据打上标签, 最后获取企业
存在消极标签舆情的次数 特征。
5.根据权利要求2所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述步骤S2中企业工商信息包括对企业经营范围变更前后的文本进行清洗, 统计
变化前后企业经 营范围文本的交并比, 将通过以下公式计算出交并比作为特 征输入:
式(1)中A和B分别指的是变化前后的企业经 营范围变更的文本 。
6.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述步骤S2中的特征指的是对于步骤S1 中获得的文本数据进 行量化操作后得到的
金融企业经 营风险模型的特 征。
7.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述步骤S3中特征之间相关性是通过相关系数来刻画的, 相关系数定义特征(X,Y)
之间的相关程度如下式所示:
(2)式中cov(X, Y)为协方差, σ 为标准差, 计算公式如式(3)(4)和(5)所示:
权 利 要 求 书 1/2 页
2
CN 115545437 A
2将上述公式代入到(2)式 中得到最终的相关系数 得计算公式:
删除相关性高的维度 特征, 降低训练数据的维度, 加快模型训练速度, 并得到训练数据
集。
8.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于, 所述步骤S4中金融企业经营风险预警模型的训练包括构建LR分类器, 逻辑回归是
通过将线性函数的结果映射到Sigmoid()函数中, 预估单个金融企业出现经营风险的概率
并进行分类。
9.根据权利要求8所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于, 所述 步骤S4中金融企业经 营风险预警模型的训练具体包括以下步骤:
S41、 逻辑回归 模型输入及输出:
S42、 逻辑回归 模型:
通过Logistic函数归一 化到(0,1)间, y的取值有特殊的含义, 它表示结果取1的概 率;
S43、 逻辑回归损失函数: 得到逻辑回归的表达式后, 采用极大似然估计法求解模型中
的参数, 似然函数的表达式为:
S44、 逻辑回归采用梯度下降优化损失: 对损失函数的参数进行求导, 使用梯度下降的
方式来更新 参数θ,其中对参数θ 求 导的过程如下:
并通过下面的方式对参数θ进行 更新:
其中α为逻辑回归模型的学习率, 当
小于某个阈值或达到最大迭
代次数时, 模型停止学习。
10.根据权利要求9所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特
征在于: 所述逻辑回归中的θ和α属于金融企业经营风险预警模型 的超参数, 属于金融企业
经营风险预警模型 可优化的对象。权 利 要 求 书 2/2 页
3
CN 115545437 A
3
专利 一种基于多源异构数据融合的金融企业经营风险预警方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:01上传分享