(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211164313.1 (22)申请日 2022.09.23 (71)申请人 苏州城方信息技 术有限公司 地址 215000 江苏省苏州市工业园区金鸡 湖大道88号人工智能产业园G4-201单 元 (72)发明人 张磊 陶虹 张旭方 熊懿清  (74)专利代理 机构 北京同辉知识产权代理事务 所(普通合伙) 11357 专利代理师 梁语嫣 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 10/04(2012.01) G06F 17/18(2006.01) G06N 3/08(2006.01)G06N 3/04(2006.01) G06Q 50/26(2012.01) (54)发明名称 一种基于多源异构数据融合的金融企业经 营风险预警方法 (57)摘要 本发明涉及一种基于多源异构数据融合的 金融企业经营风险预警方法, 针对 金融企业经营 风险模型构建的数据获取模块, 通过数据获取模 块获取的数据进行分析、 加工后构建特征, 对构 建的特征进行相关性分析获得相关系数, 筛选获 得金融企业经营风险预警模型特征, 融合网格搜 索和交叉验证策略对金融企业经营风险预警模 型进行训练, 根据金融企业经营风险预警模型对 金融企业进行 实时监控, 并提供监管的优先级名 单; 本发明提供的基于多源异构数据融合的金融 企业经营风险预警方法充分挖掘各个预警特征 背后的交叉和掩藏关系, 可以根据模 型得到金融 企业预警的优先级, 大大节约了人力成本, 提升 监管的效率和准确率。 权利要求书2页 说明书7页 附图2页 CN 115545437 A 2022.12.30 CN 115545437 A 1.一种基于多源异构数据融合的金融企业经营风险预警方法, 其特征在于, 包括以下 步骤: S1、 针对金融企业经 营风险模型构建的数据获取模块; S2、 对步骤S1中通过 数据获取模块获取的数据进行分析、 加工后构建特 征; S3、 对步骤S2构建的特征进行相关性分析获得相关系数, 筛选获得金融企业经营风险 预警模型 特征; S4、 融合网格搜索和交叉验证策略对金融企业经 营风险预警模型进行训练; S5、 根据金融企业经营风险预警模型对金融企业进行实时监控, 并提供监管的优先级 名单。 2.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述步骤S2中通过数据获取模块获取的数据包括12345热线的工单内容、 企业舆情 信息、 企业工商信息以及公安经侦的经 营异常金融企业名单。 3.根据权利要求2所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述步骤S2中的12345热线的工单内容是通过对12345热线使用 BERT算法进行提 取, 得到被投诉的企业, 再使用BLEU算法对提取的企业进行标准化映射, 最后获取12345热 线中企业被投诉的次数 特征。 4.根据权利要求2所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述步骤S2是将所述企业舆情信息经过tokenizer编码, 并添加特殊字符, 输入 BERT模型获取对企业舆情信息的编码向量, 关注特殊字符对应的输出结果, 将输出结果送 入一个softmax全 连接层进行分类输出, BERT模 型为企业舆情数据打上标签, 最后获取企业 存在消极标签舆情的次数 特征。 5.根据权利要求2所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述步骤S2中企业工商信息包括对企业经营范围变更前后的文本进行清洗, 统计 变化前后企业经 营范围文本的交并比, 将通过以下公式计算出交并比作为特 征输入: 式(1)中A和B分别指的是变化前后的企业经 营范围变更的文本 。 6.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述步骤S2中的特征指的是对于步骤S1 中获得的文本数据进 行量化操作后得到的 金融企业经 营风险模型的特 征。 7.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述步骤S3中特征之间相关性是通过相关系数来刻画的, 相关系数定义特征(X,Y) 之间的相关程度如下式所示: (2)式中cov(X, Y)为协方差, σ 为标准差, 计算公式如式(3)(4)和(5)所示: 权 利 要 求 书 1/2 页 2 CN 115545437 A 2将上述公式代入到(2)式 中得到最终的相关系数 得计算公式: 删除相关性高的维度 特征, 降低训练数据的维度, 加快模型训练速度, 并得到训练数据 集。 8.根据权利要求1所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于, 所述步骤S4中金融企业经营风险预警模型的训练包括构建LR分类器, 逻辑回归是 通过将线性函数的结果映射到Sigmoid()函数中, 预估单个金融企业出现经营风险的概率 并进行分类。 9.根据权利要求8所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于, 所述 步骤S4中金融企业经 营风险预警模型的训练具体包括以下步骤: S41、 逻辑回归 模型输入及输出: S42、 逻辑回归 模型: 通过Logistic函数归一 化到(0,1)间, y的取值有特殊的含义, 它表示结果取1的概 率; S43、 逻辑回归损失函数: 得到逻辑回归的表达式后, 采用极大似然估计法求解模型中 的参数, 似然函数的表达式为: S44、 逻辑回归采用梯度下降优化损失: 对损失函数的参数进行求导, 使用梯度下降的 方式来更新 参数θ,其中对参数θ 求 导的过程如下: 并通过下面的方式对参数θ进行 更新: 其中α为逻辑回归模型的学习率, 当 小于某个阈值或达到最大迭 代次数时, 模型停止学习。 10.根据权利要求9所述的基于多源异构数据融合的金融企业经营风险预警方法, 其特 征在于: 所述逻辑回归中的θ和α属于金融企业经营风险预警模型 的超参数, 属于金融企业 经营风险预警模型 可优化的对象。权 利 要 求 书 2/2 页 3 CN 115545437 A 3

PDF文档 专利 一种基于多源异构数据融合的金融企业经营风险预警方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于多源异构数据融合的金融企业经营风险预警方法 第 1 页 专利 一种基于多源异构数据融合的金融企业经营风险预警方法 第 2 页 专利 一种基于多源异构数据融合的金融企业经营风险预警方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:01上传分享
加微信群 有优惠
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。