(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211386762.0
(22)申请日 2022.11.07
(71)申请人 中冶赛迪技 术研究中心有限公司
地址 401122 重庆市渝北区北部新区汇金
路11号1幢
(72)发明人 陈志毅 赵明明 刘宝巨 范浩然
(74)专利代理 机构 上海光华专利事务所(普通
合伙) 31219
专利代理师 唐勇
(51)Int.Cl.
G06Q 10/06(2012.01)
G06F 16/36(2019.01)
(54)发明名称
获取风险识别模型的方法、 装置、 机器可读
介质及设备
(57)摘要
本发明的一种获取风险识别模 型的方法, 包
括: 获取目标对象信息; 对目标对象信息进行第
一知识抽取, 得到第一知识, 并根据第一知识构
建第一知识图谱; 对第一知识图谱的第一本体进
行本体增强; 对目标对象信息进行第二知识抽
取, 得到第二知识; 对第一知识和所述第二知识
进行知识融合, 得到第三知识图谱; 对第三知识
图谱进行语义抽取, 得到语义信息; 基于神经网
络和语义信息进行训练, 得到风险识别模型。 本
发明从大宗商品供应链管理的实际需求出发, 结
合了知识图谱和图数据库的方法, 同时融合了相
关企业的基础数据, 并基于外部知识图进行本体
转换和本体增强, 进而实现数据量完备、 准确度
高、 速度快的大宗商品供应链风险识别模型。
权利要求书2页 说明书12页 附图4页
CN 115545558 A
2022.12.30
CN 115545558 A
1.一种获取风险识别模型的方法, 其特 征在于, 包括:
获取目标对象信息, 其中, 目标对象为 开展大宗商品相关业 务的企业;
对所述目标对象信息进行第一知识抽取, 得到第一知识, 并根据所述第一知识构建第
一大宗商品供应链企业知识图谱, 所述第一知识至少用于表示开展大宗商品相关业务的企
业的经营范围之间的关系;
获取关联知识, 并基于所述关联知识对所述第 一大宗商品供应链企业知识图谱的第 一
本体进行本体增强, 得到第二大宗商品供应链企业知识图谱; 其中, 所述关联知识 为外部知
识, 所述外 部知识为与第一本体具有关联关系的第二本体的知识;
对所述目标对象信息进行第二知识抽取, 得到第二知识, 所述第二知识至少用于表示
开展大宗商品相关业 务的企业之间的上 下游关系;
对所述第一知识和所述第 二知识进行知识融合, 得到第 三大宗商 品供应链企业知识图
谱;
对所述第三宗商品供应链企业知识图谱进行语义抽取, 得到语义信息;
基于神经网络和所述语义信息进行训练, 得到风险识别模型。
2.根据权利要求1所述的获取风险识别模型的方法, 其特征在于, 所述对所述目标对象
信息进行第一知识抽取, 得到第一知识, 包括:
对所述目标对象信息进行第一知识抽取, 得到得到第一知识, 所述第一知识多个第一
企业本体, 以及各个第一 企业本体之间的第一关系; 其中, 所述第一 企业本体包括一个实体
类型, 所述第一关系用于表示 开展大宗商品相关业 务的企业的经 营范围之间的关系;
基于所述多个第一企业本体, 以及所述各个第 一企业本体之间的第 一关系构建第 一大
宗商品供应链企业知识图谱。
3.根据权利要求1所述的获取风险识别模型的方法, 其特征在于, 所述对所述第 一大宗
商品供应链企业知识图谱的第一本体进行本体增强, 包括
从外部知识中提取与所述多个第一企业本体具有关联关系的第二企业本体;
通过转换模型将所述第二企业本体转换为第一文本描述信息;
将所述第一文本描述信息作为辅助提示添加到所述企业本体的第二文本描述信息的
末尾。
4.根据权利要求3所述的获取风险识别模型的方法, 其特 征在于, 所述 转换模型为:
其中, 其中, Si={w1,w2,w3,…,wn}表示一个句子, w1,w2,w3,…,wn表示单词, [CLS]表示
文本符号, [SEP]表示分隔符,
表示一个[Template]句子模板, Xprompt表示将[CLS]、 Si、
[SEP]、
[SEP]拼接后得到的输入文本序列,
表示拼接操作;
候选类的概 率分布为:
其中, w表示分类为y的第w个标签的令牌, p(y|Xprompt)表示将Xprompt分类为y的概率,
[MASK]表示文本符号, p([MASK]=w|Xprompt)表示在文本序列Xprompt中[MASK]位置的原始单权 利 要 求 书 1/2 页
2
CN 115545558 A
2词是单词w的概 率; Vy表示类别为y的单词的集 合。
5.根据权利要求4所述的获取风险识别模型的方法, 其特征在于, 在所述转换模型中,
在softmax层之前 具有自注意权 重的注意掩码矩阵。
6.根据权利要求4所述的获取风险识别模型的方法, 其特征在于, 在训练所述转换模型
的过程中, 通过协同训练算法对所述第一本体的知识表示以及所述第二本体的知识表示进
行优化。
7.根据权利要求1所述的获取风险识别模型的方法, 其特征在于, 所述获取目标对象,
包括:
获取大宗商品供应链企业的企业数据;
根据企业ID、 企业名称、 企业经营范围和大宗商品品类字典对所述企业数据进行筛选,
获取目标对象, 其中, 所述目标对象为 开展大宗商品相关业 务的企业。
8.一种获取风险识别模型的装置, 其特 征在于, 包括:
信息获取模块, 用于获取目标对象信 息, 其中, 目标对象为开展大宗商品相关业务的企
业;
知识图谱构建模块, 用于对所述目标对象信 息进行第 一知识抽取, 得到第 一知识, 并根
据所述第一知识构建第一大宗商品供应链企业知识图谱, 所述第一知识至少用于表示开展
大宗商品相关业 务的企业的经 营范围之间的关系;
本体增强模块, 用于获取关联知识, 并基于所述关联知识对所述第一大宗商品供应链
企业知识图谱的第一本体进行本体增强, 得到第二大宗商品供应链企业知识图谱; 其中, 所
述关联知识为外 部知识, 所述外 部知识为与第一本体具有关联关系的第二本体的知识;
知识抽取模块, 用于对所述目标对象信 息进行第 二知识抽取, 得到第 二知识, 所述第二
知识至少用于表示 开展大宗商品相关业 务的企业之间的上 下游关系;
知识融合模块, 用于对所述第一知识和所述第二知识进行知识融合, 得到第三大宗商
品供应链企业知识图谱;
语义抽取模块, 用于对所述第三宗商品供应链企业知识图谱进行语义抽取, 得到语义
信息;
训练模块, 用于基于神经网络和所述语义信息进行训练, 得到风险识别模型。
9.一种风险识别方法, 其特征在于, 包括: 利用权利要求1~7任意一项所述的风险识别
模型对大宗商品供应链进行风险识别。
10.一种机器可读介质, 其特征在于, 其上存储有指令, 当由一个或多个处理器执行时,
使得设备 执行如权利要求1 ‑7任意一项所述的大宗商品供应链风险识别方法。权 利 要 求 书 2/2 页
3
CN 115545558 A
3
专利 获取风险识别模型的方法、装置、机器可读介质及设备
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:44:25上传分享