(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211133494.1
(22)申请日 2022.09.18
(71)申请人 北京清博智能科技有限公司
地址 100095 北京市海淀区花园路2号牡 丹
科技楼A座5层A6 01号
(72)发明人 杨钰雯
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/35(2019.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种应急事 件事理图谱构建方法
(57)摘要
本发明公开了一种应急事件事理图谱构建
方法, 其特征在于: 包括以下步骤: 步骤一: 预先
进行事件类型分类, 并预设种子触发词; 步骤二:
基于符号空间和向量空间进行事件表示; 步骤
三: 识别包含突发事件触发词的文本句, 并判断
事件触发词所对应的预定义事件类型; 步骤四:
基于已获得的突发事件触发词及事件类型得到
事件表示框架, 基于事件表示框架抽取事件中的
元素; 步骤五: 对事件的因果关系进行抽取; 步骤
六: 进行事件融合, 输出图谱数据。 本发 明能够快
速收集突发事件的相关信息, 描绘事件的演化过
程, 辅助专家学者进行事件发生前的准备工作,
事件发展过程中的快速决策, 以及事件发展结束
后的科学研究。
权利要求书2页 说明书10页 附图5页
CN 115455202 A
2022.12.09
CN 115455202 A
1.一种应急事 件事理图谱构建方法, 其特 征在于: 包括以下步骤:
步骤一: 预 先进行事 件类型分类, 并预设种子触发词;
步骤二: 基于符号空间和向量空间进行事 件表示;
步骤三: 识别包含突发事件触发词的文本句, 并判断事件触发词所对应的预定义事件
类型;
步骤四: 基于已获得的突发事件触发词及事件类型得到事件表示框架, 基于事件表示
框架抽取事 件中的元 素;
步骤五: 对 事件的因果关系进行抽取;
步骤六: 进行事 件融合, 输出图谱数据。
2.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤二包
括事件组成要素表示法和事 件核心词汇 表示法;
事件组成要素表示法用于事件发生类的事件, 具体包括: 将事件表示为由事件的类型、
事件发生的时间、 发生的地点、 参与的对象、 相关动作和事件提及句共同组成的复合知识单
元; 并将事 件表示符号 化为六元组的形式E={C,T,V,O,A,M};
事件核心词汇表示法用于事件影响类和应急决策类的事件, 具体包括: 结合依存句法
关系和词性, 通过核心关键词来表示事件, 保证减少事件中的冗余信息的同时, 不会过多的
丢失事件中的关键性信息 。
3.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤三具
体采用序列标注模型对文本句进行实体和 事件触发词的联合识别, 利用BERT ‑BiLSTM‑CRF
模型对实体和突发事件触发词进行联合标注:利用BERT模型进行文本特征提取, 然后将特
征向量输入Bi LSTM‑CRF模型中进行实体和触发词的标注, 并判断他们的类别。
4.根据权利要求3所述的一种应急事件事理图谱构建方法, 其特征在于: 所述BERT ‑
BiLSTM‑CRF模型依次包括词嵌入层、 双向LSTM层和CRF层;
词嵌入层用于将输入序列的文本信息转为向量的形式, 通过BERT预训练模型将文本句
中的词语转 化为低维稠密的向量序列的形式, 输出到双向长短时记 忆网络层中;
双向LSTM层用于将每个时间序列的前向LSTM捕获上文特征信息和后向LSTM捕获的下
文特征信息进行拼接, 通过线性全连接层将输出映射为一个维度等于输出标签数 的向量,
并使用Softmax函数 得到每个单词对应 每个标签的概 率;
CRF层用于将双向LSTM层的输出概 率作为状态特 征向量, 对序列进行字符化序列标注。
5.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤四具
体包括依存句法分析、 融合实体和触发词信息的事 件元素抽取方法;
依存句法分析用于事件影响类和应急决策类的事件元素抽取任务, 使用LTP工具抽取
出包含此类事 件触发词的核心词汇;
融合实体和触发词信息的事 件元素抽取方法用于事 件发生类的事 件元素抽取任务。
6.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤五采
用模式匹配与神经网络相结合的方法:
首先, 将突发事件识别和元素抽取任务得到的结构化的事件, 两两组队构成事件对的
形式, 然后判断两个事件是否来自同一个事件描述句, 若两个事件来自同一事件描述句且
存在因果连接词, 说明该事件描述句中存在显示因果关系, 因此用模式匹配的方法来进行权 利 要 求 书 1/2 页
2
CN 115455202 A
2因果关系的抽取, 否则, 说明该事件描述句中存在隐式因果关系或不存在因果关系, 用神经
网络的方法来进行事 件因果关系的抽取。
7.根据权利要求6所述的一种应急事件事理图谱构建方法, 其特征在于: 所述两两组队
构成事件对的形式具体如下:
(1)将每篇语料中包 含的事件放入对应的事 件列表中;
(2)开始对事件列表进行遍历: 将事件列表中的事件进行两两组队, 构成事件对, 直至
遍历完所有语料。
8.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤六中
事件融合具体包括: 首先, 构建侯选事件对, 并对结构化的事件元素进行规范化处理, 然后
进行事件综合相似度计算。
9.根据权利要求8所述的一种应急事件事理图谱构建方法, 其特征在于: 所述构建侯选
事件对具体如下:
(1)将事件抽取任务抽取的事件放入事件列表s={E1,E2,…,En}中, 其中, n为抽取的事
件总数;
(2)开始对事件列表s进行遍历, 判断事件Ei与事件Ej是否是同一类型, 其中i≠j; 若是
同一类型事 件, 则将事 件Ei与事件Ej组成事件对<Ei,Ej,0>, 直至遍历完所有的事 件;
(3)对于事件对<Ei,Ej,lable>, lable∈{0, ‑1,‑2}; lable= ‑2表示事件Ei和事件Ej是同
一事件, 需要进行事件融合; lable= ‑1表示事件Ei和事件Ej是相似事件, 不需要进行事件融
合; lable=0表示事 件Ei和事件Ej没有关系。
10.根据权利要求8所述的一种应急事件事理图谱构建方法, 其特征在于: 所述事件综
合相似度计算具体包括事件描述句相似度计算、 事件元素相似度计算、 事件描述句实体共
现计算;
事件描述句 相似度计算公式为:
simsen(s1,s2)=0.4×simsyntax(s1,s2)+0.6×simsemantic(s1,s2);
事件元素相似度计算公式为:
Simele(e1,e2)=0.5×Sim(Sete1,Set22)+0.5×Simcom(e1,e2);
事件描述句实体共现计算公式为:
权 利 要 求 书 2/2 页
3
CN 115455202 A
3
专利 一种应急事件事理图谱构建方法
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:39:39上传分享