(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211133494.1 (22)申请日 2022.09.18 (71)申请人 北京清博智能科技有限公司 地址 100095 北京市海淀区花园路2号牡 丹 科技楼A座5层A6 01号 (72)发明人 杨钰雯  (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种应急事 件事理图谱构建方法 (57)摘要 本发明公开了一种应急事件事理图谱构建 方法, 其特征在于: 包括以下步骤: 步骤一: 预先 进行事件类型分类, 并预设种子触发词; 步骤二: 基于符号空间和向量空间进行事件表示; 步骤 三: 识别包含突发事件触发词的文本句, 并判断 事件触发词所对应的预定义事件类型; 步骤四: 基于已获得的突发事件触发词及事件类型得到 事件表示框架, 基于事件表示框架抽取事件中的 元素; 步骤五: 对事件的因果关系进行抽取; 步骤 六: 进行事件融合, 输出图谱数据。 本发 明能够快 速收集突发事件的相关信息, 描绘事件的演化过 程, 辅助专家学者进行事件发生前的准备工作, 事件发展过程中的快速决策, 以及事件发展结束 后的科学研究。 权利要求书2页 说明书10页 附图5页 CN 115455202 A 2022.12.09 CN 115455202 A 1.一种应急事 件事理图谱构建方法, 其特 征在于: 包括以下步骤: 步骤一: 预 先进行事 件类型分类, 并预设种子触发词; 步骤二: 基于符号空间和向量空间进行事 件表示; 步骤三: 识别包含突发事件触发词的文本句, 并判断事件触发词所对应的预定义事件 类型; 步骤四: 基于已获得的突发事件触发词及事件类型得到事件表示框架, 基于事件表示 框架抽取事 件中的元 素; 步骤五: 对 事件的因果关系进行抽取; 步骤六: 进行事 件融合, 输出图谱数据。 2.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤二包 括事件组成要素表示法和事 件核心词汇 表示法; 事件组成要素表示法用于事件发生类的事件, 具体包括: 将事件表示为由事件的类型、 事件发生的时间、 发生的地点、 参与的对象、 相关动作和事件提及句共同组成的复合知识单 元; 并将事 件表示符号 化为六元组的形式E={C,T,V,O,A,M}; 事件核心词汇表示法用于事件影响类和应急决策类的事件, 具体包括: 结合依存句法 关系和词性, 通过核心关键词来表示事件, 保证减少事件中的冗余信息的同时, 不会过多的 丢失事件中的关键性信息 。 3.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤三具 体采用序列标注模型对文本句进行实体和 事件触发词的联合识别, 利用BERT ‑BiLSTM‑CRF 模型对实体和突发事件触发词进行联合标注:利用BERT模型进行文本特征提取, 然后将特 征向量输入Bi LSTM‑CRF模型中进行实体和触发词的标注, 并判断他们的类别。 4.根据权利要求3所述的一种应急事件事理图谱构建方法, 其特征在于: 所述BERT ‑ BiLSTM‑CRF模型依次包括词嵌入层、 双向LSTM层和CRF层; 词嵌入层用于将输入序列的文本信息转为向量的形式, 通过BERT预训练模型将文本句 中的词语转 化为低维稠密的向量序列的形式, 输出到双向长短时记 忆网络层中; 双向LSTM层用于将每个时间序列的前向LSTM捕获上文特征信息和后向LSTM捕获的下 文特征信息进行拼接, 通过线性全连接层将输出映射为一个维度等于输出标签数 的向量, 并使用Softmax函数 得到每个单词对应 每个标签的概 率; CRF层用于将双向LSTM层的输出概 率作为状态特 征向量, 对序列进行字符化序列标注。 5.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤四具 体包括依存句法分析、 融合实体和触发词信息的事 件元素抽取方法; 依存句法分析用于事件影响类和应急决策类的事件元素抽取任务, 使用LTP工具抽取 出包含此类事 件触发词的核心词汇; 融合实体和触发词信息的事 件元素抽取方法用于事 件发生类的事 件元素抽取任务。 6.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤五采 用模式匹配与神经网络相结合的方法: 首先, 将突发事件识别和元素抽取任务得到的结构化的事件, 两两组队构成事件对的 形式, 然后判断两个事件是否来自同一个事件描述句, 若两个事件来自同一事件描述句且 存在因果连接词, 说明该事件描述句中存在显示因果关系, 因此用模式匹配的方法来进行权 利 要 求 书 1/2 页 2 CN 115455202 A 2因果关系的抽取, 否则, 说明该事件描述句中存在隐式因果关系或不存在因果关系, 用神经 网络的方法来进行事 件因果关系的抽取。 7.根据权利要求6所述的一种应急事件事理图谱构建方法, 其特征在于: 所述两两组队 构成事件对的形式具体如下: (1)将每篇语料中包 含的事件放入对应的事 件列表中; (2)开始对事件列表进行遍历: 将事件列表中的事件进行两两组队, 构成事件对, 直至 遍历完所有语料。 8.根据权利要求1所述的一种应急事件事理图谱构建方法, 其特征在于: 所述步骤六中 事件融合具体包括: 首先, 构建侯选事件对, 并对结构化的事件元素进行规范化处理, 然后 进行事件综合相似度计算。 9.根据权利要求8所述的一种应急事件事理图谱构建方法, 其特征在于: 所述构建侯选 事件对具体如下: (1)将事件抽取任务抽取的事件放入事件列表s={E1,E2,…,En}中, 其中, n为抽取的事 件总数; (2)开始对事件列表s进行遍历, 判断事件Ei与事件Ej是否是同一类型, 其中i≠j; 若是 同一类型事 件, 则将事 件Ei与事件Ej组成事件对<Ei,Ej,0>, 直至遍历完所有的事 件; (3)对于事件对<Ei,Ej,lable>, lable∈{0, ‑1,‑2}; lable= ‑2表示事件Ei和事件Ej是同 一事件, 需要进行事件融合; lable= ‑1表示事件Ei和事件Ej是相似事件, 不需要进行事件融 合; lable=0表示事 件Ei和事件Ej没有关系。 10.根据权利要求8所述的一种应急事件事理图谱构建方法, 其特征在于: 所述事件综 合相似度计算具体包括事件描述句相似度计算、 事件元素相似度计算、 事件描述句实体共 现计算; 事件描述句 相似度计算公式为: simsen(s1,s2)=0.4×simsyntax(s1,s2)+0.6×simsemantic(s1,s2); 事件元素相似度计算公式为: Simele(e1,e2)=0.5×Sim(Sete1,Set22)+0.5×Simcom(e1,e2); 事件描述句实体共现计算公式为: 权 利 要 求 书 2/2 页 3 CN 115455202 A 3

.PDF文档 专利 一种应急事件事理图谱构建方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种应急事件事理图谱构建方法 第 1 页 专利 一种应急事件事理图谱构建方法 第 2 页 专利 一种应急事件事理图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:39:39上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。