文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211160630.6 (22)申请日 2022.09.22 (71)申请人 国网河北省电力有限公司信息通信 分公司 地址 050026 河北省石家庄市裕华区富强 大街10号 申请人 国家电网有限公司 (72)发明人 辛锐 董增波 陈曦 赵建斌 赵劭康 张鹏飞 姜丹 路欣 刘明硕 孙思思 张博 赵梦瑶 刘汝坤 (74)专利代理 机构 石家庄国为知识产权事务所 13120 专利代理师 刘少卿(51)Int.Cl. G06F 16/36(2019.01) G06K 9/62(2022.01) (54)发明名称 基于知识图谱的实体分类方法、 系统、 终端 及存储介质 (57)摘要 本申请提供一种基于知识图谱的实体分类 方法、 系统、 终端及存储介质。 该方法包括: 基于 DNS的层级关系和查询解析关系建立DNS知识图 谱, 其中, DNS知 识图谱包 括至少一个域名对应的 预设标签; 将DNS知识图谱拆分为实体和关系, 并 根据实体属性对齐方式将实体和关系进行融合, 得到融合后的DNS知 识图谱; 对融合后的DNS知识 图谱的实体和关系进行向量化, 得到DNS知识图 谱向量, 其中, DNS知 识图谱向量包括各个域名对 应的知识图谱向量; 将域名对应的知识图谱向量 作为输入量, 将域名对应的预设标签作为输出 量, 训练神经网络模型, 得到实体分类模 型; 根据 实体分类模型, 对域名进行分类检测。 本申请能 够提高域名分类 检测的准确性和速度。 权利要求书3页 说明书14页 附图3页 CN 115391568 A 2022.11.25 CN 115391568 A 1.一种基于知识图谱的实体分类方法, 其特 征在于, 包括: 基于DNS的层级关系和查询解析关系建立DNS知识图谱, 其 中, 所述DNS知识图谱包括至 少一个域名对应的预设标签, 所述预设标签包括恶意和非恶意; 将所述DNS知识图谱拆分为实体和关系, 并根据实体属性对齐方式将所述实体和所述 关系进行融合, 得到融合后的DNS知识图谱; 对所述融合后的DNS知识图谱的实体和关系进行向量化, 得到DNS知识图谱向量, 其中, 所述DNS知识图谱向量包括各个域名对应的知识图谱向量; 将所述域名对应的知识图谱向量作为输入量, 将所述域名对应的预设标签作为输出 量, 训练神经网络模型, 得到实体分类模型; 根据所述实体分类模型, 对域名进行分类 检测。 2.根据权利要求1所述的基于知识图谱的实体分类方法, 其特征在于, 所述基于DNS的 层级关系和查询解析关系建立DNS知识图谱, 包括: 基于DNS的层级关系, 建立DNS域名分层图, 并对所述DNS域名分层图添加所述预设标 签; 基于DNS的查询解析关系, 建立DNS查询响应图和被动DNS图; 将所述DNS查询响应图和所述被动DNS图结合, 建立DNS流图, 并对所述DNS流图添加所 述预设标签; 将所述DNS域名分层图和所述DNS流图通过规则对齐方式结合, 建立所述DNS知识图谱。 3.根据权利要求1所述的基于知识图谱的实体分类方法, 其特征在于, 所述实体包括头 实体和尾实体; 所述将所述DNS知识图谱拆分为实体和关系, 并根据实体属性对齐方式将所述实体和 所述关系进行融合, 得到融合后的DNS知识图谱, 包括: 利用三元组方式, 将所述DNS知识图谱 的客户端IP地址作为所述头实体, 所述DNS知识 图谱的Qname属性作为所述关系, 所述DNS知识图谱的域名作为所述尾实体; 通过实体属性对齐的方式, 将所述头实体、 所述关系和所述尾实体进行融合, 得到 融合 后的DNS知识图谱。 4.根据权利要求1所述的基于知识图谱的实体分类方法, 其特征在于, 所述DNS知识图 谱包括至少一类域名对应的三元组, 所述对所述融合后的DNS知识图谱的实体和关系进行 向量化, 得到DNS知识图谱向量包括: 针对每类域名, 任意选取该类域名中的一个三元组的头实体作为起始节点, 计算当前 三元组的尾实体与第一 三元组的头实体之间的实体距离; 判断当前三元组的尾实体与第一三元组的头实体之间的实体距离是否不大于预设实 体距离; 若当前三元组的尾实体与第一三元组的头实体之间的实体距离不大于所述预设实体 距离, 则将所述第一三元组的头实体与当前三元组的尾实体相链接, 并将所述第一三元组 作为当前三元组; 重复当前步骤, 直至当前三元组的头实体为所述 起始节点, 得到该域名的实体和关系; 对各个域名对应的实体和关系进行向量 化, 得到各个域名对应的知识图谱向量; 其中, 所述第一 三元组为该类域名对应的三元组中未被链接的三元组。权 利 要 求 书 1/3 页 2 CN 115391568 A 25.根据权利要求4所述的基于知识图谱的实体分类方法, 其特征在于, 在所述判断当前 三元组的尾实体与第一三元组的头实体之 间的实体距离是否不大于预设实体距离之后, 包 括: 步骤一: 若当前三元组 的尾实体与第 一三元组的头实体之间的实体距离大于所述预设 实体距离, 则执 行步骤二; 步骤二: 采用第二三元组的头实体替换掉所述第一三元组的头实体, 采样第二三元组 的尾实体替换所述第一三元组的尾实体, 并将替换后的第一三元组作为负采样三元组; 所 述第二三元组为该类域名中已链接的任一 三元组; 步骤三: 判断当前三元组的尾实体与所述负采样三元组 的头实体之间的实体距离是否 不大于预设实体距离; 步骤四: 若当前三元组 的尾实体与 所述负采样三元组的头实体之间的实体距离不大于 所述预设实体距离, 则将所述负采样三元组的头实体与当前三元组的尾实体相链接, 并将 所述负采样三元组作为当前三元组; 步骤五: 若当前三元组 的尾实体与 所述负采样三元组的头实体之间的实体距离大于预 设实体距离, 则返回步骤二, 并重复执行步骤二至步骤五, 直至 当前三元组的尾实体与所述 负采样三元组的头实体之间的实体距离满足所述预设实体距离 。 6.根据权利要求1所述的基于知识图谱的实体分类方法, 其特征在于, 所述对所述融合 后的DNS知识图谱的实体和关系进行向量 化, 得到DNS知识图谱向量, 包括: 采用TransE算法, 对所述融合后的DNS知识图谱的实体和关系进行向量化, 得到所述 DNS知识图谱向量。 7.根据权利要求1所述的基于知识图谱的实体分类方法, 其特征在于, 所述将所述域名 对应的知识图谱向量作为输入量, 将所述域名对应的预设标签作为输出量, 训练神经网络 模型, 得到实体分类模型, 包括: 将所述域名对应的知识图谱向量作为输入量, 将所述域名对应的预设标签作为输出 量, 对BiLSTM神经网络进行训练, 将训练后的Bi LSTM神经网络模型作为所述实体分类模型。 8.一种基于知识图谱的实体分类系统, 其特征在于, 该系统包括: 建立模块、 融合模块、 向量化模块、 训练模块和检测模块; 所述建立模块, 用于基于DNS的层级关系和查询解析关系建立DNS知识图谱, 其 中, 所述 DNS知识图谱 包括至少一个域名对应的预设标签, 所述预设标签包括恶意和非恶意; 所述融合模块, 用于将所述DNS知识图谱拆分为实体和关系, 并根据实体属性对齐方式 将所述实体和所述关系进行融合, 得到融合后的DNS知识图谱; 所述向量化模块, 用于对所述融合后的DNS知识图谱的实体和关系进行向量化, 得到 DNS知识图谱向量, 其中, 所述DNS知识图谱向量包括各个域名对应的知识图谱向量; 所述训练模块, 用于将所述域名对应的知识图谱向量作为输入量, 将所述域名对应的 预设标签作为输出量, 训练神经网络模型, 得到实体分类模型; 所述检测模块, 用于根据所述实体分类模型, 对域名进行分类 检测。 9.一种终端, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器上运行 的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如上的权利要求1至7 中任一项所述基于知识图谱的实体分类方法的步骤。权 利 要 求 书 2/3 页 3 CN 115391568 A 3
专利 基于知识图谱的实体分类方法、系统、终端及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-17 23:42:50
上传分享
举报
下载
原文档
(670.0 KB)
分享
友情链接
GM-T 0113-2021 在线快捷身份鉴别协议.pdf
DB52-T 826-2013 硬阔二元立木材积表 贵州省.pdf
T-SSCI 002—2021 学校室外运动场地合成材料面层 铺装技术规程.pdf
专利 数据资产风险发现方法和装置.PDF
GB-T 31436-2015 节水型卫生洁具.pdf
GB-T 22452-2008 硼酸盐非线性光学单晶元件通用技术条件.pdf
GB-T 25030-2010 建筑物清洗维护质量要求.pdf
SN-T 4261-2015 出口中药材中苯并(a)芘残留量的测定.pdf
DB15-T 2186—2021 林草数据备份管理规范 内蒙古自治区.pdf
GB-T 15920-2010 海洋学术语 物理海洋学.pdf
GB-T 20518-2018 信息安全技术 公钥基础设施 数字证书格式.pdf
JR-T 0035—2007 保险行业机构代码编码规范.pdf
南方电网数据资产管理体系白皮书.pdf
ISO 11515 2022 Gas cylinders — Refillable composite reinforced tubes of water capacity between 450 l and 3000 l — Design, construction and testing.pdf
GB-T 23799-2021 车用甲醇汽油 M85.pdf
DB37-T 3234-2018 动物源食品中泰万菌素残留量的测定 液相色谱—串联质谱法 山东省.pdf
GB-T 43206-2023 信息安全技术 信息系统密码应用测评要求.pdf
T-ACEF 109—2023 公民绿色低碳行为温室气体减排量化指南 行:混合动力汽车出行.pdf
奇安信 2022网络安全人才市场状况研究报告.pdf
GB-T 29307-2022 电动汽车用驱动电机系统可靠性试验方法.pdf
1
/
3
21
评价文档
赞助2元 点击下载(670.0 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。