(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210940485.7 (22)申请日 2022.08.03 (71)申请人 浙江大学 地址 310058 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 冯毅雄 陈美好 洪兆溪 胡炳涛  张志峰 谭建荣  (74)专利代理 机构 杭州求是专利事务所有限公 司 33200 专利代理师 林超 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/35(2019.01) G06F 16/34(2019.01) G06K 9/62(2022.01)G06F 40/211(2020.01) G06F 40/216(2020.01) G06F 40/295(2020.01) G06F 30/20(2020.01) (54)发明名称 一种缝纫设备模块化设计领域知识图谱构 建方法 (57)摘要 本发明公开了一种缝纫设备模块化设计领 域知识图谱构建方法。 本发明将缝纫设备模块化 设计领域数据进行实体和实体关系抽取, 获得领 域知识集合; 接着采用基于图的方法进行实体链 接, 获得领域知 识数据层; 然后依次采用词频 ‑逆 文档率方法和K均值聚类算法进行领域本体术语 抽取和聚类, 再采用基于模板的方法抽取缝纫设 备模块化设计领域本体的本体间分类、 非分类关 系, 进而组成领域知识模式层; 领域知识数据层 和模式层存储在图数据库中, 实现知识图谱的可 视化。 本发 明针对缝纫设备模块化设计领域的自 身特点, 实现缝纫设备模块化设计多源异构数据 的实体抽取、 链接以及领域本体构建, 实现缝纫 设备模块 化设计领域知识图谱可视化表示。 权利要求书2页 说明书7页 附图2页 CN 115292515 A 2022.11.04 CN 115292515 A 1.一种缝纫设备模块 化设计领域知识图谱构建方法, 其特 征在于, 包括以下步骤: 步骤一: 将缝纫设备模块化设计领域数据进行缝纫设备模块化设计实体和实体关系抽 取, 获得缝纫设备模块 化设计领域知识集 合; 步骤二: 根据 缝纫设备模块化设计领域知识集合, 采用基于图的方法进行实体链接, 获 得缝纫设备模块 化设计领域知识数据层; 步骤三: 根据缝纫设备模块化设计领域知识集合, 依次采用词频 ‑逆文档率方法和K均 值聚类算法进行领域本体术语抽取和聚类, 获得缝纫设备模块化设计领域本体, 然后采用 基于模板的方法抽取缝纫设备模块化设计领域本体的本体间分类、 非分类关系, 由缝纫设 备模块化设计领域本体以及本体间分类关系、 非分类关系组成缝纫设备模块化设计领域知 识模式层; 步骤四: 将缝纫设备模块化设计领域知识数据层和模式层存储在图数据库中, 在图数 据库中实现缝纫设备模块 化设计领域知识图谱的可视化。 2.根据权利要求1所述的一种缝纫设备模块化设计领域知识图谱构建方法, 其特征在 于, 所述步骤一具体为: 所述缝纫设备模块化设计领域数据根据数据存储类型分为结构化数据、 半结构化数据 和非结构化数据, 通过构建正则表达式对结构化数据和半结构化数据进行实体抽取, 采用 基于机器学习的方法对非结构化数据进行实体抽取, 从而获得缝纫设备模块化设计领域数 据的实体抽取 结果; 接着对缝纫设备模块化设计领域数据采用基于依存关系的实体关系抽取方法进行实 体关系抽取, 获得 缝纫设备模块 化设计领域数据的实体关系; 由缝纫设备模块化设计领域数据的实体抽取结果以及实体关系抽取结果组成缝纫设 备模块化设计领域知识集 合。 3.根据权利要求1所述的一种缝纫设备模块化设计领域知识图谱构建方法, 其特征在 于, 所述步骤二具体为: 首先根据缝纫设备模块化设计领域知识集合确定各个目标实体词与每个目标实体词 对应的备选链接实体集合, 对于每个目标实体词及其对应的备选链接实体集合, 采用基于 图的方法对当前目标实体词及其对应的备选链接实体集合进行实体链接, 获得实体链接 图, 接着根据实体链接图分别计算当前目标实体词 与备选链接实体集合中的各个备选链接 实体之间的综合相似度, 再选择综合相似度大于综合相似度阈值的备选链接实体作为当前 目标实体词的目标链接实体; 最后由各个目标实体词和对应的目标链接实体以及对应的实 体关系组成缝纫设备模块 化设计领域知识数据层。 4.根据权利要求3所述的一种缝纫设备模块化设计领域知识图谱构建方法, 其特征在 于, 所述当前目标实体词 与备选链接实体集合中的各个备选链接实体之间的综合相似度的 计算公式如下: w(vi)=α1×w1(vi)+α2×w2(vi)+α2×w3(vi) α1+α2+α3=1权 利 要 求 书 1/2 页 2 CN 115292515 A 2其中, w(vi)表示当前目标实体词item与备选链接实体集合中的第i个备选链接实体之 间的综合相似度, α1、 α2和α3分别为重要相关度系数、 句结构相 似度系数和词节点相似度系 数; w1(vi)表示在当前实体链接图中第i个备选链接实体对应的词节点vi的重要相关度, w2 (vi)表示第i个备选链接实体对应的词节点vi与当前目标实体词item的句结构相似度, w3 (vi)表示当前目标实体词item与第i个备选链接实体对应的词节点vi的词节点相似度; 代表所有由第i个备选链接实体对应的词节点vi指出关系的节点集合, V(vj)代表词节点vj 到当前实体链接图中其他词节点的指出关系总数, N代表当前实体链接图的词节点总数, ε 代表阻尼系数; H(item)表示当前目标实体词it em所在句中词汇顺序标注, H(vi)表示第i个 备选链接实体对应的词节点vi所在句中词汇顺序标注; 表示当前 目标实体词 item在 对应备选链接实体集合中的词频向量, 表示第i个备选链接实体对应的词节点vi在对应 备选链接实体集 合中的词频向量, cos()表示 余弦距离计算 函数。 5.根据权利要求1所述的一种缝纫设备模块化设计领域知识图谱构建方法, 其特征在 于, 所述步骤三具体为: 首先根据缝纫设备模块化设计领域知识集合, 采用词频 ‑逆文档率方法算法抽取本体 术语, 获得 领域本体术语集 合; 接着采用K均值聚类算法对领域本体术语集合进行整合聚类, 获得多个缝纫设备模块 化设计领域本体; 最后采用基于模板的方法对多个缝纫设备模块化设计领域本体进行本体间分类关系 以及非分类关系的抽取, 由缝纫设备模块化设计领域本体以及本体间分类关系、 非分类关 系组成缝纫设备模块 化设计领域知识模式层。 6.一种存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处理器执行时实 现权利要求1~5任一所述的方法。 7.根据权利要求6所述的一种 存储介质, 其特征在于, 其中所述的计算机程序为对应实 现权利要求1~5任一所述方法的指令 。权 利 要 求 书 2/2 页 3 CN 115292515 A 3

.PDF文档 专利 一种缝纫设备模块化设计领域知识图谱构建方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种缝纫设备模块化设计领域知识图谱构建方法 第 1 页 专利 一种缝纫设备模块化设计领域知识图谱构建方法 第 2 页 专利 一种缝纫设备模块化设计领域知识图谱构建方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:40:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。