standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210024050.8 (22)申请日 2022.01.11 (71)申请人 广东拓思软件科 学园有限公司 地址 510000 广东省广州市萝岗区广州经 济技术开发区科 学城彩频路1 1号 申请人 广州番禺职业 技术学院 (72)发明人 王萍 陈振宇 张晋桂 黄万民 杨鹏 孙伟松 黄静旋 吴先裕 (74)专利代理 机构 北京超凡宏宇专利代理事务 所(特殊普通 合伙) 11463 代理人 戴尧罡 (51)Int.Cl. G06F 16/33(2019.01) G06F 16/36(2019.01) G06F 40/289(2020.01)G06F 40/30(2020.01) (54)发明名称 一种缺陷报告融合方法、 装置、 电子设备及 存储介质 (57)摘要 本申请提供了一种缺陷报告融合方法、 装 置、 电子设备及存储介质, 涉及数据分析技术领 域。 首先获取多个缺陷报告, 然后依据文本内容 提取缺陷报告的实体与关联关系, 并将实体与关 联关系引用知识图谱中进行补 充, 再将知识图谱 中的实体与关联关系翻译成第一向量, 并依据第 一向量整合每个缺陷报告对应的第二向量, 再依 据第二向量确定每两个缺陷报告的相似度, 并将 相似度大于第一阈值的缺陷报告聚合为同一报 告簇, 然后依据知识图谱中的实体与关联关系对 报告簇中缺陷报告进行排序, 以确定报告簇中的 主报告, 最后提取报告簇中与主报告关联的差异 点信息与歧义点信息。 本申请具有避免了重复报 告, 降低了整编人员的工作量的优点。 权利要求书2页 说明书10页 附图8页 CN 114048293 A 2022.02.15 CN 114048293 A 1.一种缺陷报告融合方法, 其特 征在于, 所述方法包括: 获取多个缺陷报告, 其中, 所述 缺陷报告包括文本内容; 依据所述文本 内容提取所述缺陷报告的实体与关联关系, 并将所述实体与关联关系引 用知识图谱中进行补充; 将所述知识图谱中的实体与关联关系翻译成第 一向量, 并依据 所述第一向量整合每个 缺陷报告对应的第二向量; 依据所述第 二向量确定每两个缺陷报告的相似度, 并将相似度 大于第一阈值的缺陷报 告聚合为同一报告簇; 依据所述知识图谱中的实体与关联关系对报告簇中缺陷报告进行排序, 以确定所述报 告簇中的主报告; 提取所述报告簇中与所述主报告关联的差异点信息与歧义点信息, 并将所述主报告、 所述差异点信息以及所述歧义 点信息存 储至数据库中, 以实现缺陷报告的融合。 2.如权利要求1所述的缺陷报告融合方法, 其特征在于, 依据所述文本 内容提取所述缺 陷报告的实体与关联关系的步骤 包括: 对所述文本内容进行分句, 以获取多个短句; 对每个短句进行分词并进行词性分析与依存分析, 以确定所述缺陷报告的实体与关联 关系。 3.如权利要求2所述的缺陷报告融合方法, 其特征在于, 将所述知识图谱中的实体与关 联关系翻译成第一向量, 并依据所述第一向量整合每个缺陷报告对应的第二向量的步骤包 括: 确定所述 缺陷报告中每 个短句对应的第一向量; 利用所述 缺陷报告对应的所有第一向量 合成所述第二向量。 4.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述缺陷报告还包括图片内 容, 在所述确定每两个缺陷报告的相似度的步骤之前, 所述方法还 包括: 提取所述图片内容的特 征; 依据所述图片内容的特 征确定第三向量; 所述确定每两个缺陷报告的相似度的步骤 包括: 依据所述第二向量与所述第三向量确定每两个报告的相似度。 5.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述依据 所述知识图谱中的实 体与关联关系对报告簇中缺陷报告 进行排序, 以确定所述报告簇中的主报告的步骤 包括: 依次将所述报告簇 中的每个缺陷报告作为目标缺陷报告, 确定与所述目标缺陷报告存 在关联的其 余缺陷报告的数量; 依据所述其余缺陷报告的数量与所述目标缺陷报告的评价信息确定所述目标缺陷报 告的权重, 其中, 所述评价信息包括 正向评价信息与负向评价信息; 将权重最大的目标缺陷报告作为主报告。 6.如权利要求1所述的缺陷报告融合方法, 其特征在于, 所述依据 所述文本 内容提取所 述缺陷报告的实体与关联关系的步骤 包括: 对所述文本内容进行分句, 以获取多个短句; 所述提取所述报告簇中与所述主报告关联的差异点信息与歧义 点信息的步骤 包括:权 利 要 求 书 1/2 页 2 CN 114048293 A 2将其余报告中每个短句与 所述主报告进行相似度计算, 并将与 所述主报告相似度小于 第二阈值的短句作为差异点信息; 将与所述主报告语义相反的短句作为歧义 点信息。 7.如权利要求6所述的缺陷报告融合方法, 其特征在于, 在将其余报告中每个短句与 所 述主报告进行相似度计算, 并将与所述主报告相似度小于第二阈值的短句作为差异 点信息 的步骤之后, 所述方法还 包括: 依据所述差异点信息所处的缺陷报告对应的排序结果对所述差异点信息进行排序。 8.一种缺陷报告融合装置, 其特 征在于, 所述装置包括: 数据获取 单元, 用于获取多个缺陷报告, 其中, 所述 缺陷报告包括文本内容; 处理单元, 还用于依据所述文本内容提取所述缺陷报告的实体与关联关系, 并将所述 实体与关联关系引用知识图谱中进行补充; 处理单元, 还用于将所述知识图谱中的实体与关联关系翻译成第一向量, 并依据所述 第一向量整合每 个缺陷报告对应的第二向量; 处理单元, 还用于依据所述第二向量确定每两个缺陷报告的相似度, 并将相似度大于 第一阈值的缺陷报告聚合 为同一报告簇; 处理单元, 还用于依据 所述知识图谱中的实体与关联关系 对报告簇 中缺陷报告进行排 序, 以确定所述报告簇中的主报告; 处理单元, 还用于提取所述报告簇中与所述主报告关联的差异点信息与歧义点信息, 并将所述主报告、 所述差异点信息以及所述歧义点信息存储至数据库中, 以实现缺陷报告 的融合。 9.一种电子设备, 其特 征在于, 包括: 存储器, 用于存 储一个或多个程序; 处理器; 当所述一个或多个程序被所述处理器执行时, 实现如权利要求1 ‑7中任一项所述的方 法。 10.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现如权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114048293 A 3
专利 一种缺陷报告融合方法、装置、电子设备及存储介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:58
上传分享
举报
下载
原文档
(1.3 MB)
分享
友情链接
GB-T 31467-2023 电动汽车用锂离子动力电池包和系统电性能试验方法.pdf
T-CDJC 003—2022 交联聚乙烯卷材浮筑楼板隔声保温系统应用技术标准.pdf
GB-T 15920-2010 海洋学术语 物理海洋学.pdf
GM-T 0079-2020 可信计算平台直接匿名证明规范.pdf
T-CAS 600—2022 经营者公平竞争合规管理体系建设.pdf
GB-T 18994-2014 电子工业用气体 高纯氯.pdf
GB-T 18916.1-2021 取水定额 第1部分:火力发电.pdf
GB-T 12714-2009 镅铍中子源.pdf
ISO27001 中文解说版.pdf
GB-T 40855-2021 电动汽车远程服务与管理系统信息安全技术要求及试验方法.pdf
GB-T 33018.1-2016 炭素企业节能技术规范 第1部分:浸渍.pdf
GB-T 32746-2016 岩土工程仪器信号与接口.pdf
GB-T 12688.5-2019 工业用苯乙烯试验方法 第5部分:总醛含量的测定 滴定法.pdf
GB-T 37964-2019 信息安全技术 个人信息去标识化指南.pdf
DB11-T 1619-2019 空气压缩机节能监测 北京市.pdf
GB 21555-2008 烟花爆竹 双响(升空类产品).pdf
GB-T 18029.26-2014 轮椅车 第26部分:术语.pdf
R155e.pdf
GB-T 7932-2017 气动 对系统及其元件的一般规则和安全要求.pdf
GB-T 3714-2017 碳酸锰矿.pdf
1
/
21
评价文档
赞助2.5元 点击下载(1.3 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。