(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210944028.5
(22)申请日 2022.08.08
(65)同一申请的已公布的文献号
申请公布号 CN 115017255 A
(43)申请公布日 2022.09.06
(73)专利权人 杭州实在智能科技有限公司
地址 310000 浙江省杭州市余杭区人工智
能小镇六号楼六层
(72)发明人 徐海平
(74)专利代理 机构 杭州云睿专利代理事务所
(普通合伙) 33254
专利代理师 张骁敏
(51)Int.Cl.
G06F 16/31(2019.01)
G06F 16/35(2019.01)
G06F 16/36(2019.01)G06F 40/289(2020.01)
G06F 40/295(2020.01)
G06N 5/02(2006.01)
(56)对比文件
US 2021383 075 A1,2021.12.09
US 10496 678 B1,2019.12.0 3
US 2015178273 A1,2015.0 6.25
CN 114491079 A,202 2.05.13
CN 114840632 A,202 2.08.02
CN 101630314 A,2010.01.20
CN 104615724 A,2015.0 5.13
WO 2021212682 A1,2021.10.28
刘耀等.融合 篇章结构的文本知识网络构
建. 《融合 篇章结构的文本知识网络构建》 .2021,
第65卷(第21期),
审查员 单娟
(54)发明名称
一种基于树状结构的知识库构建和搜索方
法
(57)摘要
本发明公开了一种基于树状结构的知识库
构建和搜索方法, 属于人工智 能技术领域。 该方
法中, 知识库由若干棵知识树构成, 每棵树包含
分类知识以及树的整体权重。 在构建知识库时先
对知识进行分类, 再抽取出若干的实体, 计算各
个实体之间的关联权重, 在弱关联 实体之间加入
通配实体, 最后根据关联权重构建知识树。 访问
知识库时, 依照树的权重挨个访问所有的树, 并
根据实体 之间的关联权重进行深度优 先搜索, 找
到结果之后根据全链路权重计算得分, 当得分高
于设定的阈值, 则忽略尚未访问的树返回立即结
果, 否则在所有的结果中取最高分为最终结果。
根据最终结果, 增强树的权重以及 链路中实体的
关系, 否则 弱化树的权重和链路中实体的关系。
权利要求书2页 说明书6页 附图7页
CN 115017255 B
2022.11.01
CN 115017255 B
1.一种基于树状结构的知识库构建的方法, 其特 征在于包括以下步骤:
步骤S1: 对知识按照其所属领域进行分类划分; 步骤S2: 对知识分类后的每个领域的知
识依次进行实体抽取; 步骤S3: 计算实体之间的关联权重; 步骤S4: 对于关联权重值小于设
定阈值的两个实体, 在两个实体中间插入一个通配实体, 由通配实体分别关联两个实体, 通
配实体用于锁定两个实体之 间的关联权重; 步骤S 5: 根据关联权重构建每个领域的知识 树,
根据所有构建的知识树构建树状结构的知识库;
所述步骤S5包括: 步骤S51: 将实体按照关联关系依次加入知识树中, 从知识树的根节
点R开始; 步骤S52: 将第一个实体和根节点R相连接, 链接强度设定为0, 如果已经存在相同
实体则跳过该实体; 步骤S53: 将第二个实体和第一个节点相连, 链接强度为设定为第一个
实体和第二个实体之间的关联权重, 同样如果存在相同实体则跳过该实体, 直到所有实体
都加入对应领域的知识树, 根据所有构建的知识树构建树状结构的知识库。
2.根据权利要求1所述的一种基于树状结构的知识库构建的方法, 其特征在于, 所述步
骤S2包括: 步骤S21: 对待抽取的内容进行分词处理; 步骤S22: 基于预先准备的分词模型或
命名实体识别相关算法, 得到分词列表, 对分词列表进行初步过 滤保留预设词性的分词。
3.根据权利要求1所述的一种基于树状结构的知识库构建的方法, 其特征在于, 所述步
骤S3包括: 基于预先训练的分词统计模型, 获取分词的出现频率, 根据分词共同的出现频率
计算权重, 共同出现频率越多的分词得到的权 重越大。
4.一种搜索知识节点的方法, 应用于上述权利要求1至3任一项所述的树状结构的知识
库, 其特征在于, 所述方法包括以下步骤: 对于用户输入的问题依据权重进行深度优先搜
索; 找到搜索结果时计算全链路得分; 得分高于阈值时停止搜索并返回结果, 否则继续搜
索; 所有得分均不高于阈值时在所有搜索结果中取出最高分并返回结果; 根据最终结果动
态调整树的权 重; 根据最终结果增强或者弱化实体间关系; 输出用户所需搜索结果。
5.根据权利要求4所述的一种搜索知识节点的方法, 其特征在于: 所述一种搜索知识节
点的方法步骤具体包括: 从每棵树的根节点R开始访问, 从与根节点R相连的未被访问的实
体节点出发, 对知识 树进行深度优先遍历, 优先遍历关联权重更高的实体, 直至树中和根节
点R有路径相通的实体都被访问或者找到符合条件的答案, 每棵树都可能会找到不定数量
的答案。
6.根据权利要求4所述的一种搜索知识节点的方法, 其特征在于: 所述找到搜索结果 时
计算全链路得分的步骤具体包括: 统计全链路上所有实体之间关系的权重值, 将所有权重
值相加之后除以实体总数获取平均权 重值, 所述平均权 重值即为本次搜索结果的得分。
7.根据权利要求4所述的一种搜索知识节点的方法, 其特征在于: 所述根据最终结果动
态调整树的权重的步骤具体包括: 将本次最终结果所在树的权重增加预设值, 达到设定的
上限之后不再增加, 搜索结果但并未被采纳的答案的树权重不变, 其他树的权重减少预设
值, 达到设定的下限之后不再减少。
8.根据权利要求4所述的一种搜索知识节点的方法, 其特征在于: 所述根据最终结果增
强或者弱化实体间关系的步骤具体包括: 全链路上实体之间的关联权重根据所在深度, 依
次增加深度对应的值, 达到 设定的上限之后不再增加, 通配实体的权重不做调整, 如果本次
最终结果被标记为 错误, 则依次扣除深度对应的权 重值, 达到设定的下限之后不再减少。
9.一种基于树状结构的知识库构建和搜索系统, 所述系统包括至少一个处理器和至少权 利 要 求 书 1/2 页
2
CN 115017255 B
2一个存储器, 所述至少一个存储器中存储有计算机程序代码, 通过所述至少一个处理器执
行所述至少一个存储器中存储的所述计算机程序 代码以实现权利要求 1‑3任一项所述的基
于树状结构的知识库构建的方法或者权利要求4 ‑8任一项所述的搜索知识节 点的方法的各
个步骤, 其中, 所述至少一个存储器中的每个存储器至少存储有所述计算机程序代码 中的
一部分。
10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序代码的至
少一部分, 所述计算机程序代码在被至少一个处理器执行时能够实现权利要求1 ‑3任一项
所述的基于树状结构的知识库构建的方法或者权利要求4 ‑8任一项所述的搜索知识节点的
方法的各个步骤。权 利 要 求 书 2/2 页
3
CN 115017255 B
3
专利 一种基于树状结构的知识库构建和搜索方法
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-17 23:38:49上传分享