standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211234031.4 (22)申请日 2022.10.10 (71)申请人 联仁健康医疗大 数据科技股份有限 公司 地址 200131 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄3号 (72)发明人 张晓刚 李登高 徐新鹏 冯易成  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 骆文欣 (51)Int.Cl. G06F 40/284(2020.01) G06F 40/242(2020.01) G06F 16/2458(2019.01) (54)发明名称 一种信息匹配方法、 装置、 电子设备及存储 介质 (57)摘要 本发明公开了一种信息匹配方法、 装置、 电 子设备及存储介质。 该方法包括: 获取待匹配项, 对待匹配项进行分词, 得到至少一个待匹配分 词; 获取字典中的字典项和字典编码矩阵, 基于 待匹配分词、 字典项和字典编码矩阵确定字典项 与待匹配分词的相似度矩阵; 基于相似度矩阵 中, 任一字典项与各待匹配分词的相似度数据, 确定字典项与待匹配项的相似度; 基于各字典项 与待匹配项的相似度, 确定与待匹配项相匹配的 字典项。 本发 明通过对待匹配项进行分词得到待 匹配分词, 并基于待匹配分词、 字典项和字典编 码矩阵得到字典项与待匹配分词的相似度矩阵, 以及字典项与待匹配项的相似度, 进而基于相似 度确定与待匹配项匹配的字典项, 提高了信息匹 配的准确性。 权利要求书2页 说明书10页 附图3页 CN 115422924 A 2022.12.02 CN 115422924 A 1.一种信息匹配方法, 其特 征在于, 包括: 获取待匹配项, 对所述待匹配项 进行分词, 得到 至少一个待匹配分词; 获取字典中的字典项和字典编码矩阵, 基于所述待匹配分词、 所述字典项和所述字典 编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵; 基于所述相似度矩阵中, 任一所述字典项与各所述待匹配分词的相似度数据, 确定所 述字典项与所述待匹配项的相似度; 基于各所述字典项与所述待匹配项的相似度, 确定与所述待匹配项相匹配的字典项。 2.根据权利要求1所述的方法, 其特 征在于, 所述字典编码矩阵的确定方法包括: 获取字典项目中的多个字典项, 确定对所述多个字典项 去重的字典分词; 对于任一字典项, 基于所述字典项与所述字典分词的对应关系, 设置所述字典项对应 的字典分词编码, 形成字典编码矩阵。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述待匹配分词、 所述字典项和 所述字典编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵, 包括: 基于所述待匹配分词和所述字典分词进行相似度计算, 得到分词相似度, 并基于各分 词相似度生成分词相似度矩阵; 基于所述字典编码矩阵和所述分词相似度矩阵确定所述字典项与所述待匹配分词的 相似度矩阵。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述待匹配分词和所述字典分词 进行相似度计算, 得到分词相似度, 包括: 将任一所述待匹配分词和任一所述字典分词进行两 两组合得到分词组合; 基于多个预设相似度函数分别对所述分词组合进行相似度计算, 得到各所述预设相似 度函数对应的中间相似度; 基于各所述预设相似度函数对应的权重对多个中间相似度进行加权处理, 得到所述分 词组合的分词相似度。 5.根据权利要求3所述的方法, 其特征在于, 所述基于所述字典编码矩阵和所述分词相 似度矩阵确定所述字典项与所述待匹配分词的相似度矩阵, 包括: 对所述字典编码矩阵和所述分词相似度矩阵进行矩阵乘法, 得到所述字典项与所述待 匹配分词的相似度矩阵。 6.根据权利要求1所述的方法, 其特征在于, 所述基于各所述字典项与 所述待匹配项的 相似度, 确定与所述待匹配项相匹配的字典项, 包括: 基于所述字典项与 所述待匹配项的相似度对所述字典项进行排序, 提取所述排序中预 设数量的字典项; 或者, 将所述字典项与所述待匹配项的相似度与预设匹配阈值进行比对, 若所述字典 项与所述待匹配项的相似度大于所述预设匹配阈值, 则确定为与所述待匹配项相匹配的字 典项。 7.根据权利要求1所述的方法, 其特征在于, 所述与所述待 匹配项相匹配的字典项为至 少一个; 在确定与所述待匹配项相匹配的字典项之后, 所述方法还 包括: 将至少一个所述字典项发送至审核 端, 并接收所述审核 端返回的审核结果。权 利 要 求 书 1/2 页 2 CN 115422924 A 28.一种信息匹配装置, 其特 征在于, 包括: 待匹配项分词模块用于获取待匹配项, 对所述待匹配项进行分词, 得到至少一个待匹 配分词; 相似度矩阵确定模块用于获取字典中的字典项和字典编码矩阵, 基于所述待匹配分 词、 所述字典项和所述字典编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵; 相似度确定模块基于所述相似度矩阵中, 任一所述字典项与 各所述待 匹配分词的相似 度数据, 确定所述字典项与所述待匹配项的相似度; 字典项确定模块基于各所述字典项与所述待 匹配项的相似度, 确定与 所述待匹配项相 匹配的字典项。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 信息匹配方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的信息匹配方法。权 利 要 求 书 2/2 页 3 CN 115422924 A 3

PDF文档 专利 一种信息匹配方法、装置、电子设备及存储介质

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种信息匹配方法、装置、电子设备及存储介质 第 1 页 专利 一种信息匹配方法、装置、电子设备及存储介质 第 2 页 专利 一种信息匹配方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:34:06上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。