standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211234031.4 (22)申请日 2022.10.10 (71)申请人 联仁健康医疗大 数据科技股份有限 公司 地址 200131 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄3号 (72)发明人 张晓刚 李登高 徐新鹏 冯易成 (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 骆文欣 (51)Int.Cl. G06F 40/284(2020.01) G06F 40/242(2020.01) G06F 16/2458(2019.01) (54)发明名称 一种信息匹配方法、 装置、 电子设备及存储 介质 (57)摘要 本发明公开了一种信息匹配方法、 装置、 电 子设备及存储介质。 该方法包括: 获取待匹配项, 对待匹配项进行分词, 得到至少一个待匹配分 词; 获取字典中的字典项和字典编码矩阵, 基于 待匹配分词、 字典项和字典编码矩阵确定字典项 与待匹配分词的相似度矩阵; 基于相似度矩阵 中, 任一字典项与各待匹配分词的相似度数据, 确定字典项与待匹配项的相似度; 基于各字典项 与待匹配项的相似度, 确定与待匹配项相匹配的 字典项。 本发 明通过对待匹配项进行分词得到待 匹配分词, 并基于待匹配分词、 字典项和字典编 码矩阵得到字典项与待匹配分词的相似度矩阵, 以及字典项与待匹配项的相似度, 进而基于相似 度确定与待匹配项匹配的字典项, 提高了信息匹 配的准确性。 权利要求书2页 说明书10页 附图3页 CN 115422924 A 2022.12.02 CN 115422924 A 1.一种信息匹配方法, 其特 征在于, 包括: 获取待匹配项, 对所述待匹配项 进行分词, 得到 至少一个待匹配分词; 获取字典中的字典项和字典编码矩阵, 基于所述待匹配分词、 所述字典项和所述字典 编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵; 基于所述相似度矩阵中, 任一所述字典项与各所述待匹配分词的相似度数据, 确定所 述字典项与所述待匹配项的相似度; 基于各所述字典项与所述待匹配项的相似度, 确定与所述待匹配项相匹配的字典项。 2.根据权利要求1所述的方法, 其特 征在于, 所述字典编码矩阵的确定方法包括: 获取字典项目中的多个字典项, 确定对所述多个字典项 去重的字典分词; 对于任一字典项, 基于所述字典项与所述字典分词的对应关系, 设置所述字典项对应 的字典分词编码, 形成字典编码矩阵。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述待匹配分词、 所述字典项和 所述字典编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵, 包括: 基于所述待匹配分词和所述字典分词进行相似度计算, 得到分词相似度, 并基于各分 词相似度生成分词相似度矩阵; 基于所述字典编码矩阵和所述分词相似度矩阵确定所述字典项与所述待匹配分词的 相似度矩阵。 4.根据权利要求3所述的方法, 其特征在于, 所述基于所述待匹配分词和所述字典分词 进行相似度计算, 得到分词相似度, 包括: 将任一所述待匹配分词和任一所述字典分词进行两 两组合得到分词组合; 基于多个预设相似度函数分别对所述分词组合进行相似度计算, 得到各所述预设相似 度函数对应的中间相似度; 基于各所述预设相似度函数对应的权重对多个中间相似度进行加权处理, 得到所述分 词组合的分词相似度。 5.根据权利要求3所述的方法, 其特征在于, 所述基于所述字典编码矩阵和所述分词相 似度矩阵确定所述字典项与所述待匹配分词的相似度矩阵, 包括: 对所述字典编码矩阵和所述分词相似度矩阵进行矩阵乘法, 得到所述字典项与所述待 匹配分词的相似度矩阵。 6.根据权利要求1所述的方法, 其特征在于, 所述基于各所述字典项与 所述待匹配项的 相似度, 确定与所述待匹配项相匹配的字典项, 包括: 基于所述字典项与 所述待匹配项的相似度对所述字典项进行排序, 提取所述排序中预 设数量的字典项; 或者, 将所述字典项与所述待匹配项的相似度与预设匹配阈值进行比对, 若所述字典 项与所述待匹配项的相似度大于所述预设匹配阈值, 则确定为与所述待匹配项相匹配的字 典项。 7.根据权利要求1所述的方法, 其特征在于, 所述与所述待 匹配项相匹配的字典项为至 少一个; 在确定与所述待匹配项相匹配的字典项之后, 所述方法还 包括: 将至少一个所述字典项发送至审核 端, 并接收所述审核 端返回的审核结果。权 利 要 求 书 1/2 页 2 CN 115422924 A 28.一种信息匹配装置, 其特 征在于, 包括: 待匹配项分词模块用于获取待匹配项, 对所述待匹配项进行分词, 得到至少一个待匹 配分词; 相似度矩阵确定模块用于获取字典中的字典项和字典编码矩阵, 基于所述待匹配分 词、 所述字典项和所述字典编码矩阵确定所述字典项与所述待匹配分词的相似度矩阵; 相似度确定模块基于所述相似度矩阵中, 任一所述字典项与 各所述待 匹配分词的相似 度数据, 确定所述字典项与所述待匹配项的相似度; 字典项确定模块基于各所述字典项与所述待 匹配项的相似度, 确定与 所述待匹配项相 匹配的字典项。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项所述的 信息匹配方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处 理器执行时实现权利要求1 ‑7中任一项所述的信息匹配方法。权 利 要 求 书 2/2 页 3 CN 115422924 A 3
专利 一种信息匹配方法、装置、电子设备及存储介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:34:06
上传分享
举报
下载
原文档
(782.5 KB)
分享
友情链接
腾讯安全 浅谈腾讯加密勒索病毒防御实践.pdf
工行 - 2023.2 - 2022网络金融黑产研究报告.pdf
DB4106-T 67-2022 数字乡村建设指南 鹤壁市.pdf
T-QGCML 1699—2023 经营数据中台可视化运维监管云平台.pdf
GB-T 43758.1-2024 智能网联汽车运行安全测试环境技术 条件 第1部分 公共道路.pdf
GB-T 15921-2010 海洋学术语 海洋化学.pdf
GB-T 38548.1-2020 内容资源数字化加工 第1部分:术语.pdf
SN-T 4764-2017 煤中碳、氢、氮、硫含量的测定 元素分析仪法.pdf
GB-T 10111-2008 随机数的产生及其在产品质量抽样检验中的应用程序.pdf
T-CASME 347—2023 融合业务运营的数据中心运维管理规范.pdf
DB31-T 862-2021 “一网通办”政务服务中心建设和运行规范 上海市.pdf
思度安全-DSMM-002 岗位职责说明书V1.0.pdf
GB-T 9711-2017 石油天然气工业 管线输送系统用钢管.pdf
GB-T 37988-2019 信息安全技术 数据安全能力成熟度模型.pdf
阿里云 专有云企业版 云平台 同城容灾用户指南 2022.pdf
GB-T 2478-2022 普通磨料 棕刚玉.pdf
GB-T 25147-2010 工业设备化学清洗中金属腐蚀率及腐蚀总量的测试方法 重量法.pdf
GB-T 20004.2-2018 团体标准化 第2部分:良好行为评价指南.pdf
GB-T 16427-2018 粉尘层电阻率测定方法.pdf
GB-T 19267.1-2008 刑事技术微量物证的理化检验 第1部分:红外吸收光谱法.pdf
1
/
16
评价文档
赞助2.5元 点击下载(782.5 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。