(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211323785.7
(22)申请日 2022.10.27
(71)申请人 北京元知创智科技有限公司
地址 100026 北京市朝阳区酒仙桥将台路
14号26幢二层26 -202室
(72)发明人 雷亮 贺跃杰 丁宇 申冠生
(74)专利代理 机构 北京金咨知识产权代理有限
公司 11612
专利代理师 王晓雅
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 16/35(2019.01)
G06F 40/242(2020.01)
G06F 40/289(2020.01)
G06F 40/30(2020.01)G16H 50/20(2018.01)
(54)发明名称
中医症候智能识别方法及装置
(57)摘要
本申请提供一种中医症候智能识别方法及
装置, 方法包括: 根据目标中医医案对应的各个
目标症状词, 自用于存储各个症状词与各个词向
量之间对应关系的词向量数据库中匹配得到各
个目标症状词各自的目标词向量, 各个症状词是
预先对中医医案描述文本进行词典匹配及文本
分词后生成的; 各个词向量为预先采用N ‑gram语
言特征对各个症状词进行切词, 再基于CBOW或
skip‑gram模型训练后生成的; 生成目标中医医
案向量; 根据目标中医医案向量和中医症候智能
识别模型识别目标中医医案的症 候信息。 本申请
能够充分的提取中医医案中的语义特征, 能够在
保证中医症候分类识别的自动化及智能化的基
础上, 有效提高中医症候分类识别的精确性及有
效性。
权利要求书3页 说明书16页 附图4页
CN 115391494 A
2022.11.25
CN 115391494 A
1.一种中 医症候智能识别方法, 其特 征在于, 包括:
根据目标中医医案对应的各个目标症状词, 自用于存储各个症状词与 各个词向量之间
对应关系的词向量数据库中分别匹配得到各个所述目标症状词各自对应的目标词向量, 其
中, 各个所述症状词是预先对历史中医医案文档数据进行词典匹配及文本分词后生成的;
各个所述词向量为预先采用N ‑gram语言特征对各个症状词进行切词, 然后基于CBOW或
skip‑gram词向量神经网络模型训练后生成的;
生成各个所述目标词向量对应的一个目标中 医医案向量;
根据所述目标中医医案向量和预设的中医症候智能识别模型识别得到所述目标中医
医案对应的症候信息 。
2.根据权利要求1所述的中医症候智能识别方法, 其特征在于, 在所述自用于存储各个
症状词与各个词向量之间对应关系的词向量数据库中分别匹配得到各个所述目标症状词
各自对应的目标词向量之前, 还 包括:
获取多个历史中 医医案文档数据;
对各个所述历史中医医案文档数据分别进行词典匹配及文本分词处理, 得到对应的包
含有各个症状词的历史中 医医案分词结果;
基于N‑gram语言特征对所述历史中医医案分词结果进行切分, 得到各个所述症状词分
别对应的N ‑gram特征词;
根据预设的词向量维度, 对各个所述症状词和各个所述N ‑gram特征词进行向量初始化
操作, 得到各个所述症状词和各个所述 N‑gram特征词分别对应的初始化向量;
基于CBOW或skip ‑gram词向量神经网络模型对所述初始化向量进行模型训练, 得到各
个症状词和各个所述N ‑gram特征词各自对应的词向量, 并将各个症状词和各个所述N ‑gram
特征词分别与各个词向量之间的对应关系存 储至词向量数据库中。
3.根据权利要求1所述的中医症候智能识别方法, 其特征在于, 所述中医症候智能识别
模型包括: 用于存 储各个症候向量的症候向量数据库和相似度计算公式;
相对应的, 所述根据 所述目标中医医案向量和预设的中医症候智能识别模型识别得到
所述目标中 医医案对应的症候信息, 包括:
获取所述目标中医医案向量分别与所述症候向量数据库中的各个症候向量之间的相
似度;
在各个所述相似度中选取数值最大的一个作为目标相似度, 并将该目标相似度对应的
症候向量确定为所述目标中 医医案向量对应的症候向量;
输出所述症候向量对应的症候信息 。
4.根据权利要求3所述的中医症候智能识别方法, 其特征在于, 在所述根据所述目标中
医医案向量和预设的中医症候智能识别模型识别得到所述目标中医医案对应的症候信息
之前, 还包括:
归类各个预设的症候各自对应的历史中医医案文档数据, 并获取各个所述历史中医医
案文档数据各自对应的各个症状词;
在所述词向量数据库中分别匹配得到各个所述症状词对应的词向量;
分别将每个所述历史中医医案文档数据各自对应的各个所述词向量相加, 得到各个所
述历史中 医医案文档数据分别对应的医案向量;权 利 要 求 书 1/3 页
2
CN 115391494 A
2分别获取归类至每个所述症候下的各个所述医案向量的平均值, 得到各个所述症候分
别对应的初始 症候向量;
获取每个所述症候下的各个所述医案向量与对应的所述初始症候向量之间的欧式距
离或余弦相似度;
按所述欧式距离或余弦相似度从小到大的顺序, 对每个所述症候下的各个所述医案向
量进行排序, 得到各个所述症候各自对应的第一医案向量 排序序列;
自各个所述第 一医案向量排序序列的尾部删除预设百分比的医案向量, 以形成各个症
候各自对应的第二医案向量 排序序列;
获取各个症候各自对应的第 二医案向量排序序列中的各个所述医案向量的平均值, 得
到各个所述症候分别对应的症候向量, 将各个所述症候向量存 储至症候向量数据库。
5.根据权利要求1所述的中医症候智能识别方法, 其特征在于, 所述中医症候智能识别
模型包括: 叶子结点 为症候的霍夫 曼树;
相对应的, 所述根据 所述目标中医医案向量和预设的中医症候智能识别模型识别得到
所述目标中 医医案对应的症候信息, 包括:
将所述目标中医医案向量输入叶子结点为症候的霍夫曼树, 以使得该霍夫曼树输出目
的结点对应的症候信息 。
6.根据权利要求5所述的中医症候智能识别方法, 其特征在于, 在所述将所述目标中医
医案向量输入叶子结点 为症候的霍夫 曼树之前, 还 包括:
归类各个预设的症候各自对应的历史中医医案文档数据, 并获取各个所述历史中医医
案文档数据各自对应的各个症状词;
在所述词向量数据库中分别匹配得到各个所述症状词各自对应的词向量, 以得到对应
的训练数据集;
分别将每个所述历史中医医案文档数据各自对应的各个所述词向量相加, 得到各个所
述历史中 医医案文档数据分别对应的医案向量;
根据各个所述症候在所述训练数据集中出现的频率构建叶结点是症候的霍夫曼树, 并
基于各个所述医案向量迭代更新所述霍夫 曼树。
7.一种中 医症候智能识别装置, 其特 征在于, 包括:
词向量匹配模块, 用于根据目标中医医案对应的各个目标症状词, 自用于存储各个症
状词与各个词向量之间对应关系的词向量数据库中分别匹配得到各个所述目标症状词 各
自对应的目标词向量, 其中, 各个所述症状词是预先对历史中医医案文档数据进行词典匹
配及文本分词后生成的; 各个所述词向量为预先采用N ‑gram语言特征对各个症状词进 行切
词, 然后基于 CBOW或sk ip‑gram词向量神经网络模型训练后生成的;
医案向量 生成模块, 用于生成各个所述目标词向量对应的一个目标中 医医案向量;
症候识别模块, 用于根据所述目标中医医案向量和预设的中医症候智能识别模型识别
得到所述目标中 医医案对应的症候信息 。
8.根据权利要求7所述的中医症候智能识别装置, 其特征在于, 还包括: 词向量数据库
构建模块;
所述词向量数据库构建模块用于执 行下述内容:
获取多个历史中 医医案文档数据;权 利 要 求 书 2/3 页
3
CN 115391494 A
3
专利 中医症候智能识别方法及装置
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:45:04上传分享