standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211502787.2 (22)申请日 2022.11.29 (71)申请人 四川骏逸 富顿科技有限公司 地址 610000 四川省成 都市中国 (四川) 自 由贸易试验区成都高新区天府大道北 段1700号9栋1单 元20层20 07号 (72)发明人 罗安 周聪俊 史鹏翔 许春霞  徐明 何进  (74)专利代理 机构 中科专利商标代理有限责任 公司 11021 专利代理师 鄢功军 (51)Int.Cl. G06F 30/27(2020.01) G06K 9/62(2022.01) G16H 20/10(2018.01)G06F 119/02(2020.01) (54)发明名称 药店风险等级识别模型生成方法及药店风 险等级识别方法 (57)摘要 本申请提供了一种药店风险等级识别模型 生成方法及药店风险等级识别方法, 可以应用于 药品风险监管技术领域。 药店风险等级识别模型 生成方法包括: 采集多个药店的历史业务行为数 据, 得到第一样本数据集; 基于第一样本数据集 中的样本数量和多个药店的历史风险等级标签, 确定第一样 本数据集的第一信息熵; 基于样本数 据子集和历史风险等级 标签来处理第一信息熵, 得到样本数据子集的信息增益率; 基于与多个风 险特征属性一一对应的多个信息增益率, 确定多 个风险权值; 以及基于贝 叶斯算法, 利用多个风 险权值和历史风险等级标签来生成风险等级识 别模型。 利用本申请的技术方案可以有效降低药 店风险等级识别的实施成本, 提高风险等级识别 精度。 权利要求书4页 说明书16页 附图7页 CN 115544902 A 2022.12.30 CN 115544902 A 1.一种药店风险等级识别模型生成方法, 其特 征在于, 包括: 采集多个药店的历史业务行为数据, 得到第一样本数据集, 其中, 所述历史业务行为数 据包括多个风险特 征属性; 基于所述第 一样本数据集中的样本数量和多个所述药店的历史风险等级标签, 确定所 述第一样本数据集的第一信息熵; 基于样本数据子集和所述历史风险等级标签来处理所述第 一信息熵, 得到所述样本数 据子集的信息增益率, 其中, 所述第一样本数据集包括多个所述样本数据子集, 多个所述样 本数据子集与多个所述 风险特征属性一一对应; 基于与多个所述 风险特征属性一一对应的多个信息增益 率, 确定多个风险权值; 以及 基于贝叶斯算法, 利用多个所述风险权值和所述历史风险等级标签来生成风险等级识 别模型。 2.根据权利要求1所述的方法, 其特征在于, 所述基于样本数据子集和所述历史风险等 级标签来处 理所述第一信息熵, 得到所述样本数据子集的信息增益 率, 包括: 对于每个所述样本数据子集, 基于所述样本数据子集和所述历史风险等级标签来确定 所述样本数据子集的第二信息熵和所述样本数据子集针对所述第一样本数据集的条件熵; 基于所述条件熵和所述第一信息熵, 确定所述样本数据子集的信息增益; 以及 基于所述样本数据子集的信 息增益和所述第 二信息熵, 确定所述样本数据子集的信 息 增益率。 3.根据权利要求1所述的方法, 其特 征在于, 还 包括: 对所述第一样本数据集进行 数据增强处 理, 得到第二样本数据集; 其中, 所述基于所述第 一样本数据集中的样本数量和多个所述药店的历史风险等级标 签, 确定所述第一样本数据集的第一信息熵, 包括: 基于所述第 二样本数据集中的样本数量和多个所述药店的历史风险等级标签, 确定所 述第二样本数据集的第一信息熵; 其中, 所述样本数据子集中包括所述第 二样本数据集中与每个所述风险特征属性对应 的样本。 4.根据权利要求1所述的方法, 其特 征在于, 还 包括: 确定所述第一样本数据集中包 含的样本数量; 以及 在所述样本数量大于第 一预设阈值的情况下, 利用所述第 一样本数据集来训练初始网 络模型, 以生成所述 风险等级识别模型。 5.根据权利要求4所述的方法, 其特征在于, 所述利用所述第 一样本数据集来训练初始 网络模型, 以生成所述 风险等级识别模型, 包括: 对所述第一样本数据集进行 数据增强处 理, 得到第二样本数据集; 对所述第二样本数据集中的样本数据作归一 化处理, 得到第三样本数据集; 以及 基于预设学习参数, 利用所述第三样本数据集来训练所述初始网络模型, 得到所述风 险等级识别模型。 6.根据权利要求3或5所述的方法, 其特征在于, 所述对所述第一样本数据集进行数据 增强处理, 得到第二样本数据集, 包括: 对所述第一样本数据集中的样本进行分类, 得到属于第 一类别的多个第 一样本和属于权 利 要 求 书 1/4 页 2 CN 115544902 A 2第二类别的多个第二样本, 其中, 所述第一类别的样本数量大于所述第二类别的样本数量; 对于每个所述第二样本, 利用K近邻算法从所述第一样本数据集中确定多个第三样本; 根据多个所述第三样本所属的类别, 基于所述第二样本生成至少一个第四样本; 以及 基于多个所述第一样本和多个所述第四样本, 生成所述第二样本数据集。 7.根据权利要求6所述的方法, 其特征在于, 所述根据多个所述第三样本所属的类别, 基于所述第二样本生成至少一个第四样本, 包括: 在多个所述第 三样本中属于所述第 一类别的样本数量小于第 二预设阈值的情况下, 确 定所述第四样本为所述第二样本; 在多个所述第三样本中属于所述第一类别的样本数量大于或等于所述第二预设阈值 的情况下, 从所述第三样本中确定 至少一个第五样本; 以及 基于至少一个所述第五样本和所述第二样本来 生成至少一个所述第四样本 。 8.根据权利要求4所述的方法, 其特征在于, 所述基于所述第 一样本数据集中的样本数 量和多个所述药店的历史风险等级标签, 确定所述第一样本数据集的第一信息熵, 包括: 在所述样本数量小于或等于所述第 一预设阈值的情况下, 基于所述第 一样本数据集中 的样本数量和多个所述药店的历史风险等级标签, 确定所述第一样本数据集的第一信息 熵。 9.根据权利要求1所述的方法, 其特征在于, 所述基于贝叶斯算法, 利用多个所述风险 权值和所述历史风险等级标签来 生成风险等级识别模型, 包括: 基于多个所述药店的历史风险等级标签, 确定多个所述风险等级中每个所述风险等级 的历史概 率; 对于每个所述风险等级, 基于多个所述药店的历史风险等级标签, 确定多个所述风险 特征属性中每 个所述风险特征属性的后验概 率; 以及 基于贝叶斯算法, 利用多个所述风险权值、 多个所述历史概率和多个所述后验概率来 生成所述 风险等级识别模型。 10.一种药店风险等级识别方法, 其特 征在于, 包括: 采集目标 药店的目标业 务行为数据, 得到第一目标 数据集; 以及 利用风险等级识别模型来处理所述第 一目标数据集, 得到所述目标药店的风险等级识 别结果; 其中, 所述风险等级识别模型包括使用如权利要求1~9中任一项所述的药店风险等级 识别模型生成方法来 生成的。 11.根据权利要求10所述的方法, 其特征在于, 所述风险等级识别模型包括风险等级识 别概率模型或风险等级识别网络模型。 12.根据权利要求11所述的方法, 其特征在于, 所述目标业务行为数据包括多个风险特 征属性; 其中, 所述利用风险等级识别模型来处理所述第一目标数据集, 得到所述目标药店的 风险等级识别结果, 包括: 在所述风险等级识别模型为风险等级识别概率模型的情况下, 从所述风险等级识别概 率模型中获取与多个所述风险特征属性一一对应的多个风险权值、 多个历史概率和多个后 验概率, 其中, 所述历史概率包括多个所述风险等级中每个所述风险等级的历史概率, 所述权 利 要 求 书 2/4 页 3 CN 115544902 A 3

.PDF文档 专利 药店风险等级识别模型生成方法及药店风险等级识别方法

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 药店风险等级识别模型生成方法及药店风险等级识别方法 第 1 页 专利 药店风险等级识别模型生成方法及药店风险等级识别方法 第 2 页 专利 药店风险等级识别模型生成方法及药店风险等级识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 07:23:51上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。