standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210048892.7 (22)申请日 2022.01.17 (71)申请人 空地互联网络科技股份有限公司 地址 200050 上海市长 宁区广顺路3 3号8幢 1层2099室 (72)发明人 李华 (74)专利代理 机构 北京纪凯知识产权代理有限 公司 11245 专利代理师 陆惠中 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/151(2020.01) G06F 16/332(2019.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种风险数据识别方法及系统 (57)摘要 本发明提供了一种风险数据识别方法及系 统; 其中, 所述方法包括: S10, 响应于服务接通信 号, 持续监测接通过程中的交互数据; S20, 对所 述交互数据进行语义识别以提取出交互内容序 列; S30, 对所述交互内容序列进行第一计算, 若 第一计算的第一结果满足第一条件, 则转S40, 否 则转S10; S40, 对所述交互内容序列进行第二计 算, 若所述第二计算的第二结果满足第二条件, 则输出所述交互数据存在风险的提示信息, 否则 转S10; 本发明的方案设计了对风险数据的两步 分析法, 既保证了风险数据识别的低遗漏率, 也 降低了非必要识别的处 理量, 提高了识别效率。 权利要求书2页 说明书8页 附图2页 CN 114444511 A 2022.05.06 CN 114444511 A 1.一种风险数据识别方法, 其特 征在于, 包括如下步骤: S10, 响应于服 务接通信号, 持续 监测接通过程中的交 互数据; S20, 对所述交 互数据进行语义识别以提取 出交互内容序列; S30, 对所述交互内容序列进行第一计算, 若第一计算的第一结果满足第一条件, 则转 S40, 否则转S10; S40, 对所述交互内容序列进行第二计算, 若所述第二计算的第二结果满足第二条件, 则输出所述交互数据存在风险的提 示信息, 否则转S10 。 2.根据权利要求1所述的一种风险数据识别方法, 其特征在于: 步骤S20 中, 所述对所述 交互数据进行语义识别以提取 出交互内容序列, 包括: 将所述交互数据转化为标准文本数据, 对所述标准文本数据进行分割处理以获得文本 矩阵, 所述文本矩阵中包括若干词汇; 将所述文本矩阵与各主题项目进行匹配 计算, 以得 出目标主题项目矩阵; 将所述文本矩阵与所述目标主题项目矩阵作为所述交 互内容序列。 3.根据权利要求2所述的一种风险数据识别方法, 其特征在于: 所述将所述文本矩阵与 各主题项目进行匹配 计算, 以得 出目标主题项目矩阵, 包括: 分别计算所述文本矩阵中各词汇与所述各主题项目的第一相似度; 基于各词汇的所述第 一相似度计算所述文本矩阵与各主题项目的第 二相似度, 基于所 述第二相似度确定所述文本矩阵匹配的目标主题项目矩阵。 4.根据权利要求3所述的一种风险数据识别方法, 其特征在于: 所述基于各词汇的所述 第一相似度计算所述文本矩阵与各主题项目的第二相似度, 包括: 基于所述第一相似度和第一阈值将各词汇与各主题项目进行分配; 通过下式计算所述文本矩阵与各主题项目的第二相似度: 式中, zi=j代表将所述文本矩阵分配给主题项目j, 即S(zi=j)代表 所述文本矩阵与各 主题项目的第二相似度, 即所述文本矩阵分配给所述主题项目j的概率; nw代表所述文本矩 阵中分配给所述主题项目j的特定词的数量, 所述特定词是各所述主题项目分别预先设置 的, 用于描述主题项目的核心内涵的词汇, δ代表所述文本矩阵特定词的数量; nd代表所述 文本矩阵中所有被分配了主题项目的词汇的数量, k代表所述主题项目的数量; α、 β 为预设 的调节参数, 其中, α +β =1, 且根据特定词在所述文本矩阵中特定词的等效序号确定得出, 等效序号越大, 则α 越大, 而等效序号可以为各 特定词的序号的均值/加权均值。 5.根据权利要求4所述的一种风险数据识别方法, 其特征在于: 步骤S30 中, 所述对所述 交互内容序列进行第一计算, 包括: 基于所述目标主题项目矩阵提取第一 风险序列; 基于所述文本矩阵中的被分配了的词汇计算所述文本矩阵与第一风险序列的第三相 似度, 将所述第三相似度作为第一结果; 相应地, 所述第 一计算的第 一结果满足第一条件, 具体为: 所述第三相似度大于第二阈权 利 要 求 书 1/2 页 2 CN 114444511 A 2值。 6.根据权利要求5所述的一种风险数据识别方法, 其特征在于: 步骤S40 中, 所述对所述 交互内容序列进行第二计算, 包括: 将所述文本矩阵和所述第 一风险序列输入深度学习 模型, 所述深度学习 模型输出第四 相似度, 将所述第四相似度作为所述第二结果; 相应地, 所述第 二计算的第 二结果满足第二条件, 具体为: 所述第四相似度大于第三阈 值。 7.根据权利要求6所述的一种风险数据识别方法, 其特征在于: 在输出所述交互数据存 在风险的提 示信息之后, 还 包括: 监测响应数据, 所述响应数据包括 正响应和负响应; 基于所述负响应对应的所述文本矩阵和所述第 一风险序列构建训练集, 基于所述训练 集对所述深度学习模型进行 再训练。 8.一种风险数据识别系统, 包括处理模块、 存储模块、 通信模块, 所述处理模块分别与 所述存储模块和所述 通信模块连接; 其中, 所述存储模块, 用于存 储可执行的计算机程序代码; 所述通信模块, 用于响应于服务接通信号而持续监测接通过程中的交互数据, 并将所 述交互数据传输给 所述处理模块; 其特征在于: 所述处理模块, 用于通过调用所述存储模块中的所述可执行的计算机程 序代码, 执 行如权利要求1 ‑7任一项所述的方法。 9.一种电子设备, 包括: 存储有可执行程序代码的存 储器; 与所述存 储器耦合的处 理器; 其特征在于: 所述处理器调用所述存储器中存储的所述可执行程序代码, 执行如权利 要求1‑7任一项所述的方法。 10.一种计算机存储介质, 该存储介质上存储有计算机程序, 其特征在于: 该计算机程 序被处理器运行时执 行如权利要求1 ‑7任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114444511 A 3
专利 一种风险数据识别方法及系统
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:54
上传分享
举报
下载
原文档
(458.3 KB)
分享
友情链接
GB-T 18781-2023 珍珠分级.pdf
GB-T 43706-2024 资产管理 战略资产管理计划 SAMP 实施指南.pdf
T-ASCQ 001—2022 波束形成定向扩声系统技术规范.pdf
法律法规 最高人民法院、最高人民检察院关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释2019-10-21.pdf
GB-T 9634.8-2018 铁氧体磁心 表面缺陷极限导则 第8部分:PQ型磁心.pdf
SY-T 7657.3-2021 天然气 利用光声光谱-红外光谱-燃料电池联合法测定组成 第3部分:红外光谱法测定乙烷及以上烷烃、二氧化碳、一氧化碳含量.pdf
绿盟 AISecOps智能安全运营技术白皮书 2020.pdf
ISO-IEC 27007 英文版 2022.pdf
DB15-T 835-2015 磷石膏改良碱化土壤技术规程 内蒙古自治区.pdf
T-NKFA 010—2022 家具企业生产质量管理规范.pdf
DB43-T 1267-2023 机动车检验机构建设和运行管理规范 湖南省.pdf
GB-T 34610-2017 节水型企业 炼焦行业.pdf
GB-T 4723-2017 印制电路用覆铜箔酚醛纸层压板.pdf
T-ZJBE 002—2023 电动自行车充换电消防安全技术要求.pdf
GB-T 42932-2023 道路交通资产管理体系实施指南.pdf
DB46-T 154-2009 电梯节能改造技术指南 海南省.pdf
LY-T 1738-2020 实木复合地板用胶合板.pdf
NB-T 10936-2022 电加热锅炉技术条件.pdf
GB-T 36630.4-2018 信息安全技术 信息技术产品安全可控评价指标 第4部分:办公套件.pdf
GB-T 41973-2022 工业通风机 平衡品质与振动等级规范.pdf
1
/
13
评价文档
赞助2.5元 点击下载(458.3 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。