standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210034903.6 (22)申请日 2022.01.13 (71)申请人 北京理工大 学 地址 100081 北京市海淀区中关村南大街5 号 (72)发明人 宋丹丹 侯思琦  (74)专利代理 机构 北京正阳理工知识产权代理 事务所(普通 合伙) 11639 专利代理师 张利萍 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/216(2020.01) G06F 40/242(2020.01) G06F 40/30(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 针对请求和情感标签生成的带有指定情感 的机器回复方法 (57)摘要 本发明涉及针对请求和情感标签生成的带 有指定情感的机器回复方法, 属于自然语言处理 技术领域。 本发明利用 深度学习框架, 引入预训 练情感打分机制, 能够控制回复生成过程中的情 感表达, 考虑到了词汇以及词与词之间相互作 用; 引入细粒度情感词典, 综合考虑了情感词汇 在不同情感类别中出现的概率, 同时在训练过程 中微调, 能够丰富输出回复的情感表达; 利用条 件变分自编码器对参考回复建模, 使得解码器能 够学习到输入和输出的对应关系, 优化回复与输 入请求之间的语义关联。 本发明在多个情感对话 生成数据集上均取得了良好的性能提升, 同时本 发明提出的预训练情感打分器具有很强的灵活 性和适配性。 权利要求书3页 说明书5页 附图3页 CN 114547261 A 2022.05.27 CN 114547261 A 1.针对请求和情感标签生成的带有指定情感的机器回复方法, 其特征在于, 包括以下 步骤: 步骤1: 利用带情感标签的对话数据集, 提取其中带有情感的句子, 得到用于预训练模 型的语料集, 同时搜集全部语句作为正式训练语料集; 计算词汇的词 频‑逆文本频率, 用于 获取主题词典, 同时, 获取外 部情感词典; 利用整体 语料集, 训练获取词的向量表示; 步骤2: 构建预训练网络模型, 用于情感打 分; 预训练网络模型由长短期记忆LSTM和全连接层构成, 其输出为情感分类情况, 其中, 情 感得分score由余弦相似度计算, 如式1所示: 其中, pclassify表示情感分类结果, lone‑hot表示情感标签的独热向量; ‖ ·‖表示向量 ·的 2范数; 预训练损失函数如下式所示: L′=L′1+L′2                         (2) L′1=(1‑score)                      (3) L′2=‑∑jyjlog(pj)                   (4) 其中, L′表示预训练损失函数, L ′1表示情感得分损失, L ′2表示情感分类损失; pj表示数 据被分到第j类的概 率; yj表示实际分类结果, 当数据属于j类时为1, 其 余情况为0; 步骤3: 构建用于正式训练的损失函数; 正式训练损失函数包 含以下三个部分: 一是条件变分自编码器分布之间的KL散度 表示如下: 其中, KL表示KL散度计算, Pr()表示条件变分自编码器中的识别网络输出的分布, z表 示隐变量, X表示输入请求, 表示参考回复, Pp()表示条件变分自编码器中的先验网络输 出的分布; 二是对隐变量的情感分类损失 表示如下: 其中, 表示在分布 下的交叉熵; P(label|z)表示对隐变 量z的分 类结果为label的概 率, label表示目标情感类别; 三是输出回复序列 与参考回复序列之间的交叉熵损失 表示如下: 其中, Y表示目标输 出, z表示隐变量, t表示时间步, yt表示第t个时间步的输 出, y表示时 间步的输出; 则用于正式训练的损失函数 表示如下: 权 利 要 求 书 1/3 页 2 CN 114547261 A 2其中, α 为超参数, 用于控制KL损失所占的权 重, 在训练过程中由0增至1; 步骤4: 利用步骤1获取的训练数据和步骤2构建的预训练网络模型, 训练得到预训练情 感打分网络参数Parameterpre‑train; 步骤5: 利用步骤1得到的训练数据、 步骤3的损失函数, 以及步骤4得到的预训练情 感打 分网络参数, 训练步骤2构建的预训练网络模型; 实际运行情感对话生成应用, 在没有参考回复的条件下, 利用条件变分自编码器中的 判别网络, 生成隐变量的分布。 2.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其 特征在于, 步骤5包括以下步骤: Step1: 用步骤1的词向量和 步骤4得到的网络参数P arameterpre‑train, 初始化预训练网 络模型; Step2: 每一个批次包含步骤1得到的训练数据中的输入请求、 参考回复和参考回复的 情感标签, 句子序列被映射到向量空间, 分别送入编码器和 变分自编码器, 得到中间表示h 和隐变量z; Step3: 用step2得到的输入中间表示, 以及情感嵌入和情感得分, 整合后送入解码器 中, 表示如下: 其中, st表示第t个时间步的状态输出, st‑1表示第t‑1个时间步的状态输出; 表示 注意力机制的权重; hi表示编码器第i个时间步的输出; Ct‑1表示第t‑1个时间步的输入, 表示参考 回复第t‑1个时间步的词, emb(y)表示词y对应的词向量, Extrainfo表示由隐 变量z和情感 嵌入拼接成的向量, scoret‑1表示第t‑1步情感打 分器的输出 得分; Step4: 将step3的输出进行输出映射, 得到 输出词; Step5: 将输出的词汇送入预训练情感打分器中, 得到当前情感得分, 并重复step3 ‑5, 直到输出为句子结束标志eos; Step6: 计算损失函数并利用反向传播计算梯度, 利用动量优化算法Momentum   Optimizer进行优化, 更新模型参数值; Step7: 重复step2 ‑6, 直至损失函数趋 于稳定。 3.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其 特征在于, 步骤1中, 利用整体语料集采用GloVE方法获取词的向量表示, 词向量维度选为 100维。 4.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其 特征在于, 步骤1中, 提取句子的情感标签包括快乐、 悲伤、 厌 恶、 愤怒和喜欢。 5.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其 特征在于, 步骤2的预训练网络模 型, 包括编码 器(1)、 第二编码器(2)、 第三编码器(3)、 解码 器、 条件变分自编码 器、 输出映射模块和预训练情感打分器; 其中, 三个编码 器以及解码 器, 均由门控循环单元GRU构成, 用于进 行输入输出映射; 条件变 分自编码器用于将参考回复映权 利 要 求 书 2/3 页 3 CN 114547261 A 3

PDF文档 专利 针对请求和情感标签生成的带有指定情感的机器回复方法

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 针对请求和情感标签生成的带有指定情感的机器回复方法 第 1 页 专利 针对请求和情感标签生成的带有指定情感的机器回复方法 第 2 页 专利 针对请求和情感标签生成的带有指定情感的机器回复方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:33:56上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。