(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210034903.6
(22)申请日 2022.01.13
(71)申请人 北京理工大 学
地址 100081 北京市海淀区中关村南大街5
号
(72)发明人 宋丹丹 侯思琦
(74)专利代理 机构 北京正阳理工知识产权代理
事务所(普通 合伙) 11639
专利代理师 张利萍
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/35(2019.01)
G06F 40/216(2020.01)
G06F 40/242(2020.01)
G06F 40/30(2020.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
针对请求和情感标签生成的带有指定情感
的机器回复方法
(57)摘要
本发明涉及针对请求和情感标签生成的带
有指定情感的机器回复方法, 属于自然语言处理
技术领域。 本发明利用 深度学习框架, 引入预训
练情感打分机制, 能够控制回复生成过程中的情
感表达, 考虑到了词汇以及词与词之间相互作
用; 引入细粒度情感词典, 综合考虑了情感词汇
在不同情感类别中出现的概率, 同时在训练过程
中微调, 能够丰富输出回复的情感表达; 利用条
件变分自编码器对参考回复建模, 使得解码器能
够学习到输入和输出的对应关系, 优化回复与输
入请求之间的语义关联。 本发明在多个情感对话
生成数据集上均取得了良好的性能提升, 同时本
发明提出的预训练情感打分器具有很强的灵活
性和适配性。
权利要求书3页 说明书5页 附图3页
CN 114547261 A
2022.05.27
CN 114547261 A
1.针对请求和情感标签生成的带有指定情感的机器回复方法, 其特征在于, 包括以下
步骤:
步骤1: 利用带情感标签的对话数据集, 提取其中带有情感的句子, 得到用于预训练模
型的语料集, 同时搜集全部语句作为正式训练语料集; 计算词汇的词 频‑逆文本频率, 用于
获取主题词典, 同时, 获取外 部情感词典; 利用整体 语料集, 训练获取词的向量表示;
步骤2: 构建预训练网络模型, 用于情感打 分;
预训练网络模型由长短期记忆LSTM和全连接层构成, 其输出为情感分类情况, 其中, 情
感得分score由余弦相似度计算, 如式1所示:
其中, pclassify表示情感分类结果, lone‑hot表示情感标签的独热向量; ‖ ·‖表示向量 ·的
2范数;
预训练损失函数如下式所示:
L′=L′1+L′2 (2)
L′1=(1‑score) (3)
L′2=‑∑jyjlog(pj) (4)
其中, L′表示预训练损失函数, L ′1表示情感得分损失, L ′2表示情感分类损失; pj表示数
据被分到第j类的概 率; yj表示实际分类结果, 当数据属于j类时为1, 其 余情况为0;
步骤3: 构建用于正式训练的损失函数;
正式训练损失函数包 含以下三个部分:
一是条件变分自编码器分布之间的KL散度
表示如下:
其中, KL表示KL散度计算, Pr()表示条件变分自编码器中的识别网络输出的分布, z表
示隐变量, X表示输入请求,
表示参考回复, Pp()表示条件变分自编码器中的先验网络输
出的分布;
二是对隐变量的情感分类损失
表示如下:
其中,
表示在分布
下的交叉熵; P(label|z)表示对隐变 量z的分
类结果为label的概 率, label表示目标情感类别;
三是输出回复序列 与参考回复序列之间的交叉熵损失
表示如下:
其中, Y表示目标输 出, z表示隐变量, t表示时间步, yt表示第t个时间步的输 出, y表示时
间步的输出;
则用于正式训练的损失函数
表示如下:
权 利 要 求 书 1/3 页
2
CN 114547261 A
2其中, α 为超参数, 用于控制KL损失所占的权 重, 在训练过程中由0增至1;
步骤4: 利用步骤1获取的训练数据和步骤2构建的预训练网络模型, 训练得到预训练情
感打分网络参数Parameterpre‑train;
步骤5: 利用步骤1得到的训练数据、 步骤3的损失函数, 以及步骤4得到的预训练情 感打
分网络参数, 训练步骤2构建的预训练网络模型;
实际运行情感对话生成应用, 在没有参考回复的条件下, 利用条件变分自编码器中的
判别网络, 生成隐变量的分布。
2.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其
特征在于, 步骤5包括以下步骤:
Step1: 用步骤1的词向量和 步骤4得到的网络参数P arameterpre‑train, 初始化预训练网
络模型;
Step2: 每一个批次包含步骤1得到的训练数据中的输入请求、 参考回复和参考回复的
情感标签, 句子序列被映射到向量空间, 分别送入编码器和 变分自编码器, 得到中间表示h
和隐变量z;
Step3: 用step2得到的输入中间表示, 以及情感嵌入和情感得分, 整合后送入解码器
中, 表示如下:
其中, st表示第t个时间步的状态输出, st‑1表示第t‑1个时间步的状态输出;
表示
注意力机制的权重; hi表示编码器第i个时间步的输出; Ct‑1表示第t‑1个时间步的输入,
表示参考 回复第t‑1个时间步的词, emb(y)表示词y对应的词向量, Extrainfo表示由隐
变量z和情感 嵌入拼接成的向量, scoret‑1表示第t‑1步情感打 分器的输出 得分;
Step4: 将step3的输出进行输出映射, 得到 输出词;
Step5: 将输出的词汇送入预训练情感打分器中, 得到当前情感得分, 并重复step3 ‑5,
直到输出为句子结束标志eos;
Step6: 计算损失函数并利用反向传播计算梯度, 利用动量优化算法Momentum
Optimizer进行优化, 更新模型参数值;
Step7: 重复step2 ‑6, 直至损失函数趋 于稳定。
3.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其
特征在于, 步骤1中, 利用整体语料集采用GloVE方法获取词的向量表示, 词向量维度选为
100维。
4.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其
特征在于, 步骤1中, 提取句子的情感标签包括快乐、 悲伤、 厌 恶、 愤怒和喜欢。
5.如权利要求1所述的针对请求和情感标签生成的带有指定情感的机器回复方法, 其
特征在于, 步骤2的预训练网络模 型, 包括编码 器(1)、 第二编码器(2)、 第三编码器(3)、 解码
器、 条件变分自编码 器、 输出映射模块和预训练情感打分器; 其中, 三个编码 器以及解码 器,
均由门控循环单元GRU构成, 用于进 行输入输出映射; 条件变 分自编码器用于将参考回复映权 利 要 求 书 2/3 页
3
CN 114547261 A
3
专利 针对请求和情感标签生成的带有指定情感的机器回复方法
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:33:56上传分享