standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210032379.9 (22)申请日 2022.01.12 (71)申请人 车智互联 (北京) 科技有限公司 地址 100080 北京市海淀区丹棱 街3号B座 11层1110、 1111室 (72)发明人 雷涛 杨雷 (74)专利代理 机构 北京思睿峰知识产权代理有 限公司 1 1396 专利代理师 谢建云 赵爱军 (51)Int.Cl. G06F 40/30(2020.01) G06F 40/205(2020.01) G06F 40/216(2020.01) G06F 40/284(2020.01) G06N 3/04(2006.01) (54)发明名称 一种文本生成模型及文本生成方法 (57)摘要 本公开公开了一种文本生成模型及文本生 成方法。 其中, 文本生成模型, 包括: 编码模块和 解码模块。 编码模块适于对输入数据进行处理, 以提取出指示其语义特征的第一向量; 解码模块 适于对第一向量进行处理, 以生成至少一个句向 量, 来组成长文本。 进一步地, 解码模块又包括: 子句内容规划单元, 与编码模块耦接, 适于接收 编码模块的输出, 对编码模块输出的第一向量进 行处理, 以确定出至少一个指示子句语义特征的 第二向量; 单词生成单元, 与子句内容规划单元 耦接, 适于对第二向量进行处理, 生成多个单词 对应的词向量, 以及, 利用词向量, 组合成至少一 个句向量, 来 生成长文本 。 权利要求书2页 说明书9页 附图3页 CN 114462419 A 2022.05.10 CN 114462419 A 1.一种解码模块, 适于布置在文本生成模型中, 与编码模块相耦接, 包括: 子句内容规划单元, 与所述编码模块耦接, 适于接收所述编码模块的输出, 对所述编码 模块输出的第一向量进行处 理, 以确定出至少一个指示子句语义特 征的第二向量; 单词生成单元, 与所述子句内容规划单元耦接, 适于对所述第二向量进行处理, 生成多 个单词对应的词向量, 以及, 利用所述词向量, 组合成至少一个句向量, 来 生成长文本 。 2.如权利要求1所述的解码模块, 其中, 所述单词生成单 元还适于, 在每个时间步进行束搜索, 得到各句向量的概 率值; 按照概率值从大到小的顺序, 依序选取第一数量个句向量, 作为 候选序列; 针对所述 候选序列, 分别计算每两个句向量之间的差异值; 基于所述差异值, 重构候选序列; 重复迭代计算差异值的步骤和重构候选序列的步骤, 直至所述差异值满足预设条件 时, 确定出属于候选序列的句向量。 3.如权利要求2所述的解码模块, 其中, 所述单词生成单 元还适于, 当两个句向量的差异值大于阈值时, 从所述 候选序列中移除这两个句向量中的一个; 依序增加一个概 率值最大的句向量至候选序列, 来重构出 所述候选序列。 4.如权利要求1 ‑3中任一项所述的解码模块, 其中, 所述子句内容 规划单元还适于, 基于所述编码模块输出的第 一向量和上一 时间步所输出的子句语义特征, 确定出当前 时间步子句语义特 征的概率分布; 基于所述 概率分布, 生成指示当前时间步的所述子句语义特 征的第二向量。 5.如权利要求1 ‑4中任一项所述的解码模块, 其中, 所述子句语义特征至少包括以下特 征中的一个: 子句的实体属性、 主题特 征、 情感特 征。 6.一种文本生成模型, 包括: 编码模块, 适于对输入数据进行处 理, 以提取 出指示其语义特 征的第一向量; 如权利要求1 ‑5中任一项所述的解码模块, 与所述编码模块耦接, 适于对所述第一向量 进行处理, 以生成至少一个句向量, 来组成长文本 。 7.一种文本生成方法, 包括 步骤: 从输入数据中提取 出指示其语义特 征的第一向量; 基于所述第一向量, 确定出至少一个指示子句语义特 征的第二向量; 对所述第二向量进行处 理, 生成多个词向量; 以及 利用所述词向量, 组合成至少一个句向量, 来 生成长文本 。 8.如权利要求7所述的方法, 其中, 利用所述词向量, 组合成至少一个句向量的步骤包 括: 在每个时间步进行束搜索, 得到各句向量的概 率值; 按照概率值从大到小的顺序, 依序选取第一数量个句向量, 作为 候选序列; 针对所述 候选序列, 分别计算每两个句向量之间的差异值; 基于所述差异值, 重构候选序列; 重复迭代计算差异值的步骤和重构候选序列的步骤, 直至所述差异值满足预设条件 时, 确定出属于候选序列的句向量。 9.一种计算设备, 包括:权 利 要 求 书 1/2 页 2 CN 114462419 A 2一个或多个处 理器; 存储器; 一个或多个程序, 其中所述一个或多个程序存储在所述存储器中并被配置为由所述一 个或多个处理器执行, 所述一个或多个程序包括用于执行如权利要求7或8所述的方法的指 令。 10.一种存储一个或多个程序的计算机可读存储介质, 所述一个或多个程序包括指令, 所述指令在被 计算设备 执行时, 使得 所述计算设备 执行如权利要求7或8所述的方法。权 利 要 求 书 2/2 页 3 CN 114462419 A 3
专利 一种文本生成模型及文本生成方法
文档预览
中文文档
15 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:33:57
上传分享
举报
下载
原文档
(653.4 KB)
分享
友情链接
T-ZZB 1855—2020 全包覆节能装饰板.pdf
专利 一种高速隔离网闸数据摆渡的实现系统及方法.PDF
DB65-T 4536.7—2022 电子政务外网建设规范第7部分:政务云安全要求 新疆维吾尔自治区.pdf
GB-T 30257-2013 节能量测量和验证技术要求 通风机系统.pdf
GB-T 6499-2022 原棉含杂率试验方法.pdf
T-SDL 3.2—2021 10 kV智能电缆系统技术规范 第 2 部分 智能电缆测控系统终端.pdf
GB-T 33172-2016 资产管理 综述、原则和术语.pdf
AQ 1037-2007 煤矿用无极绳绞车安全检验规范.pdf
GB-T 42615-2023 在用电梯安全评估规范.pdf
GB-T 35386-2017 无损检测 工业计算机层析成像(CT)检测用密度分辨力测试卡.pdf
GB-T 18867-2014 电子工业用气体 六氟化硫.pdf
T-SDMT 0002—2022 高效节能智能化牵引变压器.pdf
MT-T 244.2-2020 煤矿窄轨车辆连接件 连接插销.pdf
GB-T 22240-2018 信息安全技术 网络安全等级保护定级指南.pdf
YD-T 3746-2020 车联网信息服务用户个人信息保护要求.pdf
GB-T 18451.1-2022 风力发电机组 设计要求.pdf
T-GIAEC 001—2023 工业锅炉定期节能检查技术规范.pdf
T-ZGZS 0107—2023 再生资源经营性电子数据存证技术规范.pdf
T-CSPSTC 78—2021 顶管法管道工程技术规程.pdf
商用密码应用安全性测评机构管理办法(试行).pdf
1
/
15
评价文档
赞助2.5元 点击下载(653.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。