standard download
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210023596.1 (22)申请日 2022.01.10 (71)申请人 北京百度网讯科技有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦2层 (72)发明人 魏承东 丁杰超 高睿 (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 代理人 武晨燕 (51)Int.Cl. G06F 40/258(2020.01) G06F 40/30(2020.01) G06F 40/242(2020.01) G06F 40/289(2020.01) G06F 40/216(2020.01)G06F 16/783(2019.01) (54)发明名称 视频标题生成方法、 装置、 电子设备及存储 介质 (57)摘要 本公开提供了一种视频标题生成方法、 装 置、 电子设备及存储介质。 本公开涉及视频技术 领域, 尤其涉及短视频技术领域。 具体实现方式 为: 获取针对第一视频文件的多个可选文本信 息; 从所述多个可选文本信息中确定中心文本信 息, 所述中心文本信息为与所述第一视频文件的 内容的相似度最高的可选文本信息; 将所述中心 文本信息确定为所述第一视频文件的标题。 本公 开能够根据用户对原始视频文件的互动行为数 据确定原始视频文件中的兴趣点, 并以兴趣点为 基准对原始视频文件进行裁剪, 得到多个裁剪后 的视频文件, 即短视频。 本公开能够提高生成视 频文件标题的效果和效率。 权利要求书3页 说明书11页 附图4页 CN 114357989 A 2022.04.15 CN 114357989 A 1.一种视频 标题生成方法, 包括: 获取针对第一视频文件的多个可选文本信息; 从所述多个可选文本信 息中确定中心文本信 息, 所述中心文本信 息为与所述第 一视频 文件的内容的相似度最高的可选文本信息; 将所述中心文本信息确定为所述第一视频文件的标题。 2.根据权利要求1所述的方法, 其中, 所述可选文本信 息包括所述第 一视频文件的弹幕 文本、 评论、 字幕和介绍文本中的至少一项。 3.根据权利要求2所述的方法, 其中, 所述第 一视频文件为利用从第 二视频文件中选取 的片段组成的视频文件; 所述第一视频文件的弹幕文本包括: 多个用户在所述第二视频文件播放过程中, 在播 放所述第一视频文件中的所述片段的时刻发送的弹幕文本 。 4.根据权利要求1至3中任一所述的方法, 其中, 所述从所述多个可选文本信息中确定 中心文本信息, 包括: 将所述各个可选文本信息分别转换为对应的文本向量; 针对各个所述文本向量, 分别确定每个文本向量与其他各个文本向量之间的距离之 和; 将所述距离之和最小的文本向量对应的可选文本信息确定为所述中心文本信息 。 5.根据权利要求4所述的方法, 其中, 确定文本向量与其他文本向量之间的距离的方式 包括: 计算所述文本向量与 所述其他文本向量之间的夹角余弦, 将所述夹角余弦作为所述文 本向量与所述 其他文本向量之间的距离; 或者, 计算所述文本向量与 所述其他文本向量之间的欧氏距离, 将所述欧氏距离作为所述文 本向量与所述 其他文本向量之间的距离 。 6.根据权利要求4或5所述的方法, 其中, 将所述可选文本信 息转换为对应的文本向量, 包括: 采用基于转换器的双向编码器表示BERT模型和使用信息实体的增强语言表示ERNIE模 型中的至少一种, 将所述可选文本信息转换为对应的文本向量。 7.根据权利要求1至3中任一所述的方法, 其中, 所述从所述多个可选文本信息中确定 中心文本信息, 包括: 将所述各个可选文本信息分别进行分词处理, 得到多个分词, 并统计各个分词在所有 所述可选文本信息中出现的次数; 从所述多个分词中选取出现次数最多的L个分词, 作为重要分词, 并根据 所述重要分词 出现的次数为所述重要分词设定分词分值; 所述 L为正整数; 针对所述多个可选文本信 息中的各个可选文本信 息, 确定所述可选文本信 息中包含的 重要分词, 并根据重要分词的分词分值确定所述可选文本信息的文本分值; 将所述文本分值 最高的可选文本信息作为所述中心文本信息 。 8.一种视频 标题生成装置, 包括: 获取模块, 用于获取针对第一视频文件的多个可选文本信息; 确定模块, 用于从所述多个可选文本信息中确定中心文本信息, 所述中心文本信息为权 利 要 求 书 1/3 页 2 CN 114357989 A 2与所述第一视频文件的内容的相似度最高的可选文本信息; 标题模块, 用于将所述中心文本信息确定为所述第一视频文件的标题。 9.根据权利要求8所述的装置, 其中, 所述可选文本信 息包括所述第 一视频文件的弹幕 文本、 评论、 字幕和介绍文本中的至少一项。 10.根据权利要求9所述的装置, 其中, 所述第一视频文件为利用从第二视频文件中选 取的片段组成的视频文件; 所述第一视频文件的弹幕文本包括: 多个用户在所述第二视频文件播放过程中, 在播 放所述第一视频文件中的所述片段的时刻发送的弹幕文本 。 11.根据权利要求8至10中任一所述的装置, 其中, 所述确定模块, 包括: 转换子模块, 用于将所述各个可选文本信息分别转换为对应的文本向量; 距离子模块, 用于针对各个所述文本向量, 分别确定每个文本向量与其他各个文本向 量之间的距离之和; 第一确定子模块, 用于将所述距离之和最小的文本向量对应的可选文本信 息确定为所 述中心文本信息 。 12.根据权利要求11所述的装置, 其中, 确定文本向量与其他文本向量之间的距离的方 式包括: 计算所述文本向量与 所述其他文本向量之间的夹角余弦, 将所述夹角余弦作为所述文 本向量与所述 其他文本向量之间的距离; 或者, 计算所述文本向量与 所述其他文本向量之间的欧氏距离, 将所述欧氏距离作为所述文 本向量与所述 其他文本向量之间的距离 。 13.根据权利要求1 1或12所述的装置, 其中, 所述 转换子模块, 包括: 采用基于转换器的双向编码器表示BERT模型和使用信息实体的增强语言表示ERNIE模 型中的至少一种, 将所述可选文本信息转换为对应的文本向量。 14.根据权利要求8至10中任一所述的装置, 其中, 所述确定模块, 包括: 统计子模块, 用于将所述各个可选文本信 息分别进行分词处理, 得到多个分词, 并统计 各个分词在所有所述可选文本信息中出现的次数; 分值子模块, 用于从所述多个分词中选取出现次数最多的L个分词, 作为重要分词, 并 根据所述重要分词出现的次数为所述重要分词设定分词分值; 所述 L为正整数; 第二确定子模块, 用于针对所述多个可选文本信息中的各个可选文本信息, 确定所述 可选文本信息中包含的重要分词, 并根据重要分词的分词分值确定所述可选文本信息的文 本分值; 中心信息 子模块, 用于将所述文本分值 最高的可选文本信息作为所述中心文本信息 。 15.一种电子设备, 包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处 理器能够执 行权利要求1 ‑7中任一项所述的方法。 16.一种存储有计算机指令的非瞬时计算机可读存储介质, 其中, 所述计算机指令用于 使所述计算机执 行根据权利要求1 ‑7中任一项所述的方法。权 利 要 求 书 2/3 页 3 CN 114357989 A 3
专利 视频标题生成方法、装置、电子设备及存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:34:00
上传分享
举报
下载
原文档
(680.7 KB)
分享
友情链接
GB-T 38194-2019 运载火箭操作性碎片减缓设计要求.pdf
T-JSQX 0011—2022 江苏省纯电动重型卡车换电电池包系统技术规范.pdf
T-CSAE 284.3—2022 自动驾驶乘用车 线控底盘性能要求及试验方法 第3部分:转向系统.pdf
T-CSA -TR008—2019 类太阳光LED术语定义及相关问题研究.pdf
YD-T 3844-2021 工业互联网平台 应用管理接口要求.pdf
GB-T 3003-2017 耐火纤维及制品.pdf
GB-T 34079.5-2021 基于云计算的电子政务公共平台服务规范 第5部分:移动服务.pdf
GB T 27930.2 -XXXX 电动汽车非车载传导式充电机与车辆之间的数字通信协议 第2部分 Chaojix系统.pdf
北京金融产业联盟 金融行业云原生安全体系研究报告 2024.pdf
DB3301-T 0348—2021 机关食堂数字化管理规范 杭州市.pdf
DB22-T 5040-2020 建设工程见证取样检测标准 吉林省.pdf
GB-T 42568-2023 工业互联网平台 微服务参考框架.pdf
法律法规 中华人民共和国技术进出口管理条例2020-11-29.pdf
T-ZZB 1845—2020 散热器恒温控制阀.pdf
GB-T 33138-2016 存储备份系统等级和测试方法.pdf
GB-T 39329-2020 增材制造 测试方法 标准测试件精度检验.pdf
GB-T 33448-2016 数字城市地理信息公共平台 运行服务质量规范.pdf
GB-T 36527-2018 洁净室及相关受控环境 节能指南.pdf
DB44-T 2189.2-2019 移动终端信息安全 第2部分:敏感信息安全等级保护与测评 广东省.pdf
GB-T 7965-2002 声学 水声换能器测量.pdf
1
/
19
评价文档
赞助2.5元 点击下载(680.7 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。