standard download
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211397246.8 (22)申请日 2022.11.09 (71)申请人 湖南马栏 山视频先进技 术研究院有 限公司 地址 410000 湖南省长 沙市开福区鸭子铺 路1号146房4室 (72)发明人 邓正秋 吕绍和  (74)专利代理 机构 长沙伊柏专利代理事务所 (普通合伙) 4326 5 专利代理师 罗莎 (51)Int.Cl. G06F 9/50(2006.01) G06T 1/20(2006.01) (54)发明名称 一种实时渲染的多GPU并行调度方法、 装置 及存储器 (57)摘要 本发明公开了一种实时渲染的多GPU并行调 度方法、 装置及存储器, 其包括如下步骤: S1、 获 取渲染任务, 并对渲染任务中的待渲染场景模型 文件中的待渲染场景资产进行模型变换以及视 口变换以确定各个物体资产的输出像素区域, 并 根据所述输出像素区域确定待渲染任务的渲染 任务量; S2、 获取GP U的渲染能力向量; S3、 根据所 述GPU渲染能力向量以及待 渲染任务的渲染任务 量对渲染任务进行切分, 随后任务发送到对应 GPU进行渲染。 本发明能够根据渲染区域之间的 渲染任务量差异, 进行合适的任务切分从而提升 并行效率减少各个GPU之间的输出时间差 。 权利要求书3页 说明书14页 附图3页 CN 115509764 A 2022.12.23 CN 115509764 A 1.一种实时渲染的多GPU并行调度方法, 其特 征在于: 包括如下步骤: S1、 获取渲染任务, 并对渲染任务中的待渲染场景模型文件中的待渲染场景资产进行 模型变换以及视口变换以确定各个物体资产的输出像素区域, 并根据所述输出像素区域确 定待渲染任务的渲染任务 量 , 其中 分别代表构建几何体、 构建粒子数、 构建光照数据、 纹理编码数; S2、 获取GPU的渲染能力向量, 所述GPU的渲染能力向量通过单位时间内所构建的几何 体数目、 单位时间内所编 码的纹理、 单位时间内所构建的光照数据、 单位时间内所构建的粒 子数目进行量 化; S3、 根据所述GPU渲染能力向量以及待渲染任务的渲染任务量对渲染任务进行切分, 随 后任务发送到对应GPU 进行渲染。 2.根 据权 利要 求 1 所 述的 方 法 , 其 特 征 在 于 : 待 渲 染 任 务的 渲 染 任 务 量 , 其中 分别代表渲染方块区域右上角坐标以及左下角坐标; 其中f为 渲染任务度量 算子。 3.根据权利要求2所述的方法, 其特 征在于: 所述S1具体为: S10、 扫描场景文件确定场景内的资产数目, 并初始化资产链表数组L, 其长度为N_a表 示资产数目; S11、 初始化 其中 表示链表数组索引; S12、 对L[i]内的资产确定其模型坐标系空间与输出屏幕空间之间的映射关系, 然后对 该资产执行模型变换, 以确定其在二 维输出屏幕空间的像素区域并将其写入资产 链表数组 L[i]; S13、 令i=i+1; S14、 判断i是否小于N_a, 若是, 则返回S13, 若否, 则执 行S15; S15、 对每个输出像素计算其深度信息, 以确定物体遮挡关系, 在物体有重叠的像素位 置, 保留深度信息最小的资产剔除其余物体模型, 以此为基准对资产输出像素区域进行更 新; S16、 根据链表生成渲染任务度量算子 , 其 中 分别代表渲染方块区域右上角坐标以及左下角坐标, 分别代表构建几何体、 构建粒子数、 构建光照数据、 纹 理编码数; 具体计算方法如下: S161、 遍历链 表数组L确定所输入方块区域所覆盖的资产数目; S162、 将所覆盖的资产的渲染任务向量叠加。 4.根据权利 要求2所述的方法, 其特征在于: 所述步骤S3中 “根据所述GPU渲染能力向量 以及待渲染任务的任务量对渲染任务进行切分 ”具体为: 根据待渲染任务的任务量权 利 要 求 书 1/3 页 2 CN 115509764 A 2以及GPU数目num对 所述待渲染任务进行划分建立N叉树, 其中 所述N叉树的叶子节点的渲染任务量均小于一渲染任务量阈值向量; 并遍历N叉树的叶结 点, 将叶结点所对应的区域分配到相应的GPU 进行渲染。 5.根 据 权 利 要 求 4 所 述 的 方 法 , 其 特 征 在 于 : 所 述 “根 据 待 渲 染 任 务 量 以及GPU数目num对 所述待渲染任务进行划分建立N叉树, 其中 所述N叉树的叶子节点的渲染任务 量均小于一 渲染任务 量阈值向量 ”具体为: S31、 初始化 渲染任务阈值向量 ;阈值向量确定方法如下: S311、 获取待渲染任务的渲染任务 量 ; S312、 读取GPU数量 ; S313、 令渲染任务阈值向量等于 ; 其中k为正 整数; S32、 对给定渲染区域进行N 等分并计算所划分区域的渲染任务向量; S33、 对划分的渲染区域重 复执行步骤32中的操作, 直到划分区域渲染任务向量各个单 元皆小于设定的任务阈值向量。 6.根据权利要求5所述的方法, 其特征在于: 遍历N叉树的叶结点, 将叶结点所对应的区 域分配到相应的GPU 进行渲染具体为: S34、 根据渲染区域的渲 染任务度量算子 , 以及GPU渲染能力值初始化代 价矩阵 , 其 中 代表 矩阵, 代表第i号GPU渲 染第j个N叉树的叶结点区域所需要的时间, 代表N叉树的叶结点数目, 其计算 步骤如下: S341、 读取第i 号GPU的渲染能力 ; S342、 读取第j个N叉树的叶结点所代 表的渲染区域的渲染任务 量 ; S343、 令 ; S35、 随机初始化 匹配矩阵 , 其中 为 的零一矩阵, 代表GPU数目, 代表N叉树的叶结点数, 表示第j个N叉树的叶结点区域被分配到第i号GPU进行 渲染; S36、 根据以下优化目标求 解矩阵 ;权 利 要 求 书 2/3 页 3 CN 115509764 A 3

PDF文档 专利 一种实时渲染的多GPU并行调度方法、装置及存储器

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种实时渲染的多GPU并行调度方法、装置及存储器 第 1 页 专利 一种实时渲染的多GPU并行调度方法、装置及存储器 第 2 页 专利 一种实时渲染的多GPU并行调度方法、装置及存储器 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 01:00:25上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。