(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210953941.1 (22)申请日 2022.08.10 (71)申请人 上海科技大 学 地址 201210 上海市浦东 新区华夏中路393 号 (72)发明人 郑杰 刘鑫 白芳 虞佳乐  陶思宇 杨贝媛 王诗珂 王林  (74)专利代理 机构 上海光华专利事务所(普通 合伙) 31219 专利代理师 倪静 (51)Int.Cl. G16B 40/00(2019.01) G16B 50/00(2019.01) G06F 16/36(2019.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 基于图神经网络的合成致死基因预测方法、 装置、 终端及 介质 (57)摘要 本申请提供基于图神经网络的合成致死基 因预测方法、 装置、 终端及介质, 获取多个合成致 死基因数据; 对多个合成致死基因数据进行预处 理; 基于预处理后的合成致死基因数据, 构建用 于预测基因与基因之间是否存在合成致死关系 的图神经网络模 型。 本发明提供了基于成对关系 学习的图神经网络, 其以两个基因之间成对相互 作用的表示, 从而进行合成致死关系的预测; 图 神经网络利用注意力机制, 通过封闭子图中的加 权路径对合成致死机制进行解释。 此外, 大量的 实验结果表明图神经网络比最好的基线有很大 的优势, 并且在多种实际情况下都有很好的泛化 能力。 权利要求书3页 说明书11页 附图4页 CN 115240777 A 2022.10.25 CN 115240777 A 1.一种基于图神经网络的合成致死基因预测方法, 其特 征在于, 包括: 获取多个合成致死基因数据; 对所述多个合成致死基因数据进行预处理, 包括从中提取具有多组学数据的部分基因 对作为监督学习的合成致死标签; 将合成致死知识图谱中已知的合成致死基因对移除; 并 随机采样基因间关系未知的基因对作为负 样本; 基于预处理后的合成致死基因数据, 构建用于预测基因与基因之间是否存在合成致死 关系的图神经网络模型。 2.根据权利要求1所述的基于图神经网络的合成致死基因预测方法, 其特征在于, 所述 图神经网络模型的构建过程包括: 构建成对基因的封闭子图; 基于注意力嵌入传播模型区分所述封闭子图中各条边的权重以得到加权封闭子图, 并 从所述加权 封闭子图中学习潜在特 征; 将隐式的和显式的成对相互作用特征进行特征融合以得到融合有基因对的隐式特征 和显式特 征的表示; 根据所述融合有基因对的隐式特征和显 式特征的表示, 预测基因之间是否存在合成致 死关系, 并通过最小化目标函数来优化图神经网络模型。 3.根据权利要求2所述的基于图神经网络的合成致死基因预测方法, 其特征在于, 所述 构建成对基因的封闭子图的过程包括: 从合成致死知识图谱中 收集所述成对基因中每个基 因的与之直接连接的全部邻近基因; 取各所述邻近基因之 间的交集以生成这对成对基因的 封闭子图。 4.根据权利要求2所述的基于图神经网络的合成致死基因预测方法, 其特征在于, 所述 基于注意力嵌入传播模型区分所述封闭子图中各条边的权重以得到加权封闭子图的过程 包括: 计算与当前节点位于图神经网络同一层中与之直接连接的邻居节点通过特定关系向 所述当前节点进行的信息传递; 通过注意力 机制来计算注意力 权重; 所述注意力 权重用于表示位于图神经网络同一层 中的邻居节点 通过特定关系向当前节点传递信息的多少; 通过节点的自我更新及来自其邻居节点的信息传递 来更新该节点的表示; 将隐式的和显式的成对相互作用特征进行特征融合以得到融合有基因对的隐式特征 和显式特 征的表示。 5.根据权利要求4所述的基于图神经网络的合成致死基因预测方法, 其特征在于, 所述 与当前节点位于图神经网络同一层中与之直接连接的邻居节点通过特定关系向所述当前 节点进行的信息传递的表示如下: 其中, R是合成致死知识图谱中关系类型的数量; Nr(u)表示节点u在关系r下的直接 连接 邻居的集合; 是第l层中在关系r上转换隐藏表示的权重矩阵; 是注意力权重, 控制 第l层中节点v通过关系r向节点u传递多少信息; 表示第(l ‑1)层中节点v。权 利 要 求 书 1/3 页 2 CN 115240777 A 26.根据权利要求4所述的基于图神经网络的合成致死基因预测方法, 其特征在于, 所述 注意力权 重的表示如下: 其中, 和 是节点u和v在图神经网络第(l ‑1)层中的表示, er是关系r的嵌入, 是拼接操作。 和 是注意力权重矩阵, σ()是sigmoid函数。 注意力得分考虑了节点u 和v的信息以及它 们之间的关系。 7.根据权利要求4所述的基于图神经网络的合成致死基因预测方法, 其特征在于, 所述 根据所述融合有基因对的隐式特征和显式特征的表示, 预测基因之 间是否存在合成致死关 系, 并通过最小化目标函数来优化图神经网络模型, 包括: p^uv=Wpredhuv; 其中, p^uv为预测概率, 若概率小于预设阈值则表示基因之间不存在合成致死关系; 反 之则表示基因之间存在合成致死关系; Wpred是解码器的重量矩阵; huv是融合有基因对的显 式特征hu和隐式特 征hv的表示; huv被表示为 将每一层的节点层的表示连接起 来得到: 将每一层的图层的表示连接起 来得到: 隐式特征: 基因u编码后的特征向量: 其中 和 表示基 因u的基因表达、 基因突变和基因拷贝数改变的三个向量; 基因v编码后的特征向量: 其中 和 表示基 因v的基因表达、 基因突变和基因拷贝数改变的三个向量; 所述通过最小化目标函数来优化图神经网络模型的公式如下: 其中, Ltotal是目标函数, 通过最小化目标函数来优 化图神经网络模型; LCE是用于二分类 任务的交叉熵损失函数; LW是模型所有参数的L2正则项; λ是L2正则项系数; 交叉熵损失函数: 其中τ是训练 集, puv是基因u与基因v之间是否有SL关系的真实标签。 8.一种基于图神经网络的合成致死基因预测装置, 其特 征在于, 包括: 成对封闭子图模块, 用于构建成对基因的封闭子图; 注意力嵌入传播模块, 用于基于注意力嵌入传播模型区分所述封闭子图中各条边的权 重以得到加权 封闭子图, 并从所述加权 封闭子图中学习潜在特 征; 合成致死基因预测模块, 用于将隐式的和显 式的成对相互作用特征进行特征融合以得 到融合有基因对的 隐式特征和显式特征的表示; 并根据所述融合有基因对的 隐式特征和显 式特征的表示, 预测基因之间是否存在合成致死关系。 9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序被权 利 要 求 书 2/3 页 3 CN 115240777 A 3

.PDF文档 专利 基于图神经网络的合成致死基因预测方法、装置、终端及介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于图神经网络的合成致死基因预测方法、装置、终端及介质 第 1 页 专利 基于图神经网络的合成致死基因预测方法、装置、终端及介质 第 2 页 专利 基于图神经网络的合成致死基因预测方法、装置、终端及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:42:25上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。