(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211198978.4
(22)申请日 2022.09.29
(71)申请人 中国农业银行股份有限公司
地址 100005 北京市东城区建国门内大街
69号
(72)发明人 史国华
(74)专利代理 机构 北京同立钧成知识产权代理
有限公司 1 1205
专利代理师 师索 刘芳
(51)Int.Cl.
G06V 40/16(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06V 10/74(2022.01)
G06V 10/774(2022.01)G06V 10/82(2022.01)
(54)发明名称
模型训练方法、 数据检索方法、 装置、 设备及
存储介质
(57)摘要
本申请提供一种模型训练方法、 数据检索方
法、 装置、 设备及存储介质, 涉及人工智能技术领
域, 模型训练方法用于训练数据编码模型, 数据
编码模型包括第一子模型和第二子模 型, 模型训
练方法包括: 获取训练图像及训练图像对应的近
似二进制哈希码矩阵; 基于训练图像和近似二进
制哈希码矩阵, 对第一子模型进行迭代训练, 得
到训练完成的第一子模型以及第一子模型输出
的目标合成图像; 将训练图像、 近似二进制哈希
码矩阵和目标合成图像输入第二子模型进行编
码处理, 根据确定的柯西分布交叉熵损失和柯西
分布量化损失调整第二子模型的参数, 得到训练
完成的数据编码模型。 本申请能够得到精度更高
的数据编码模 型, 以用于更加准确地进行数据检
索。
权利要求书3页 说明书15页 附图5页
CN 115457638 A
2022.12.09
CN 115457638 A
1.一种模型训练方法, 其特征在于, 用于训练数据编码模型, 所述数据编码模型包括第
一子模型和第二子模型, 所述模型训练方法包括:
获取训练图像, 所述训练图像包 含人脸;
基于所述训练图像, 获取所述训练图像对应的近似二进制哈希码矩阵, 所述近似二进
制哈希码矩阵包 含所述训练图像的近似二进制哈希码;
基于所述训练图像和所述近似二进制哈希码矩阵, 对第一子模型进行迭代训练, 得到
训练完成的第一子模型, 以及所述训练完成的第一子模型输出的目标合成图像;
将所述训练图像、 所述近似二进制哈希码矩阵和所述目标合成图像输入所述第 二子模
型进行编码处理, 确定柯西分布交叉熵损失和柯西分布量化损失, 所述柯西分布交叉熵损
失用于判断当前图像和所述训练图像的近似二进制哈希码的相似性, 所述柯西分布量化损
失用于控制将第二子模型输出的目标二进制哈希码做连续松弛引起的量 化误差;
根据所述柯西分布 交叉熵损失和所述柯西分布量化损失调整第 二子模型的参数, 得到
训练完成的数据编码模型。
2.根据权利要求1所述的模型训练方法, 其特征在于, 所述第 一子模型包括编码鉴别网
络、 生成网络和训练鉴别网络, 所述基于所述训练图像和所述近似二进制哈希码矩阵, 对第
一子模型进行迭代训练, 得到训练完成的第一子模型, 以及所述训练完成的第一子模型输
出的目标合成图像, 包括:
将所述近似二进制哈希码矩阵和随机噪声向量输入所述编码鉴别网络, 基于所述近似
二进制哈希码矩阵和所述随机噪声向量的相似度, 确定第一损失;
根据所述第一损失调整所述随机噪声向量, 得到调整后的随机噪声向量;
将所述近似二进制哈希码矩阵和所述调 整后的随机噪声向量输入所述生成网络, 生成
初始合成图像;
将所述训练图像和所述初始合成图像输入所述训练鉴别网络, 基于所述训练鉴别网络
的当前处理图像是否为所述训练图像, 确定第二损失; 以及基于所述训练鉴别网络的当前
处理图像与所述训练图像的相似度, 确定第三损失;
根据所述第 二损失和所述第 三损失调整第 一子模型的参数, 得到训练完成的第 一子模
型, 以及所述训练完成的第一子模型的生成网络 输出的目标合成图像。
3.根据权利要求1所述的模型训练方法, 其特征在于, 所述将所述训练图像、 所述近似
二进制哈希码矩阵和所述目标合成图像输入所述第二子模型进行编 码处理, 确定柯西分布
交叉熵损失和柯西分布量 化损失, 包括:
将所述训练图像和所述目标合成图像输入所述第 二子模型的卷积层进行卷积处理, 得
到所述训练图像和所述目标合成图像中每 个图像对应的第一特 征矩阵;
将所述第一特征矩阵输入所述第二子模型的池化层进行池化处理, 得到第二特征矩
阵;
将所述第二特征矩阵和所述近似二进制哈希码矩阵输入所述第二子模型的全连接层
进行全连接处理, 得到所述训练图像和所述目标合成图像中每个图像对应的目标二进制哈
希码, 并确定所述柯西分布交叉熵损失和所述柯西分布量 化损失。
4.根据权利要求1至3中任一项所述的模型训练方法, 其特征在于, 所述基于所述训练
图像, 获取 所述训练图像对应的近似二进制哈希码矩阵, 包括:权 利 要 求 书 1/3 页
2
CN 115457638 A
2获取所述训练图像对应的成对相似性矩阵;
对所述成对相似性矩阵进行降维处 理, 得到低维成对相似性矩阵;
根据所述成对相似性矩阵和所述低维成对相似性矩阵, 获取所述近似二进制哈希码矩
阵。
5.一种数据检索方法, 其特 征在于, 包括:
获取待检索人脸图像;
将所述待检索人脸图像输入数据编码模型的第 二子模型进行编码处理, 得到所述第 二
子模型输出的目标二进制哈希码, 所述数据编 码模型为采用如权利要求 1至4中任一项所述
的模型训练方法训练得到的;
将所述目标二进制哈希码和人脸数据库中的二进制哈希码进行比对, 确定检索结果,
所述检索结果用于指示所述待检索人脸图像是否存在于所述人脸数据库中。
6.根据权利要求5所述的数据检索方法, 其特征在于, 所述将所述目标二进制哈希码和
人脸数据库中的二进制哈希码进行比对, 确定检索结果, 包括:
将所述目标二进制哈希码和所述人脸数据库中的二进制哈希码进行比对, 得到所述目
标二进制哈希码和所述人脸数据库中的二进制哈希码的差异概 率值;
若所述差异概率值小于阈值, 则确定所述检索结果为所述待检索人脸图像存在于所述
人脸数据库中;
若所述差异概率大于或等于 阈值, 则确定所述检索结果为所述待检索人脸图像未存在
于所述人脸数据库中。
7.一种模型训练装置, 其特征在于, 用于训练数据编码模型, 所述数据编码模型包括第
一子模型和第二子模型, 所述模型训练装置包括:
第一获取模块, 用于获取训练图像, 所述训练图像包 含人脸;
第二获取模块, 用于基于所述训练图像, 获取所述训练图像对应的近似二进制哈希码
矩阵, 所述近似二进制哈希码矩阵包 含所述训练图像的近似二进制哈希码;
第一训练模块, 用于基于所述训练图像和所述近似二进制哈希码矩阵, 对第一子模型
进行迭代训练, 得到训练完成的第一子模型, 以及所述训练完成的第一子模型输出 的目标
合成图像;
处理模块, 用于将所述训练图像、 所述近似二进制哈希码矩阵和所述目标合成图像输
入所述第二子模型进行编码处理, 确定柯西分布交叉熵损失和柯西分布量化损失, 所述柯
西分布交叉熵损失用于判断当前图像和所述训练图像的近似二进制哈希码的相似性, 所述
柯西分布量化损失用于控制将第二子模型输出的目标二进制哈希码做连续松弛引起的量
化误差;
第二训练模块, 用于根据所述柯西分布 交叉熵损失和所述柯西分布量化损失调 整第二
子模型的参数, 得到训练完成的数据编码模型。
8.一种数据检索装置, 其特 征在于, 包括:
获取模块, 用于获取待检索人脸图像;
处理模块, 用于将所述待检索人脸图像输入数据编码模型的第二子模型进行编码处
理, 得到所述第二子模型输出的目标二进制哈希码, 所述数据编码模 型为采用如权利要求 1
至4中任一项所述的模型训练方法训练得到的;权 利 要 求 书 2/3 页
3
CN 115457638 A
3
专利 模型训练方法、数据检索方法、装置、设备及存储介质
文档预览
中文文档
24 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 07:23:26上传分享