水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210481080.1 (22)申请日 2022.05.05 (71)申请人 安徽大学 地址 230601 安徽省合肥市经济技 术开发 区九龙路1 11号 (72)发明人 许艳 尚树强 杜磊  (74)专利代理 机构 安徽省合肥新 安专利代理有 限责任公司 34101 专利代理师 陆丽莉 何梅生 (51)Int.Cl. G06V 10/764(2022.01) G06F 21/62(2013.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于联邦模型蒸馏的混合隐私保护图 像分类方法 (57)摘要 本发明公开了一种基于联邦模型蒸馏的混 合隐私保护图像分类方法, 其步骤包括: 1客户端 预训练本地神经网络; 2中心服务器获取公共数 据集并随机采样, 然后下 发至客户端; 3客户端对 下发数据进行预测; 4客户端对预测结果进行范 数裁剪并随机拆 分为预测分片, 按照编号发送给 对应客户端; 5客户端聚合预测分片得到混淆预 测并上传中心服务器; 6中心服务器聚合混淆预 测并添加噪声后得到全局预测, 然后下发至客户 端; 7客户端利用全局预测蒸馏训练本地神经网 络, 然后再复习训练本地神经网络; 8客户端利用 本地神经网络进行图像分类。 本发 明基于联邦模 型蒸馏算法, 利用秘密共享思想和差分隐私技 术, 实现了隐私保护的图像分类 。 权利要求书2页 说明书7页 附图1页 CN 114821179 A 2022.07.29 CN 114821179 A 1.一种基于联邦模型蒸馏的混合隐私保护图像分类方法, 其特征是, 应用于由中心服 务器和N个客户端所组成的系统中, 并按如下步骤进行: 步骤1.第i个客户端利用本地带 标签的私有图像数据预训练本地神经网络; 步骤1.1.第i个客户端对本地带标签的私有图像数据进行预处理, 得到预处理后的私 有图像数据集记为Di={(xi,1,yi,1),(xi,2,yi,2),...,(xi,j,yi,j),...,(xi,J,yi,J)}, xi,j和 yi,j分别表示第i个客户端预处理后的第j个私有图像样本及其对应的类别, i=1,2,...,N, N为客户端总数, j=1,2,. ..,J, J为第i个客户端私有图像样本的总数; 步骤1.2.第i个客户端利用式(1)构建本地的神经网络MGi的监督损失 再使用随机 梯度下降优化方法以学习率lriL来更新所述本地神经网络MGi的权值, 并在监督损失值趋于 稳定时得到预训练后的本地神经网络 M′Gi; 式(1)中, 为符号函数, 表示第i个客户端的第j个私有图像样本xi,j是否属于类别c, 若 表示第j个私有图像样本xi,j的类别属于类别c, 若 表示第j个私有图像样 本xi,j的类别不属于类别c; 表示第i个客户端的本地神经网络MGi预测第j个私有图像样 本xi,j属于类别c的概 率; c∈[1,m ], m为类别数; 步骤2.中心服 务器获取 无标签的公共图像数据集并随机采样, 然后下发至客户端; 步骤2.1.定义协同训练的轮数为t, 并初始化t=1; 步骤2.2.所述中心服务器随机采样无标签的公共图像数据集, 得到第t轮公共图像数 据子集记为DP,t={x1,t,x2,t,...,xk,t,...,xK,t}并分别下发至N个客户端, xk,t表示第t轮协 同训练中第k个被采样的公共图像样 本, k=1,2,...,K, K为第t轮协同训练中被采样公共图 像样本的总数; 步骤3.N个客户端对第t轮下发的公共图像数据集DP,t进行预测: 第i个客户端利用预训练后的本地神经网络M ′Gi计算第t轮下发的公共图像数据集DP,t 中各个公共图像样本的预测结果Yt,i={fi(x1,t),fi(x2,t),...,fi(xk,t),...,fi(xK,t)}; 其 中, fi(xk,t)表示第i个客户端计算的第t轮下发的第k个公共图像样本xk,t的预测值,k=1, 2,...,K, K为第t轮下发 公共图像样本的总数; 步骤4.N个客户端对预测结果进行l1‑范数裁剪后随机拆分为预测分片, 然后按编号发 送给对应客户端; 步骤4.1.根据裁剪阈值C对第i个客户端第t轮的预测结果Yt,i进行l1‑范数裁剪, 得到第 t轮裁剪后的预测结果Yt,i/max(1,| |Yt,i||1/C); 步骤4.2.第i个客户端将第t轮裁剪后的预测结果Yt,i/max(1,||Yt,i||1/C)随机拆分, 并 生成N‑1个与预测结果Yt,i尺寸相同的随机向量 并作为前N ‑1个预测分 片, 其中, 表示第i个客户端第t轮裁 剪后的预测结果, 应发送给第j个客户端; 步骤4.3.计算第i个客户端预测第t轮的预测结果Yt,i与随机向量和 的差值以权 利 要 求 书 1/2 页 2 CN 114821179 A 2获得第N个预测分片 由第t轮前N ‑1个预测分片 与 第t轮第N个预测分片 组成第t轮预测分片集 合 步骤5.所述第i个客户端接收N ‑1个其他客户端发送的第t轮预测分片并与自身的一个 预测分片进行聚合, 得到第t轮聚合后的混淆预测结果 并发送给中心服务器, 其中, 表示第i个客户端接收的第j个客户端发送的第t轮预测分片; 步骤6.中心服务器对所有第t轮混淆预测结果{Y ′t,1,Y′t,2,...,Y′t,i,...,Y′t,N}进行 聚合后添加拉普拉斯噪音Lap(C/ ε )后得到第t轮全局预测结果 并分别下发至N个客户端, 其中, ε表示隐私保护强度; 步骤7.第i个客户端利用第t轮全局预测结果 蒸馏训练所述本地神经网络M ′Gi, 然后 利用私有数据集Di对蒸馏训练后的本地神经网络 M″Gi进行复习训练; 步骤7.1.第i个客户端利用式(2)构建所述蒸馏训练后的本地神经 网络M′Gi的监督损失 再使用随机梯度下降优化方法以学习率lriL来更新所述本地神经网络M ′Gi的权值, 并 在监督损失值趋 于稳定时得到蒸馏训练后的本地神经网络 M″Gi; 式(2)中, 为符号函 数, 表示第i个客户端对第t轮下发的公共数据子集DP,t中第k个公 共样本xk,t的预测类别否属于全局预测类别c, 若 表示第k个公共样本xk,t的预测类 别属于全局预测类别c, 若 表示第k个公共样本xk,t的预测类别不属于全局预测类别 c; 表示第i个客户端蒸馏训练后的本地神经网络M ′Gi预测第k个公共样本xk,t属于全局预 测类别c的概 率; 步骤7.2.第i个客户端用式(3)构建蒸馏训练后的本地神经网络M ″Gi的监督损失 再使用随机梯度下降优化方法以学习率lriL来更新所述本地神 经网络M″Gi的权值, 并在监 督损失值趋 于稳定时得到复习训练后的本地神经网络 M″ ′Gi; 式(3)中, 为符号函数, 表示第i个客户端的第j个私有图像样本xi,j是否属于类别c, 若 表示第j个私有图像样本xi,j的类别属于类别c, 若 表示第j个私有图像样 本xi,j的类别不属于类别c; 表示第i个客户端的本地神经网络M ″Gi预测第j个私有图像样 本xi,j属于类别c的概 率; 步骤7.3.将t +1赋值给t后, 返回步骤2.2.顺序执行, 直到达到最大轮数为止, 从而得到 所述第i个客户端协同训练后的本地神经网络 步骤8.所述第i个客户端利用协同训练后的本地神经网络 对图像进行分类。权 利 要 求 书 2/2 页 3 CN 114821179 A 3

PDF文档 专利 一种基于联邦模型蒸馏的混合隐私保护图像分类方法

文档预览
中文文档 11 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于联邦模型蒸馏的混合隐私保护图像分类方法 第 1 页 专利 一种基于联邦模型蒸馏的混合隐私保护图像分类方法 第 2 页 专利 一种基于联邦模型蒸馏的混合隐私保护图像分类方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:21上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。