(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111256451.8
(22)申请日 2021.10.27
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 郑龙飞 陈超超 王力 张本宇
(74)专利代理 机构 北京亿腾知识产权代理事务
所(普通合伙) 11309
代理人 陈霁 周良玉
(51)Int.Cl.
G06N 20/00(2019.01)
(54)发明名称
联合更新模型的方法、 装置及系统
(57)摘要
本说明书实施例提供一种联合更新模型的
方法、 装置及系统。 通过本说明书实施例提供的
方法、 装置和系统, 基于联合更新模型时的数据
复合切分情形, 设想将训练成员的数据进行分
割, 从而构成多个水平切分的子系统, 在单个子
系统内部, 可 以包括数据垂直切分的训练成员。
这样, 数据呈垂直切分的单个子系统通过分布在
多个训练成员的训练样本在子系统内部迭代, 从
而更新待同步参数。 而各个子系统之间, 可以按
照同步条件触发的同步周期进行数据同步。 这种
方式充分考虑各个训练成员的数据构成, 为复杂
数据结构下的联合更新模型提供解决方案, 有利
于扩展联邦学习的应用范围。
权利要求书4页 说明书15页 附图7页
CN 114004363 A
2022.02.01
CN 114004363 A
1.一种联合更新模型的系统, 包括联邦服务方和多个子系统, 用于联合更新模型W, 所
述多个子系统中的单个子系统i包括训练成员中的第一成员Ci1、 第二成员Ci2, 第一成员Ci1、
第二成员Ci2持有的样本数据构成垂直切分, 各个子系统持有的样本数据构成水平切分, 单
个子系统i对应与模型W结构一致的本地模型Wi, 本地模型Wi包括设在第一成员Ci1的第一子
模型Wci1、 设在第二成员Ci2的第二子模型Wci2; 其中:
单个子系统i用于, 利用在第一成员Ci1、 第二成员Ci2上垂直切分的训练样本针对本地模
型Wi进行垂直切 分方式下的联合训练, 并在满足同步条件的情况下, 向所述联邦服务方提
供相应本地模型Wi中与各个待定参数一一对应的各个待同步参数的更新值, 以及根据所述
联邦服务方反馈的各个待同步参数的同步值, 进 行本地待同步参数与各个子系统中的待同
步参数的同步, 从而调整相应待定参数;
所述联邦服务方用于对来自多个子系统 的待同步参数的更新值进行安全同步, 并反馈
同步值。
2.一种联合更新模型的方法, 所述方法适用于联合更新模型的系统更新模型W的过程,
所述系统包括联邦服务方和多个子系统, 所述多个子系统中的单个子系统i包括训练成员
中的第一成员Ci1、 第二成员Ci2, 第一成员Ci1、 第二成员Ci2持有的样本数据构成垂直切分, 各
个子系统持有的样本数据构成水平切分, 单个子系统i对应与模型W结构一致的本地模型
Wi, 本地模型Wi包括设在第一成员Ci1的第一子模型Wci1、 设在第二成员Ci2的第二子模型Wci2;
所述方法包括:
各个子系统各自利用在相应第 一成员、 第 二成员上垂直切分的训练样本针对相应本地
模型进行垂直切分方式下 的联合训练, 并在满足同步条件的情况下, 由各个训练成员各自
向所述联邦服务方提供相 应子模型中与各个待定参数一一对应的各个待同步参数的更新
值;
所述联邦服务方对来自多个子系统的待同步参数的更新值进行安全同步, 并反馈各个
待同步参数的同步 值;
各个子系统中的各个训练成员各自接收本地待同步参数的同步值, 以更新本地的待定
参数。
3.根据权利要求2所述的方法, 单个子系统i还包括子服务方Si, 单个子系统i对本地模
型Wi进行的联合训练包括:
针对当前轮次的若干样本, 第一成员Ci1和第二成员Ci2各自通过第一子模型Wci1和第二
子模型Wci2处理相应的本地样本数据, 分别得到对应的第一中间结果Rit1、 第二中间结果
Rit2, 以发送给子服 务方Si;
子服务方Si基于第三子模型Wsi对第一中间结果Rit1、 第二中间结果Rit2进行的处理, 分
别向第一成员Ci1、 第二成员Ci2反馈第一中间结果Rit1的梯度、 第二中间结果Rit2的梯度;
第一成员Ci1和第二成员Ci2各自利用第一中间结果Rit1的梯度和第二中间结果Rit2的梯
度, 确定第一子模型Wci1和第二子模型Wci2中的待定参数的梯度, 从而分别确 定第一子模型
Wci1和第二子模型Wci2中的待同步 参数的更新 值。
4.根据权利要求3所述的方法, 其中, 单个子系统i中当前轮次的若干样本的标签持有
方为第一成员Ci1或第二成员Ci2; 所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1、
第二中间结果Rit2进行的处理, 分别向第一成员Ci1、 第二成员Ci2反馈第一中间结果Rit1的梯权 利 要 求 书 1/4 页
2
CN 114004363 A
2度、 第二中间结果Rit2的梯度进一 步包括:
所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1和第二中间结果Rit2进行的处
理, 得到预测结果, 并将所述预测结果发送至所述标签持有方;
所述标签持有方通过当前轮次的若干样本的标签数据与 所述预测结果的对比, 确定相
应的模型损失, 以反馈 至所述子服 务方Si;
所述子服务方Si根据所述模型损失, 确定针对第一中间结果Rit1的梯度和第二中间结果
Rit2的梯度。
5.根据权利要求4所述 的方法, 其中, 在所述第三子模型Wsi中包含待定参数的情况下,
所述子服 务方Si还检测所述模型损失针对所述第三子模型Wsi中包含待定参数的梯度。
6.根据权利要求3所述的方法, 其中, 单个子系统i当前轮次的若干样本的标签持有方
为第一成员Ci1或第二成员Ci2, 所述标签持有方设置有第四子模型Wci3; 所述子服务方Si基于
第三子模型Wsi对第一中间结果Rit1、 第二中间结果Rit2进行的处理, 分别向第一成员Ci1、 第
二成员Ci2反馈第一中间结果Rit1的梯度、 第二中间结果Rit2的梯度进一 步包括:
所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1和第二中间结果Rit2进行的处
理, 得到第三中间结果Rit3, 并将第三中间结果Rit3发送至所述标签持有方;
所述标签持有方通过第四子模型Wci3处理第三中间结果Rit3, 得到相应的预测结果, 并
基于当前轮次的若干样本的标签数据与所述预测结果的对比, 确定模型损失针对第三中间
结果Rit3的梯度, 以反馈 至所述子服 务方Si;
所述子服务方Si根据所述第三中间结果Rit3的梯度, 确定针对第一中间结果Rit1的梯度
和第二中间结果Rit2的梯度。
7.根据权利要求2所述的方法, 其中, 子系统i对本地模型Wi进行的联合训练包括:
子系统i中的各个训练成员进行多方安全计算, 以供各个训练成员确定模型损 失针对
本地待定参数的梯度;
各个训练成员各自基于相应子模型中待定参数的梯度, 确定待 同步参数的更新值, 其
中, 第一成员Ci1和第二成员Ci2分别确定第一子模型Wci1和第二子模型Wci2中的待同步参数
的更新值。
8.根据权利要求2所述的方法, 其中, 所述同步条件包括: 各个本地模型均经过预定轮
次的更新, 或者预定时间周期到 达。
9.根据权利要求2所述的方法, 其中, 单个待 同步参数为单个待定参数, 或者单个待定
参数对应的单个梯度。
10.根据权利要求2所述的方法, 其中, 所述联邦服务方对来自多个子系统的待同步参
数的更新 值进行安全同步包括:
所述联邦服务方接收各个训练成员分别发送的经过预定加密方式加密的各个待同步
参数;
所述联邦服务方将各个待 同步参数各自的更新值进行加和、 加权平均、 求中位数值中
至少一种方式的融合, 得到相应的同步 值。
11.根据权利要求10所述的方法, 其中, 所述预定加密方式包括以下方式之一: 添加满
足差分隐私的扰动; 同态加密; 秘密分享。
12.一种联合更新模型的方法, 所述方法适用于联合更新模型的系统更新模型W的过权 利 要 求 书 2/4 页
3
CN 114004363 A
3
专利 联合更新模型的方法、装置及系统
文档预览
中文文档
27 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共27页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:03:33上传分享