专利 联合更新模型的方法、装置及系统

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111256451.8 (22)申请日 2021.10.27 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人郑龙飞　陈超超　王力　张本宇　 (74)专利代理机构北京亿腾知识产权代理事务所(普通合伙) 11309 代理人陈霁　周良玉 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称联合更新模型的方法、装置及系统 (57)摘要本说明书实施例提供一种联合更新模型的方法、装置及系统。通过本说明书实施例提供的方法、装置和系统，基于联合更新模型时的数据复合切分情形，设想将训练成员的数据进行分割，从而构成多个水平切分的子系统，在单个子系统内部，可以包括数据垂直切分的训练成员。这样，数据呈垂直切分的单个子系统通过分布在多个训练成员的训练样本在子系统内部迭代，从而更新待同步参数。而各个子系统之间，可以按照同步条件触发的同步周期进行数据同步。这种方式充分考虑各个训练成员的数据构成，为复杂数据结构下的联合更新模型提供解决方案，有利于扩展联邦学习的应用范围。权利要求书4页说明书15页附图7页 CN 114004363 A 2022.02.01 CN 114004363 A 1.一种联合更新模型的系统，包括联邦服务方和多个子系统，用于联合更新模型W，所述多个子系统中的单个子系统i包括训练成员中的第一成员Ci1、第二成员Ci2，第一成员Ci1、第二成员Ci2持有的样本数据构成垂直切分，各个子系统持有的样本数据构成水平切分，单个子系统i对应与模型W结构一致的本地模型Wi，本地模型Wi包括设在第一成员Ci1的第一子模型Wci1、设在第二成员Ci2的第二子模型Wci2；其中：单个子系统i用于，利用在第一成员Ci1、第二成员Ci2上垂直切分的训练样本针对本地模型Wi进行垂直切分方式下的联合训练，并在满足同步条件的情况下，向所述联邦服务方提供相应本地模型Wi中与各个待定参数一一对应的各个待同步参数的更新值，以及根据所述联邦服务方反馈的各个待同步参数的同步值，进行本地待同步参数与各个子系统中的待同步参数的同步，从而调整相应待定参数；所述联邦服务方用于对来自多个子系统的待同步参数的更新值进行安全同步，并反馈同步值。 2.一种联合更新模型的方法，所述方法适用于联合更新模型的系统更新模型W的过程，所述系统包括联邦服务方和多个子系统，所述多个子系统中的单个子系统i包括训练成员中的第一成员Ci1、第二成员Ci2，第一成员Ci1、第二成员Ci2持有的样本数据构成垂直切分，各个子系统持有的样本数据构成水平切分，单个子系统i对应与模型W结构一致的本地模型 Wi，本地模型Wi包括设在第一成员Ci1的第一子模型Wci1、设在第二成员Ci2的第二子模型Wci2；所述方法包括：各个子系统各自利用在相应第一成员、第二成员上垂直切分的训练样本针对相应本地模型进行垂直切分方式下的联合训练，并在满足同步条件的情况下，由各个训练成员各自向所述联邦服务方提供相应子模型中与各个待定参数一一对应的各个待同步参数的更新值；所述联邦服务方对来自多个子系统的待同步参数的更新值进行安全同步，并反馈各个待同步参数的同步值；各个子系统中的各个训练成员各自接收本地待同步参数的同步值，以更新本地的待定参数。 3.根据权利要求2所述的方法，单个子系统i还包括子服务方Si，单个子系统i对本地模型Wi进行的联合训练包括：针对当前轮次的若干样本，第一成员Ci1和第二成员Ci2各自通过第一子模型Wci1和第二子模型Wci2处理相应的本地样本数据，分别得到对应的第一中间结果Rit1、第二中间结果 Rit2，以发送给子服务方Si；子服务方Si基于第三子模型Wsi对第一中间结果Rit1、第二中间结果Rit2进行的处理，分别向第一成员Ci1、第二成员Ci2反馈第一中间结果Rit1的梯度、第二中间结果Rit2的梯度；第一成员Ci1和第二成员Ci2各自利用第一中间结果Rit1的梯度和第二中间结果Rit2的梯度，确定第一子模型Wci1和第二子模型Wci2中的待定参数的梯度，从而分别确定第一子模型 Wci1和第二子模型Wci2中的待同步参数的更新值。 4.根据权利要求3所述的方法，其中，单个子系统i中当前轮次的若干样本的标签持有方为第一成员Ci1或第二成员Ci2；所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1、第二中间结果Rit2进行的处理，分别向第一成员Ci1、第二成员Ci2反馈第一中间结果Rit1的梯权　利　要　求　书 1/4 页 2 CN 114004363 A 2度、第二中间结果Rit2的梯度进一步包括：所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1和第二中间结果Rit2进行的处理，得到预测结果，并将所述预测结果发送至所述标签持有方；所述标签持有方通过当前轮次的若干样本的标签数据与所述预测结果的对比，确定相应的模型损失，以反馈至所述子服务方Si；所述子服务方Si根据所述模型损失，确定针对第一中间结果Rit1的梯度和第二中间结果 Rit2的梯度。 5.根据权利要求4所述的方法，其中，在所述第三子模型Wsi中包含待定参数的情况下，所述子服务方Si还检测所述模型损失针对所述第三子模型Wsi中包含待定参数的梯度。 6.根据权利要求3所述的方法，其中，单个子系统i当前轮次的若干样本的标签持有方为第一成员Ci1或第二成员Ci2，所述标签持有方设置有第四子模型Wci3；所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1、第二中间结果Rit2进行的处理，分别向第一成员Ci1、第二成员Ci2反馈第一中间结果Rit1的梯度、第二中间结果Rit2的梯度进一步包括：所述子服务方Si基于第三子模型Wsi对第一中间结果Rit1和第二中间结果Rit2进行的处理，得到第三中间结果Rit3，并将第三中间结果Rit3发送至所述标签持有方；所述标签持有方通过第四子模型Wci3处理第三中间结果Rit3，得到相应的预测结果，并基于当前轮次的若干样本的标签数据与所述预测结果的对比，确定模型损失针对第三中间结果Rit3的梯度，以反馈至所述子服务方Si；所述子服务方Si根据所述第三中间结果Rit3的梯度，确定针对第一中间结果Rit1的梯度和第二中间结果Rit2的梯度。 7.根据权利要求2所述的方法，其中，子系统i对本地模型Wi进行的联合训练包括：子系统i中的各个训练成员进行多方安全计算，以供各个训练成员确定模型损失针对本地待定参数的梯度；各个训练成员各自基于相应子模型中待定参数的梯度，确定待同步参数的更新值，其中，第一成员Ci1和第二成员Ci2分别确定第一子模型Wci1和第二子模型Wci2中的待同步参数的更新值。 8.根据权利要求2所述的方法，其中，所述同步条件包括：各个本地模型均经过预定轮次的更新，或者预定时间周期到达。 9.根据权利要求2所述的方法，其中，单个待同步参数为单个待定参数，或者单个待定参数对应的单个梯度。 10.根据权利要求2所述的方法，其中，所述联邦服务方对来自多个子系统的待同步参数的更新值进行安全同步包括：所述联邦服务方接收各个训练成员分别发送的经过预定加密方式加密的各个待同步参数；所述联邦服务方将各个待同步参数各自的更新值进行加和、加权平均、求中位数值中至少一种方式的融合，得到相应的同步值。 11.根据权利要求10所述的方法，其中，所述预定加密方式包括以下方式之一：添加满足差分隐私的扰动；同态加密；秘密分享。 12.一种联合更新模型的方法，所述方法适用于联合更新模型的系统更新模型W的过权　利　要　求　书 2/4 页 3 CN 114004363 A 3

专利 联合更新模型的方法、装置及系统

专利联合更新模型的方法、装置及系统