水利行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111360276.7 (22)申请日 2021.11.17 (71)申请人 深圳前海微众 银行股份有限公司 地址 518052 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 黄安埠 (74)专利代理 机构 北京派特恩知识产权代理有 限公司 1 1270 代理人 赵翠萍 张颖玲 (51)Int.Cl. G06F 30/27(2020.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 机器学习模型的训练方法、 装置、 电子设备 及存储介质 (57)摘要 本申请提供了一种机器学习模型的训练方 法、 装置; 方法包括: 基于共享样本集以及训练方 设备的私有样本集, 对训练方设备的机器学习模 型进行训练, 得到训练后的机器学习模型; 基于 共享样本集, 调用训练后的机器学习模型进行预 测处理, 得到预测值集合; 向服务方设备发送预 测值集合, 预测值集合用于供服务方设备结合其 他训练方设备 发送的预测值集合进行融合处理, 得到融合值集合; 接收服务方设备 发送的融合值 集合, 并根据融合值集合更新共享样本集; 更新 后的共享样 本集与私有样本集, 用于供训练方设 备对机器学习模 型进行下一轮的训练。 通过本申 请, 能够充分利用多 方样本数据减少模型训练耗 时, 提升模型训练效率。 权利要求书3页 说明书18页 附图6页 CN 114021473 A 2022.02.08 CN 114021473 A 1.一种机器学习模型的训练方法, 其特 征在于, 应用于训练方设备, 所述方法包括: 基于共享样本集以及所述训练方设备的私有样本集, 训练所述训练方设备的机器学习 模型; 基于所述共享样本集, 调用训练后的所述机器学习模型进行预测 处理, 得到预测值集 合; 向服务方设备发送所述预测值集合; 其中, 所述预测值集合用于供所述服务方设备结 合其他训练方设备发送的预测值 集合进行融合处 理, 得到融合 值集合; 接收所述服务方设备发送的所述融合值集合, 并根据所述融合值集合更新所述共享样 本集; 其中, 更新后的所述共享样本集与所述私有样本集, 用于供所述训练方设备对所述机 器学习模型进行 下一轮的训练。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述融合值集合更新所述共享样 本集, 包括: 针对所述共享样本集中每 个共享样本执 行以下处 理: 获取所述融合值集合与所述共享样本对应的融合值, 基于所述融合值替换所述共享样 本的标签。 3.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 向所述服务方设备发送样本获取请求; 接收所述 服务方设备响应于所述样本获取请求而发送的所述共享样本集; 其中, 所述共享样本集包括每 个所述训练方设备的私有样本集中的部分样本 。 4.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 接收所述 服务方设备发送的样本上传请求; 从所述训练方设备的私有样本集中选取部分样本, 并向所述服务方设备发送所述部分 样本。 5.根据权利要求4所述的方法, 其特征在于, 所述从所述训练方设备的私有样本集中选 取部分样本, 包括: 基于样本上传比例, 从所述训练方设备的私有样本集中选取与 所述样本上传比例对应 的样本; 或者, 从所述训练方设备的所述私有样本集中选取目标 数量的样本 。 6.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 向所述服务方设备发送模型获取请求; 其中, 所述模型获取请求包括模型 标识; 接收所述服务方设备发送的与所述模型标识对应的初始机器学习 模型, 将所述初始机 器学习模型作为待训练的机器学习模型。 7.根据权利要求1所述的方法, 其特征在于, 在训练所述训练方设备的机器学习 模型之 前, 所述方法还 包括: 向所述服务方设备发送模型参数获取请求; 其中, 所述模型参数获取请求包括模型标权 利 要 求 书 1/3 页 2 CN 114021473 A 2识; 接收所述服务方设备发送的与所述模型标识对应的模型参数; 其中, 所述模型参数是 所述服务方设备进行初始化得到的。 8.一种机器学习模型的训练方法, 其特 征在于, 应用于服 务方设备, 所述方法包括: 向每个训练方设备发送共享样本集; 其中, 所述共享样本集和所述训练方设备的私有 样本集, 用于供 所述训练方设备训练所述训练方设备的机器学习模型; 接收每个所述训练方设备发送的预测值集合并进行融合处理, 得到融合值集合; 其中, 所述预测 值集合是所述训练方设备基于所述共享样本集调用训练后机器学习学习模型进 行预测处理得到的, 所述机器学习模型是基于所述共享样本集和所述训练方设备的私有样 本集训练的; 向所述训练方设备发送所述融合值集合; 其中, 所述融合值集合用于供所述训练方设 备更新所述共享样本集, 并结合对所述训练方设备的私有样本集对所述机器学习模型进 行 下一轮的训练。 9.根据权利要求8所述的方法, 其特征在于, 所述接收每个所述训练方设备发送的预测 值集合并进行融合处 理, 得到融合 值集合, 包括: 针对所述共享样本集中每 个共享样本执 行以下处 理: 从每个所述训练方设备发送的预测值 集合中, 获取 所述共享样本对应的多个预测值; 对所述多个预测值求平均值, 将所述平均值作为所述共享样本对应的融合值, 所述融 合值与所述共享样本存在一 一对应的关系。 10.一种机器学习模型的训练装置, 其特 征在于, 包括: 训练模块, 用于基于共享样本集以及所述训练方设备的私有样本集, 对所述训练方设 备的机器学习模型进行训练, 得到训练后的所述机器学习模型; 预测模块, 用于接收各所述训练方设备发送的对应所述共享样本集的共享预测值; 并 对所述共享预测值进行融合处 理, 得到与各 所述共享样本对应的融合 值; 第一发送模块, 用于向服务方设备发送所述预测值集合; 其中, 所述预测值集合用于供 所述服务方设备 结合其他训练方设备发送的预测值 集合进行融合处 理, 得到融合 值集合; 接收模块, 用于接收所述服务方设备发送的所述融合值集合, 并根据所述融合值集合 更新所述共享样 本集; 其中, 更新后的所述共享样本集与所述私有样本集, 用于供所述训练 方设备对所述机器学习模型进行 下一轮的训练。 11.一种机器学习模型的训练装置, 其特 征在于, 包括: 第二发送模块, 用于向每个所述训练方设备发送共享样本集; 其中, 所述共享样本集和 所述训练方设备的私有样本集, 用于供所述训练方设备训练所述训练方设备的机器学习模 型; 融合模块, 用于接收每个所述训练方设备发送的预测值集合并进行融合处理, 得到融 合值集合; 其中, 所述预测 值集合是所述训练方设备基于所述共享样本集调用训练后机器 学习学习模型进 行预测处理得到的, 所述机器学习模型是基于所述共享样本集和所述训练 方设备的私有样本集训练的; 第三发送模块, 用于向所述训练方设备发送所述融合值集合; 其中, 所述融合值集合用 于供所述训练方设备更新所述共享样本集, 并结合对所述训练方设备的私有样本集对所述权 利 要 求 书 2/3 页 3 CN 114021473 A 3
专利 机器学习模型的训练方法、装置、电子设备及存储介质
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 19:02:54
上传分享
举报
下载
原文档
(1.1 MB)
分享
友情链接
GB-T 38635.1-2020 信息安全技术 SM9标识密码算法 第1部分:总则.pdf
DB52-T 1500-2020 曳引驱动电梯节能改造技术要求及验收规范 贵州省.pdf
GB-T 42589-2023 信息安全技术 电子凭据服务安全规范.pdf
GB-T 10051.15-2010 起重吊钩 第15部分:叠片式单钩.pdf
YD-T 3763.8-2021 研发运营一体化(DevOps)能力成熟度模型 第8部分:系统和工具技术要求.pdf
GB-T 28726-2012 气体分析 氦离子化气相色谱法.pdf
GB-T 34104-2017 金属材料 试验机加载同轴度的检验.pdf
T-GDNS 001—2020 广东省网络安全等级保护专家库管理规范.pdf
SY-T 0043-2020 石油天然气工程管道和设备涂色规范.pdf
T-BJQC 202201—2022 建筑垃圾运输车辆安全管理技术要求.pdf
路笑凡 Web安全在实战中技战法 2021.pdf
GB-T 38666-2020 信息技术 大数据 工业应用参考架构.pdf
GM-T 0042-2015 三元对等密码安全协议测试规范.pdf
T-WJQMA 02—2023 甜瓜抗白粉病鉴定技术规程.pdf
GB-T 41704-2022 锂离子电池正极材料检测方法 磁性异物含量和残余碱含量的测定.pdf
GB-T 41495-2022 混凝土泵车保养、维修及报废规范.pdf
中国移动 量子时代区块链技术白皮书 2020.pdf
GB-T 41574-2022 信息技术安全技术公有云中个人信息保护实践指南 ISO-IEC 27018-2019.pdf
全知科技 数据安全治理之数据安全风险评估白皮书 2021.pdf
GB-T 42581-2023 信息技术服务 数据中心业务连续性等级评价准则.pdf
1
/
3
28
评价文档
赞助2元 点击下载(1.1 MB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。