(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111370530.1
(22)申请日 2021.11.18
(71)申请人 深圳致星科技有限公司
地址 518000 广东省深圳市南 山区粤海街
道大冲社区深南大道9676号大冲商务
中心 (一期) 2栋 3号楼18C -1
(72)发明人 彭瑞 王亚玲 王玮
(74)专利代理 机构 广州三环 专利商标代理有限
公司 44202
代理人 熊永强
(51)Int.Cl.
G06F 9/50(2006.01)
G06F 9/54(2006.01)
G06N 20/00(2019.01)
(54)发明名称
用于联邦学习的异构加速引擎及方法
(57)摘要
本申请涉及一种用于联邦学习的异构加速
引擎及方法。 异构加速引擎包括: 多种应用接口
分别对应异构计算相关函数和多种服务模块。 应
用接口中的每一种与服务模块中的至少一种相
对应。 联邦学习方案的执行过程通过根据该方案
选择性调用的应用接口对应的服务模块进行。 服
务模块包括设备调用模块和算子调用模块用于
调用联邦 学习硬件系统的设备和算子。 该方案的
执行过程中对设备调用模块和算子调用模块的
调用根据该方案的性能参数和联邦学习硬件系
统的性能测试结果确定。 性能测试结果通过按照
多种预设性能参数预先进行性能测试确定。 该方
案的性能参数对应多种预设性能参数中的至少
一种。 如此充分利用异构加速硬件资源, 降低能
耗和提高计算 性能。
权利要求书5页 说明书20页 附图3页
CN 114064278 A
2022.02.18
CN 114064278 A
1.一种异构加速引擎, 应用于联邦学习, 所述异构加速引擎连接于联邦学习软件系统
和联邦学习硬件系统之间, 所述异构加速引擎包括:
多种应用接口, 其中, 所述多种应用接口分别对应异构计算相关函数, 所述联邦学习软
件系统根据特定联邦学习方案选择性调用所述多种应用接口及 对应的异构 计算相关函数;
和
多种服务模块, 其中, 所述多种应用接口中的每一种应用接口与所述多种服务模块中
的至少一种服 务模块相对应,
其中, 所述特定联邦学习方案的执行过程通过与被所述联邦学习软件系统根据 所述特
定联邦学习方案 选择性调用的应用接口对应的服 务模块进行,
其中, 所述多种服务模块包括设备调用模块用于调用所述联邦学习硬件系统的设备和
算子调用模块用于调用所述联邦学习硬件系统的设备的算子,
其中, 所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块
的调用根据所述特定联邦学习方案的性能参数和所述联邦学习硬件系统的性能测试结果
确定,
其中, 所述联邦学习硬件系统 的性能测试结果通过对所述联邦学习硬件系统按照多种
预设性能参数预先进 行性能测试确定, 所述特定联邦学习方案的性能参数对应所述多种预
设性能参数中的至少一种预设性能参数。
2.根据权利要求1所述的异构加速引擎, 所述多种预设性 能参数包括算子模式, 所述联
邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照多种预设性能参数预
先进行性能测试确定, 包括:
所述联邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照不同算子
模式预先进行性能测试确定 。
3.根据权利要求2所述的异构加速引擎, 所述特定联邦学习方案的性能参数是算子模
式, 所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调用
根据所述特定联邦学习方案的性能参数和所述联邦学习硬件系统的性能测试结果确定, 包
括:
所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调
用根据所述特定联邦学习方案的算子模式和所述联邦学习硬件系统的性能测试 结果确定 。
4.根据权利要求1所述的异构加速引擎, 所述多种预设性 能参数包括数据位宽, 所述联
邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照多种预设性能参数预
先进行性能测试确定, 包括:
所述联邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照不同数据
位宽预先进行性能测试确定 。
5.根据权利要求4所述的异构加速引擎, 所述特定联邦学习方案的性能参数是数据位
宽, 所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调用
根据所述特定联邦学习方案的性能参数和所述联邦学习硬件系统的性能测试结果确定, 包
括:
所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调
用根据所述特定联邦学习方案的数据位宽和所述联邦学习硬件系统的性能测试 结果确定 。权 利 要 求 书 1/5 页
2
CN 114064278 A
26.根据权利要求1所述的异构加速引擎, 所述多种预设性 能参数包括数据量量级, 所述
联邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照多种预设性能参数
预先进行性能测试确定, 包括:
所述联邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照不同数据
量量级预先进行性能测试确定 。
7.根据权利要求6所述的异构加速引擎, 所述特定联邦学习方案的性能参数是数据量
量级, 所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调
用根据所述特定联邦学习方案的性能参数和所述联邦学习硬件系统的性能测试结果确定,
包括:
所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调
用根据所述特定联邦学习方案的数据量量级和所述联邦学习硬件系统的性能测试结果确
定。
8.根据权利要求1所述的异构加速引擎, 所述多种预设性 能参数包括算子模式、 数据位
宽和数据量量级, 所述联邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按
照多种预设性能参数 预先进行性能测试确定, 包括:
所述联邦学习硬件系统的性能测试结果通过对所述联邦学习硬件系统按照不同算子
模式、 不同数据位宽或者 不同数据量 量级预先进行性能测试确定 。
9.根据权利要求8所述的异构加速引擎, 所述特定联邦学习方案的性能参数至少包括
算子模式、 数据位宽或者数据量量级, 所述特定联邦学习方案的执行过程中对所述设备调
用模块和所述算子调用模块的调用根据所述特定联邦学习方案的性能参数和所述联邦学
习硬件系统的性能测试 结果确定, 包括:
所述特定联邦学习方案的执行过程中对所述设备调用模块和所述算子调用模块的调
用根据所述特定联邦学习方案的算子模式、 数据位宽或者数据量量级和所述联邦学习硬件
系统的性能测试 结果确定 。
10.根据权利要求9所述的异构加速引擎, 所述特定联邦学习方案的执行过程中对所述
设备调用模块和所述 算子调用模块的调用还参 考用户指定设备或者用户偏好。
11.根据权利要求1所述的异构加速引擎, 所述多种服 务模块还 包括:
数据传输模块, 用于控制所述异构加速引擎和所述联邦学习硬件系统之间的数据交
互;
数据存储模块, 用于管理所述异构加速引擎和所述联邦学习硬件系统各自的数据存储
操作;
数据格式转换模块, 用于进行所述联邦学习软件系统 的数据格式和所述联邦学习硬件
系统的数据格式之间的数据格式转换操作; 以及
设备回传模块, 用于将所述联邦学习硬件系统 的计算结果 回传给所述联邦学习软件系
统。
12.根据权利要求11所述的异构加速引擎, 所述特定联邦学习方案的执行过程中对所
述数据传输模块、 所述数据存储模块、 所述数据格式转换模块以及所述设备回传模块的调
用基于所述特定联邦学习方案的配置信息确定, 其中, 所述特定联邦学习 方案的配置信息
指示所述联邦学习硬件系统的特定计算结果是否可复用、 是否基于矩阵运算操作以及是否权 利 要 求 书 2/5 页
3
CN 114064278 A
3
专利 用于联邦学习的异构加速引擎及方法
文档预览
中文文档
29 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:03:19上传分享