水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211387068.0 (22)申请日 2022.11.07 (71)申请人 联仁健康医疗大 数据科技股份有限 公司 地址 200131 上海市浦东 新区中国 (上海) 自由贸易试验区川和路5 5弄3号 (72)发明人 许文仪 罗永贵 周子捷  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 骆文欣 (51)Int.Cl. G16H 50/70(2018.01) G06N 3/08(2006.01) (54)发明名称 多数据源医学数据分析模型训练方法、 装 置、 设备和介质 (57)摘要 本发明实施例公开了一种多数据源医学数 据分析模型训练方法、 装置、 设备和介质。 其中, 方法包括: 对目标医学数据进行预处理, 对初始 医学数据分析模 型进行至少一个轮次模型训练, 得到分节 点模型更新参数; 在每一个模型训练轮 次中, 将分节 点模型更新参数发送至预设模型训 练中心节点服务端, 进行更新参数; 获取目标模 型更新参数, 并基于目标模型更新参数更新初始 医学数据分析模 型, 基于更新后的医学数据分析 模型进行下一个模型训练轮次, 直到完成全部模 型训练轮次, 得到目标医学数据分析模型。 本发 明实施例的技术方案, 解决了多数据源的医学数 据在数据整合过程中存在数据安全隐患的问题, 既能保证医学数据的安全性, 又能提高目标模型 的泛化性。 权利要求书2页 说明书11页 附图4页 CN 115527686 A 2022.12.27 CN 115527686 A 1.一种多数据源医学 数据分析模型训练方法, 应用于数据源端, 其特 征在于, 包括: 对目标医学数据进行预处理, 并将经过预处理的目标医学数据中至少一个预设模态图 像数据和与所述图像数据关联的临床 检查结果数据作为模型训练样本, 对初始医学数据分 析模型进行至少一个 轮次模型训练, 得到分节点模型 更新参数; 在每一个模型训练轮次中, 将所述分节点模型更新参数发送至预设模型训练中心节点 服务端, 以使 所述中心节点服务端根据各所述数据源端的分节点模型更新参数确定 当前模 型训练轮次的目标模型 更新参数; 获取所述目标模型更新参数, 并基于所述目标模型更新参数更新所述初始医学数据分 析模型, 基于更新后的医学数据分析模型进行下一个模型训练轮次, 直到完成全部模型训 练轮次, 得到目标医学 数据分析模型。 2.根据权利要求1所述的方法, 其特征在于, 所述将经过预处理 的目标医学数据中至少 一个预设模态的图像数据和与所述图像数据关联的临床 检查结果数据作为模型训练样本, 对初始医学 数据分析模型进行至少一个 轮次模型训练, 包括: 将各所述图像数据分别输入到预设图像特征编码模型中, 得到对应的单一图像特征向 量, 并进行向量 拼接, 得到目标图像特 征向量; 对所述临床检查结果数据进行 特征编码处 理, 得到对应的文本特 征向量; 将所述目标图像特征向量和所述文本特征向量进行拼接得到目标样本特征向量, 并基 于所述目标样本特征向量和对应的样本标签对初始医学数据分析模型进行至少一个轮次 模型训练。 3.根据权利要求2所述的方法, 其特征在于, 当同一个预设模态的多个图像数据之间存 在时序关系时, 得到所述目标图像特 征向量的过程还 包括: 基于所述 时序关系, 将在先的单一图像特征向量输入到预设时序 特征编码模型中进行 特征编码, 得到含时序特 征的图像特 征向量; 将与所述在先的单一图像特征向量相邻的在后的单一图像特征向量与所述含时序特 征的图像向量同时输入到所述预设时序特征编 码模型中进 行特征编 码, 得到更新后的含时 序特征的图像特征向量, 重复该过程直到遍历 完成所述时序关系中的每一个单一图像特征 向量, 得到与预设模态对应的时序图像特 征向量; 将不同预设模态对应的时序图像特 征向量进行拼接, 得到所述目标图像特 征向量。 4.根据权利要求1所述的方法, 其特征在于, 所述将所述分节点模型更新参数发送至预 设模型训练中心 节点服务端, 包括: 采用预设同态加密算法对所述分节点模型 更新参数进行加密处 理; 将加密后的所述分节点模型 更新参数发送至预设模型训练中心 节点服务端。 5.根据权利要求2所述的方法, 其特征在于, 所述预设图像特征编码模型为经过预训练 的Vision Transformer模型。 6.根据权利要求2所述的方法, 其特征在于, 所述对所述临床检查结果数据进行特征编 码处理, 包括: 通过one‑hot编码算法, 对所述临床检查结果数据进行 特征编码处 理。 7.根据权利要求1 ‑6中任一所述的方法, 其特征在于, 所述初始医学数据分析模型为具 有分类功能的神经网络模型。权 利 要 求 书 1/2 页 2 CN 115527686 A 28.一种多数据源医学 数据分析模型训练装置, 其特 征在于, 包括: 模型训练模块, 用于对目标医学数据进行预处理, 并将经过预处理的目标医学数据中 至少一个预设模态图像数据和与所述图像数据关联 的临床检查结果数据作为模型训练样 本, 对初始医学 数据分析模型进行至少一个 轮次模型训练, 得到分节点模型 更新参数; 参数传递模块, 用于在每一个模型训练轮次中, 将所述分节点模型更新参数发送至预 设模型训练中心节点服务端, 以使所述中心节点服务端根据各所述数据源端的分节点模型 更新参数确定当前模型训练轮次的目标模型 更新参数; 所述模型训练模块, 还用于获取所述目标模型更新参数, 并基于所述目标模型更新参 数更新所述初始医学数据分析模型, 基于更新后的医学数据分析模型进 行下一个模型训练 轮次, 直到 完成全部模型训练轮次, 得到目标医学 数据分析模型。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所 述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7任一所述的多数 据源医学 数据分析模型训练方法。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机指 令, 所述计算机指令用于使处理器执行时实现权利要求1 ‑7任一所述的多数据源医学数据 分析模型训练方法。权 利 要 求 书 2/2 页 3 CN 115527686 A 3

PDF文档 专利 多数据源医学数据分析模型训练方法、装置、设备和介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 多数据源医学数据分析模型训练方法、装置、设备和介质 第 1 页 专利 多数据源医学数据分析模型训练方法、装置、设备和介质 第 2 页 专利 多数据源医学数据分析模型训练方法、装置、设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:43上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。