水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210128620.8 (22)申请日 2022.02.11 (71)申请人 合肥工业大 学 地址 230009 安徽省合肥市包河区屯溪路 193号 (72)发明人 刘羽 牧富豪 成娟 李畅  宋仁成 陈勋  (74)专利代理 机构 安徽省合肥新 安专利代理有 限责任公司 34101 专利代理师 陆丽莉 何梅生 (51)Int.Cl. G06T 7/174(2017.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于图像融合技术的多模态图像分割 方法 (57)摘要 本发明公开了一种基于图像融合技术的多 模态图像分割方法, 包括: 第一步, 融合多模态图 像: 数据获取及预处理, 建立基于像素级的融合 网络, 训练网络和输出融合模态图像; 第二步, 分 割多模态图像: 数据获取及预处理, 建立基于特 征级融合的多模态特征选择模块与分割网络, 分 割网络训练和分割图像后处理。 本发 明从像素级 融合和特征级融合两个角度提升了图像分割的 精度, 为图像的进一步分析处理提供了有力的支 持。 权利要求书2页 说明书8页 附图4页 CN 114494322 A 2022.05.13 CN 114494322 A 1.一种基于图像融合 技术的多模态图像分割方法, 其特 征包括以下步骤: 步骤1: 融合多模态图像: 步骤1.1: 数据获取及预处 理: 根据分割需求选取第一模态图像S1和第二模态图像S2并作为源模态图像后对其随机裁 剪成尺寸为L ×H×W的图像样本后再进行归一化处理, 从而得到预处理后的第一模态图像 S′1和第二模态图像S ′2; 步骤1.2: 建立基于像素级的融合网络: 所述像素级的融合网络包含两个 结构相同的分支, 每个分支均包含 一个卷积层Convx和 一个残差层Res ‑convx, x=1或2; 其中, 残差层是由两个卷积层跳跃连接组成; 其中, 卷积层 包括: 1个三维卷积层, 1个批量归一 化层以及1个ReLU激活函数层; 每个分支 接收一种模态图像集, 从而将预处理后的第一模态图像集S ′1和第二模态图像 集S′2分别经过两个分支的处 理后, 相应输出第一模态特 征图F1和第二模态特 征图F2; 将第一模态特征 图F1和第二模态特征图F2拼接后依次输入第三个残差层Res ‑conv3的 处理后再经过两个卷积层Conv3和Conv4以及一个激活函数层的处理, 并得到权重图m, 从而 利用式(1)得到所述像素级的融合网络 输出的融合模态图像F: F=mS1+(1‑m)S2                              (1) 步骤1.3: 构建如式(2)所示的损失函数Lfusion: Lfusion=Lpixel+α Lssim                             (2) 式(2)中, α是平衡两项损失在同一数量级的参数, Lpixel与Lssim分别代表训练的像素损 失和结构相似性损失, 并有: Lssim=γ(1‑SSIM(F,S1))+(1‑SSIM(F,S2))                    (4) 式(3)中, β 表示权 重系数, 表示F范数; 式(4)中, γ表示权 重系数, S SIM(·)表示结构相似度; 步骤1.4: 基于预处理后的第一模态图像S ′1和第二模态图像S ′2训练像素级的融合网 络, 并采用反向传播算法对 所述损失函数Lfusion进行优化求解, 从而调整所述融合网络中所 有参数, 当训练迭代次数达到 设定的次数或损失函数Lfusion的值达小于所设定的阈值时, 训 练停止, 从而得到最优融合模型及其输出 的融合图像, 并将输出 的融合图像还原至源模态 图像的尺寸, 得到最优融合图像F*; 步骤2: 分割多模态图像: 步骤2.1: 数据预处 理: 将源模态图像与最优融合图像F*拼接后随机裁剪成尺寸为L1×H1×W1的图像块并进行 归一化处理, 得到预处理后的N个图像块, 且每个图像块对应一个模态; 获取源模态图像对 应的真实标签图像g; 步骤2.2: 建立基于特 征级融合的多模态特 征选择模块: 根据图像块的模态数量N, 设置所述多模态特征选择模块包含的并行分支个数为N, 使 得每个并行分支对应一种模态图像; 第n个并行分支使用一个卷积层来提取对应第n种模态的图像块的浅层特征Un, 从而得权 利 要 求 书 1/2 页 2 CN 114494322 A 2到N个尺寸 为L1×H1×W1×C的浅层特 征U1,U2,…,Un…,UN, n=1,2,...,N, C为通道数; 将不同并行分支提取的浅层特征U1,U2,…,Un…,UN相加得到中间融合特征U, 再将中间 融合特征U通过一个全局平局池化层的处 理后得到尺寸 为1×1×1×C的通道特 征向量sC; 使用一个卷积层对所述通道特征向量sC进行下采样操作以降低通道数量, 从而得到尺 寸为1×1×1×C/r的特征向量z; N个并行分支对所述特征向量z使用N个卷积层的上采样处理, 得到N个尺寸为1 ×1×1 ×C的特征向量并使用softmax层的激活处理, 得到N个分支上的权重向量t1,t2,…,tn,…, tN, 从而利用式(5)得到多模态特 征选择模块输出的融合特 征V: 式(5)中, tn表示第n个分支上的权 重向量, Un表示第n个分支上的浅层特 征; 步骤2.3: 建立分割网络, 并将融合特征V输入所述分割网络中进行处理, 得到分割结果 图像p; 步骤2.4: 构建如式(6)所示的损失函数Lseg: Lseg=Ldice+λLbce                  (6) 式(6)中, λ是权 重系数, Ldice与Lbce分别代表训练的Dice损失与BC E损失, 并有: 式(7)和式(8)中, pi代表分割结果图像p中第i个像素点的预测值, gi代表真实标签图像 g中第i个像素点的真实标签值, v代 表图像像素点的数量; 步骤2.4.2: 基于源模态图像S1, S2, 融合模态图像F及真实标签图像g对所述分割网络进 行训练, 并采用反向传播算法对 所述损失函数Lseg进行优化求解, 从而调整 所述分割网络中 所有参数, 当训练迭代次数达到 设定的次数或损失函数Lseg的值达小于所设定的阈值时, 训 练停止, 从而得到最优分割模型; 步骤2.5: 将待分割的多模态图像输入至所述最优分割模型中, 并得到分割结果后还原 至原始尺寸, 从而得到最终的分割图像。权 利 要 求 书 2/2 页 3 CN 114494322 A 3

.PDF文档 专利 一种基于图像融合技术的多模态图像分割方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于图像融合技术的多模态图像分割方法 第 1 页 专利 一种基于图像融合技术的多模态图像分割方法 第 2 页 专利 一种基于图像融合技术的多模态图像分割方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 01:16:23上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。