(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210221508.9
(22)申请日 2022.03.09
(71)申请人 昆明理工大 学
地址 650093 云南省昆明市五华区学府路
253号
(72)发明人 杨彪 倪瑞璞 成宬 朱荣 钱斌
李琨 张长胜 金怀平
(74)专利代理 机构 昆明明润知识产权代理事务
所(普通合伙) 53215
专利代理师 张云
(51)Int.Cl.
G06T 7/11(2017.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)G06V 10/80(2022.01)
G06V 10/82(2022.01)
(54)发明名称
一种基于全局特征的矿物图像分割方法及
装置
(57)摘要
本发明公开了一种基于全局特征的矿物图
像分割方法及装置。 本发明基于 “编码器‑解码
器”的网络模 型结构设计了全局特征提取模块和
特征融合策略, 其中全局特征提取模块是编码器
阶段的基础模块, 该模块引入Transformer运算
提取图像中像素的全局特征联系, 并通过对卷积
层和Transformer层并行运算的结果进行特征通
道合并, 获取更丰富的矿物图像特征, 然后利用
残差连接 策略实现位置特征的还原; 于解码器阶
段采用特征融合策略, 根据各输出特征图对分割
决策的重要性进行融合, 使每一部分的输出特征
图都参与到最终的分割决策中。 本发 明通过对矿
物图像的全局特征进行提取, 并充分利用所提取
特征参与到最终的分割决策中, 能有效提高矿物
颗粒的分割精度。
权利要求书1页 说明书5页 附图3页
CN 114565625 A
2022.05.31
CN 114565625 A
1.一种基于全局特 征的矿物图像分割方法, 其特 征在于: 包括:
构建矿物图像分割模型; 所述矿物图像分割模型包括编码器和解码器;
获取待分割训练的原始矿物图像, 输入至训练好的矿物图像分割模型, 输出矿物分割
图像。
2.根据权利要求1所述的基于全局特征的矿物图像分割方法, 其特征在于: 所述编码器
由m个全局特征提取模块和下采样层交替构成; 其中, 全局特征提取模块包括卷积层和
Transformer层, m≥2。
3.根据权利要求2所述的基于全局特征的矿物图像分割方法, 其特征在于: 当输入图像
或者输入 特征图时, 首先由卷积层和Transformer层 进行并行地特征提取, 将提取的特征图
于通道方向进行连接, 接着对连接后的特征图采用1 ×1卷积核进行通道方向降维处理; 将
输入图像或输入特征图通过残差连接策略连接至降维处理后的输出特征图进行空间方向
上的特征相加; 使用大小为2 ×2、 步长为2的最大池化层 对特征相加 后的输出特征图进 行下
采样操作; 其中, 输入图像表示首次输入全局特征提取模块时的图像, 即原始矿物图像; 输
入特征图为 非首次输入全局特征提取模块时的图像, 即上一次执行下采样操作后的输出特
征图。
4.根据权利要求1所述的基于全局特征的矿物图像分割方法, 其特征在于: 所述解码器
包括m个转置卷积层。
5.根据权利要求4所述的基于全局特征的矿物图像分割方法, 其特征在于: 当输入分割
特征图时, 首先经过转置卷积运算, 将经过转置卷积运算的特征图与编码器相对应全局特
征提取模块输出 的尺寸相同的特征图进行通道方向的堆叠并降维, 获得解码特征图; 对前
m‑1次操作获得的解码特征图, 上采样 至原始矿物图像大小, 并固定通道数, 获得m ‑1组包含
不同分割信息的待融合特征图; 将第m次操作获得的解码特征图, 作为第m组包含不同分割
信息的待融合特征图; 同时赋予待融合特征图相应的权重, 将待融合特征图根据其对应的
权重在空间方向上进行加权融合; 其中, 输入分割 特征图表示编码器输出 的语义分割 特征
图或者表示 解码特征图。
6.一种基于全局特 征的矿物图像分割装置, 其特 征在于: 包括:
构建模块, 用于构建矿物图像分割模型; 所述矿物图像分割模型包括编码器和解码器;
执行模块, 用于获取待分割训练的原始矿物图像, 输入至训练好的矿物图像分割模型,
输出矿物分割图像。
7.一种处理器, 其特征在于: 所述处理器用于运行程序, 其中, 所述程序运行时执行权
利要求1至 5中任意一项所述的基于全局特 征的矿物图像分割方法。
8.一种计算机可读存储介质, 其特征在于: 所述计算机可读存储介质包括存储的程序,
在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至5中任意一项
所述的基于全局特 征的矿物图像分割方法。权 利 要 求 书 1/1 页
2
CN 114565625 A
2一种基于全局特征的矿物图像分割方 法及装置
技术领域
[0001]本发明涉及一种基于全局特 征的矿物图像分割方法及装置, 涉及矿业加工领域。
背景技术
[0002]在地质学研究和矿业加工领域中, 混合矿物的矿物组分含量测定具有重要意义,
其不仅关乎样品某些物理性质的数值计算, 同时也为资源勘探、 矿物加工提供参数。 随着深
度学习的兴起, 不少研究人员开始 运用卷积神经网络(CNN)对各类矿物图像进 行语义分割,
获取样本中的矿物含量。 然而CNN有限的感受野限制了全局矿物特征的提取, 导致在 存在较
多小颗粒及颗粒粘连的情况下分割效果不佳, 影响后续一系列研究或加工操作。 因此, 如何
更为准确、 有效地提取矿物特征, 并将其特征充分运用于矿物分割中, 对于获取矿物组分含
量、 促进矿物加工研究具有重要的现实意 义。
发明内容
[0003]本发明提供了一种基于全局特征的矿物图像分割方法及装置, 以用于矿物图像分
割。
[0004]本发明的技 术方案是: 一种基于全局特 征的矿物图像分割方法, 包括:
[0005]构建矿物图像分割模型; 所述矿物图像分割模型包括编码器和解码器;
[0006]获取待分割训练的原始矿物图像, 输入至训练好的矿物图像分割模型, 输出矿物
分割图像。
[0007]所述编码器由m个全局特征提取模块和下采样层交替构成; 其中, 全局特征提取模
块包括卷积层和Transformer层, m≥2。
[0008]当输入图像或者输入特征图时, 首先由卷积层和Transformer层进行并行地特征
提取, 将提取的特征图于通道方向进行连接, 接着对连接后的特征图采用1 ×1卷积核进行
通道方向降维处理; 将输入图像或输入特征图通过残差连接策略连接至降维处理后的输出
特征图进 行空间方向上的特征相加; 使用大小为2 ×2、 步长为2的最大池化层 对特征相加 后
的输出特征图进行下采样操作; 其中, 输入图像表示首次输入全局特征提取模块时的图像,
即原始矿物图像; 输入特征图为非首次输入全局特征提取模块时的图像, 即上一次执行下
采样操作后的输出 特征图。
[0009]所述解码器包括m个转置卷积层。
[0010]当输入分割特征 图时, 首先经过转置卷积运算, 将经过转置卷积运算的特征 图与
编码器相对应全局特征提取模块输出的尺寸相同的特征图进 行通道方向的堆叠并降维, 获
得解码特征图; 对前m ‑1次操作获得的解码特征图, 上采样至原始矿物图像大小, 并固定通
道数, 获得m ‑1组包含不同分割信息的待融合特征图; 将第m次操作获得的解码特征图, 作为
第m组包含不同分割信息的待融合特征图; 同时赋予待融合特征图相应的权重, 将待融合特
征图根据其对应的权重在空间方向上进行加权融合; 其中, 输入分割 特征图表示编码器输
出的语义分割特 征图或者表示 解码特征图。说 明 书 1/5 页
3
CN 114565625 A
3
专利 一种基于全局特征的矿物图像分割方法及装置
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 01:16:08上传分享