水利行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111269562.2 (22)申请日 2021.10.2 9 (71)申请人 上海商汤科技 开发有限公司 地址 201306 上海市浦东 新区中国 (上海) 自由贸易试验区临港新片区环湖西二 路888号C楼 (72)发明人 李楚鸣 刘宇 王晓刚  (74)专利代理 机构 北京中知恒瑞知识产权代理 事务所(普通 合伙) 11889 代理人 袁忠林 (51)Int.Cl. G06N 20/00(2019.01) G06V 10/774(2022.01) G06V 10/764(2022.01) G06K 9/62(2022.01) (54)发明名称 采样优化方法、 装置、 电子设备及存 储介质 (57)摘要 本公开提供了一种采样优化方法、 装置、 设 备及存储介质, 该采样优化方法包括: 获取训练 样本数据集, 所述训练样本数据集包括具有 标签 的图像样本; 对所述训练样本数据集进行初始采 样, 基于采样结果对目标模型进行训练, 得到预 训练的目标模 型, 并基于所述预训练的目标模型 确定每个图像样本的特征; 基于所述每个图像样 本的特征构建概率函数; 基于所述概率函数以及 所述预训练的目标模型, 确定所述每个图像样本 的目标采样概率。 本申请实施例, 可以对不同场 景的目标模 型的训练样本的采样概率进行优化, 进而可以提升模型的训练效率及模型性能。 权利要求书2页 说明书11页 附图3页 CN 114004364 A 2022.02.01 CN 114004364 A 1.一种采样优化方法, 其特 征在于, 包括: 获取训练样本数据集, 所述训练样本数据集包括具有标签的图像样本; 对所述训练样本数据集进行初始采样, 基于采样结果对目标模型进行训练, 得到预训 练的目标模型, 并基于所述预训练的目标模型确定每 个图像样本的特 征; 基于所述每 个图像样本的特 征构建概 率函数; 基于所述概率函数以及所述预训练 的目标模型, 确定所述每个图像样本的目标采样概 率。 2.根据权利要求1所述的方法, 其特征在于, 所述概率函数包含超参数, 所述基于所述 概率函数以及所述预训练的目标模型, 确定所述每 个图像样本的目标采样概 率, 包括: 通过贝叶斯优化对所述概率函数进行超参数随机搜索, 确定初优化超参数, 并基于所 述初优化超参数 得到所述每 个图像样本的初优化的采样概 率; 基于所述每个图像样本的初优化的采样概率, 对所述训练样本数据集进行采样, 基于 采样结果对所述预训练的目标模型进行微训练, 得到微训练结果; 所述微训练是指训练迭 代次数少于预设的总训练次数的训练; 基于所述微训练结果以及所述总的训练次数, 确定所述每个图像样本的目标采样概 率。 3.根据权利要求2所述的方法, 其特征在于, 所述基于所述微训练结果以及所述总的训 练次数, 确定所述每 个图像样本的目标采样概 率, 包括: 基于所述微训练结果, 通过贝叶斯优化对所述概率函数进行超参数搜索, 得到次优化 超参数, 并基于所述次优化 参数得到所述每 个图像样本的次优化的采样概 率; 基于所述每个图像样本的次优化的采样概率, 对所述训练样本数据集进行采样, 基于 采样结果对所述预训练的目标模型进行 所述微训练, 得到微训练结果; 重复上述步骤, 直到各个微训练的次数总和大于或等于所述预设的总的训练次数, 根 据每次微训练得到的微训练结果, 确定所述每 个图像样本的目标采样概 率。 4.根据权利要求3所述的方法, 其特征在于, 所述根据每次微训练得到的微训练结果, 确定所述每 个图像样本的目标采样概 率, 包括: 将各个微训练结果中微训练结果最好所对应的每个图像样本的采样概率, 确定为所述 每个图像样本的目标采样概 率。 5.根据权利要求1至4任一项所述的方法, 其特征在于, 所述对所述训练样本数据集进 行初始采样, 包括: 以相同的采样概 率对所述训练样本数据集进行 所述初始采样。 6.根据权利要求1至5任一项所述的方法, 其特征在于, 所述每个图像样本的特征包括 所述每个图像样本的损失函数值和/或所述每 个图像样本的密度值。 7.根据权利要求1至4任一项所述的方法, 其特征在于, 所述概率函数包括分段线性函 数及所述每个图像样本的各个特征的线性加权函数, 所述概率函数中的超参数包括所述每 个图像样本的各个特征的权重系数及所述分段线性函数的分段端点和所述分段端点处的 函数值。 8.根据权利要求1 ‑7任一所述的方法, 其特 征在于, 还 包括: 以所述每个图像样本的目标采样概率对所述训练样本数据集进行采样, 基于采样结果权 利 要 求 书 1/2 页 2 CN 114004364 A 2对所述目标模型进行训练, 得到训练好的目标模型。 9.一种采样优化装置, 其特 征在于, 所述装置包括: 样本获取模块, 用于获取训练样本数据集, 所述训练样本数据集包括具有标签的图像 样本; 模型训练模块, 用于对所述训练样本数据集进行初始采样, 基于采样结果对目标模型 进行训练, 得到预训练的目标模型, 并基于所述预训练的目标模型确定每个图像样本的特 征; 函数构建模块, 用于基于所述每 个图像样本的特 征构建概 率函数; 概率优化模块, 用于基于所述概率函数以及所述预训练的目标模型, 确定所述每个图 像样本的目标采样概 率。 10.一种电子设备, 其特征在于, 包括: 处理器、 存储器和总线, 所述存储器存储有所述 处理器可执行 的机器可读指令, 当电子设备运行时, 所述处理器与所述存储器之间通过总 线通信, 所述机器可读指令被所述处理器执行时执行如权利要求1 ‑8任一所述的采样优化 方法的。 11.一种计算机可读存储介质, 其特征在于, 该计算机可读存储介质上存储有计算机程 序, 该计算机程序被处 理器运行时执 行如权利要求1 ‑8任一所述的采样优化方法。权 利 要 求 书 2/2 页 3 CN 114004364 A 3

.PDF文档 专利 采样优化方法、装置、电子设备及存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 采样优化方法、装置、电子设备及存储介质 第 1 页 专利 采样优化方法、装置、电子设备及存储介质 第 2 页 专利 采样优化方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:03:53上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。