水利行业标准网
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111287497.6 (22)申请日 2021.11.02 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 王赟豪 陈少华 余亭浩 张绍明  侯昊迪  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 代理人 熊永强 贾允 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 用于媒体内容识别的模型训练方法及媒体 内容识别方法 (57)摘要 本申请公开了一种用于媒体内容识别的模 型训练方法及媒体内容识别方法。 该方法包括: 获取媒体内容样本集合以及 多维度特征集合; 在 对待训练决策树进行训练时, 基于媒体内容样本 集合确定训练样本集合, 以及基于多维度特征集 合确定训练特征集合; 基于训练样 本集合和训练 特征集合确定满足预设分裂要求的最优分裂规 则, 以及基于最优分裂规则训练待训练决策树以 得到第一决策树; 重复上述确定训练样本集合至 得到第一决策树的步骤, 以及基于多棵第一决策 树构建至少两个随机森 林以得到决策模型。 本申 请在判断媒体内容是否属于异常分类内容的场 景上, 构建包括随机森林的决策模型以进行识 别, 提高了对于对应多维度特征的媒体内容的识 别能力。 权利要求书3页 说明书15页 附图6页 CN 114330476 A 2022.04.12 CN 114330476 A 1.一种用于媒体内容识别的模型训练方法, 其特 征在于, 所述方法包括: 获取媒体内容样本集合以及多维度特征集合; 其中, 所述多维度特征集合是基于所述 媒体内容样本集合中每个媒体内容样本对应的多维度特征构建的, 所述媒体内容样本携带 有是否属于异常 分类内容的标签; 在对待训练决策树进行训练时, 基于所述媒体内容样本集合确定参与训练的训练样本 集合, 以及基于所述多维度特 征集合确定参与训练的训练特 征集合; 基于所述训练样本集合和所述训练特征集合确定满足预设分裂要求的最优分裂规则, 以及基于所述 最优分裂规则训练所述待训练决策树以得到第一决策树; 重复上述确定参与训练 的训练样本集合至得到第 一决策树的步骤, 以及基于多棵所述 第一决策树构建至少两个随机森林以得到决策模型。 2.根据权利要求1所述的方法, 其特 征在于: 所述预设分裂要求包括预设分裂评价参数和预设分裂结束条件, 所述预设分裂评价参 数包括以下至少一个: 信息增益和基尼系数; 所述基于所述训练样本集合和所述训练特征集合确定满足预设分裂要求的最优分裂 规则, 以及基于所述 最优分裂规则训练所述待训练决策树, 包括: 从所述训练特征集合中选取指示当前局部最优分裂的训练特征, 以及基于所选取的训 练特征生成局部最优分裂规则; 其中, 所述当前局部最优分裂是基于所述训练样本集合和 所述预设 分裂评价 参数确定的; 建立所述局部最优分裂规则与当前 决策节点的关联关系, 以引导所述当前 决策节点进 行特征分裂; 其中, 所述当前决策节点是所述待训练决策树中上一个进行特征分裂的决策 节点的子节点或同层级节点; 重复上述选取指示当前局部最优分裂的训练特征至引导所述当前决策节点进行特征 分裂的步骤, 直至满足所述预设 分裂结束条件以实现训练所述待训练决策树。 3.根据权利要求1或2所述的方法, 其特征在于, 所述基于多棵所述第一决策树构建至 少两个随机森林以得到决策模型, 包括: 基于多棵 所述第一决策树构建多个第一随机森林; 基于所述多个第一随机森林构建首层分类结构; 在对非首层 分类结构进行构建时, 基于利用上一层 分类结构针对目标训练样本集合的 输出结果以及相关联的输入特征确定目标分裂规则, 以及基于所述目标分裂规则训练得到 用于构建相邻下一层分类结构的第二决策树; 其中, 所述 目标训练样本集合是基于所述媒 体内容样本集合确定的, 所述相 邻下一层分类结构是基于由多棵所述第二决策树构建的多 个第二随机森林构建的; 融合所述首层分类结构以及至少一个所述非首层分类结构得到所述决策模型。 4.一种媒体内容识别方法, 其特 征在于, 所述方法包括: 获取待处 理媒体内容; 确定所述待处 理媒体内容对应的多维度特 征; 以所述多维度特征为输入, 利用如权利要求1至3 中任一项所述的决策模型得到所述待 处理媒体内容的识别结果; 其中, 所述识别结果指示所述待处理媒体内容与异常分类内容 的关系。权 利 要 求 书 1/3 页 2 CN 114330476 A 25.根据权利要求4所述的方法, 其特征在于, 所述得到所述待处理媒体 内容的识别结果 的过程包括下述 步骤: 分别利用所述决策模型中的至少两个随机森林对所述多维度特 征进行预测; 基于每个所述随机森林的预测结果生成所述待处理媒体内容的识别结果; 其中, 所述 预测结果是基于所述随机森林中各个决策树的分类结果所确定的, 所述分类结果是基于所 述多维度特征、 以所述决策树的根节点为起点开始访问直至到达对应的叶子节点所确定 的。 6.根据权利要求4所述的方法, 其特征在于, 所述得到所述待处理媒体 内容的识别结果 的过程包括下述 步骤: 利用所述决策模型中的至少两层分类结构逐层处理所述多维度特征得到所述待处理 媒体内容的识别结果; 其中, 下一层分类结构的输入是 由相邻上一层分类结构的输出和输 入所确定的, 每层所述分类结构的输出是基于其中各个随机森林 的预测结果所确定的, 所 述预测结果是基于所述随机森林中各个决策树的分类结果所确定的, 所述分类结果是基于 所述多维度特征、 以所述决策树的根节点为起点开始访问直至到达对应的叶子节点所确定 的。 7.根据权利要求 4所述的方法, 其特 征在于, 所述方法还 包括: 当所述待处理媒体内容属于异常分类内容时, 对所述待处理媒体内容进行异常标记; 其中, 所述异常标记用于指示降低所述待处理媒体内容的推荐用权重或者排除所述待处理 媒体内容用作候选 封面。 8.根据权利要求4所述的方法, 其特征在于, 所述确定所述待处理媒体 内容对应的多维 度特征, 包括: 利用预设的图像特征提取模型所述待处理媒体内容对应的图像类特征; 其中, 所述预 设的图像特 征提取模型 是以迁移模型作为初始模型进行训练得到的; 利用预设的文本特征提取所述待处理媒体内容对应的文本类特征; 其中, 所述预设的 文本特征提取模型 是以基于变换器的双向编码表示模型作为初始模型进行训练得到的; 基于所述图像 类特征和所述文本类特 征得到所述多维度特 征。 9.一种用于媒体内容识别的模型训练装置, 其特 征在于, 所述装置包括: 集合获取模块: 用于获取媒体 内容样本集合以及多维度特征集合; 其中, 所述多维度 特 征集合是基于所述媒体内容样本集合中每个媒体内容样本对应的多维度特征构建的, 所述 媒体内容样本携带有是否属于异常 分类内容的标签; 集合确定模块: 用于在对待训练决策树进行训练时, 基于所述媒体内容样本集合确定 参与训练的训练样本集 合, 以及基于所述多维度特 征集合确定参与训练的训练特 征集合; 决策树构建模块: 用于基于所述训练样本集合和所述训练特征集合确定满足预设分裂 要求的最优分裂规则, 以及基于所述最优分裂规则训练所述待训练决策树以得到第一决策 树; 决策模型构建模块: 用于重复上述确定参与训练 的训练样本集合至得到第 一决策树的 步骤, 以及基于多棵 所述第一决策树构建至少两个随机森林以得到决策模型。 10.一种媒体内容识别装置, 其特 征在于, 所述装置包括: 媒体内容获取模块: 用于获取待处 理媒体内容;权 利 要 求 书 2/3 页 3 CN 114330476 A 3

.PDF文档 专利 用于媒体内容识别的模型训练方法及媒体内容识别方法

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 用于媒体内容识别的模型训练方法及媒体内容识别方法 第 1 页 专利 用于媒体内容识别的模型训练方法及媒体内容识别方法 第 2 页 专利 用于媒体内容识别的模型训练方法及媒体内容识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:03:11上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。