水利行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111355498.X (22)申请日 2021.11.16 (71)申请人 深圳市联影高端医疗 装备创新研究 院 地址 518048 广东省深圳市福田区福田保 税区槟榔道3号深九科技创业园B栋8- 13层 (72)发明人 贾乐成 (74)专利代理 机构 北京华进京联知识产权代理 有限公司 1 1606 代理人 吴娜娜 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/82(2022.01) G06K 9/62(2022.01)G06N 3/08(2006.01) G06N 20/00(2019.01) G06T 7/10(2017.01) (54)发明名称 训练样本获取方法、 装置、 计算机设备和可 读存储介质 (57)摘要 本申请涉及一种训练样本获取方法、 装置、 计算机设备和可读存储介质, 该方法通过获取初 始样本集, 根据初始样本集中的标记样本训练得 到目标模型以及鉴别模型; 将初始样本集中的未 标记样本输入目标模型, 得到标注数据; 根据标 注数据和未标记样本确定鉴别模 型的输入参数, 并将输入参数输入鉴别模型, 得到评估分值; 根 据评估分值, 确定是否根据标注数据和未标记样 本更新初始样本集中的标记样 本。 本申请提供的 训练样本获取方法, 对于大量的训练样本的标 注, 无需工作人员进行标注, 可 以减少人力的消 耗, 从而提高获取训练样本的速度。 权利要求书2页 说明书13页 附图3页 CN 114022738 A 2022.02.08 CN 114022738 A 1.一种训练样本获取 方法, 其特 征在于, 包括 获取初始样本集, 根据所述初始样本集中的标记样本训练得到目标模型以及鉴别模 型; 所述鉴别模型用于对所述目标模型进行模型评估; 将所述初始样本集中的未 标记样本 输入所述目标模型, 得到标注数据; 根据所述标注数据和所述未标记样本确定所述鉴别模型的输入参数; 并将所述输入参 数输入所述 鉴别模型, 得到 评估分值; 根据所述评估分值, 确定是否根据 所述标注数据和所述未标记样本更新所述初始样本 集的标记样本 。 2.根据权利要求1所述的训练样本获取方法, 其特征在于, 所述根据所述评估分值, 确 定是否根据所述标注数据和所述未 标记样本更新所述初始样本集的标记样本, 包括: 若所述评估分值大于或等于预设阈值, 则将所述未标注的样本和所述标注数据组成的 样本作为新的标记样本加入所述初始样本集, 所述预设阈值用于表征所述目标模型的输出 结果的准确度。 3.根据权利要求1所述的训练样本获取方法, 其特征在于, 所述根据所述标注数据和所 述未标记样本确定所述 鉴别模型的输入参数, 包括: 将所述未 标记样本和所述标注数据作为所述输入参数; 和/或, 对所述未标记样本和所述标注数据进行特征提取处理, 将提取的特征作为所述 输入参数。 4.根据权利要求3所述的训练样本获取方法, 其特征在于, 所述鉴别模型包括深度 学习 模型和/或机器学习模型。 5.根据权利要求4所述的训练样本获取方法, 其特征在于, 在所述鉴别模型包括深度 学 习模型和机器学习模型时, 所述将所述输入参数输入所述 鉴别模型, 得到 评估分值, 包括: 将所述输入参数分别输入所述深度学习模型和所述机器学习模型; 对所述深度学习 模型的输出和所述机器学习 模型的输出进行求均值处理, 获得所述评 估分值。 6.根据权利要求1所述的训练样本获取 方法, 其特 征在于, 所述方法还 包括: 对多个初始标记样本进行样本评估, 基于评估结果从所述多个初始标记样本中获得所 述标记样本 。 7.根据权利要求6所述的训练样本获取方法, 其特征在于, 所述对多个初始标记样本进 行样本评估, 基于 评估结果从所述多个初始标记样本中获得 所述标记样本, 包括: 对所述多个初始标记样本进行以下筛 选处理: 根据所述多个初始标记样本确定L组样本集, 根据所述L组样本集确定训练集和验证 集, 根据所述训练集和所述验证集对所述目标模型对应的初始模型进 行训练, 得到N组样本 筛选模型; L和N均为大于零的整数; 将所述多个初始标记样本输入所述N组样本筛选模型, 根据 所述N组样本筛选模型的输 出确定所述评估结果, 根据所述评估结果确定所述多个初始标记样本中的异常样本; 根据所述异常样本对所述多个初始标记样本进行更新, 并对更新后的所述多个初始标 记样本执 行所述筛选处理, 直至所述多个初始标记样本中不包 含异常样本 。 8.根据权利要求7所述的训练样本获取方法, 其特征在于, 所述根据所述L组样本集确权 利 要 求 书 1/2 页 2 CN 114022738 A 2定训练集和验证集, 根据所述训练集和所述验证集对所述目标模型对应的初始模型进 行训 练, 得到N组样本 筛选模型, 包括: 遍历所述L组样本集中的每一组样本集, 以所述一组样本集为所述验证集, 以所述L组 样本集中的剩余样本集 为所述训练集; 使用所述训练集对所述初始模型进行训练, 得到训练结果, 并使用所述验证集对训练 后的初始模型进行验证, 得到验证结果; 根据所述训练结果、 所述验证结果以及预设约束条件, 确定所述一组样本集对应的样 本筛选模型; 根据所述L组样本集中的每一组样本集对应的样本筛选模型确定所述N组样本筛选模 型。 9.根据权利要求1所述的训练样本获取 方法, 其特 征在于, 所述方法还 包括: 接收对所述标注数据的主观评估分值和对所述标注数据的修改结果; 所述主观评估分 值用于表征对所述标注数据的主观评估; 若所述主观评估分值小于所述评估分值, 则根据所述修改结果、 所述未标记样本和所 述主观评估分值对所述目标模型和所述 鉴别模型进行训练。 10.一种训练样本获取装置, 其特 征在于, 包括: 获取模块, 用于获取初始样本集, 根据所述初始样本集中的标记样本训练得到目标模 型以及鉴别模型; 所述 鉴别模型用于对所述目标模型进行模型评估; 第一确定模块, 用于将所述初始样本集中的未标记样本输入所述目标模型, 得到标注 数据; 第二确定模块, 用于根据所述标注数据和所述未标记样本确定所述鉴别模型的输入参 数; 并将所述输入参数输入所述 鉴别模型, 得到 评估分值; 第三确定模块, 用于根据所述评估分值, 确定是否根据所述标注数据和所述未标记样 本更新所述初始样本集的标记样本 。 11.一种计算机设备, 包括存储器和 处理器, 所述存储器存储有计算机程序, 其特征在 于, 所述处 理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。 12.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述计算机程序 被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。权 利 要 求 书 2/2 页 3 CN 114022738 A 3
专利 训练样本获取方法、装置、计算机设备和可读存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 人生无常 于
2024-03-18 19:03:44
上传分享
举报
下载
原文档
(843.3 KB)
分享
友情链接
中华人民共和国密码法 2020.pdf
中国银保监会办公厅关于印发银行保险机构信息科技外包风险监管办法的通知.pdf
GM-T 0061-2018 动态口令密码应用检测规范.pdf
DB31-T 1244-2020 冷却塔节能降噪改造技术指南 上海市.pdf
T-GDPIA 12—2020 数字化工厂 改性塑料制造 数据字典.pdf
T-CHTS 10034—2021 沥青路面施工质量信息动态管理技术指南.pdf
奇安信 中国首席安全官研究报告.pdf
NY-T 3850-2021 设施果菜秸秆原位还田技术规程.pdf
GB-T 10002.2-2023 给水用硬聚氯乙烯 PVC-U 管件.pdf
GB-T 34885-2017 无损检测 电磁超声检测 总则.pdf
GB-T 31402-2023 塑料和其他无孔材料表面抗菌活性的测定.pdf
GB-T 19964-2024 光伏发电站接入电力系统技术规定.pdf
DB11-T 348-2022 建筑中水运行管理规范 北京市.pdf
T-STSI 43—2023 人工智能算力资源池技术规范.pdf
GB-T 36629.1-2018 信息安全技术 公民网络电子身份标识安全技术要求 第1部分:读写机具安全技术要求.pdf
GB-T 34224-2017 生物产品中功能性微生物检测.pdf
商业银行信息科技风险管理指引.pdf
T-NKFA 010—2022 家具企业生产质量管理规范.pdf
DB37-T 4550—2022 智慧城市网络安全建设和评估指南 山东省.pdf
GB-T 38556-2020 信息安全技术 动态口令密码应用技术规范.pdf
1
/
3
19
评价文档
赞助2元 点击下载(843.3 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。