水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211276843.5 (22)申请日 2022.10.19 (71)申请人 成都数之联科技股份有限公司 地址 610000 四川省成 都市武侯区锦绣 街8 号2层270号 (72)发明人 不公告发明人   (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) G06Q 10/06(2012.01) G06Q 50/04(2012.01) (54)发明名称 一种车辆直通率影响特征确定方法、 装置、 设备及介质 (57)摘要 本申请公开了一种车辆直通率影响特征确 定方法、 训练方法、 装置、 设备及介质, 旨在解决 汽车直通率影 响因素分析过程中, 车辆首次下线 检测未通过, 但重启检测通过的原因分析困难的 问题, 涉及车辆检测数据分析领域。 所述车辆直 通率影像特征确定方法, 包括以下步骤: 对下线 检测不通过的车辆检测数据进行预处理; 基于所 述预处理的数据构建并训练机器学习分类模型; 基于所述机器学习分类模型计算所述预处理的 数据中特征的SHAP值; 对若干SHAP值通过预设的 处理方式进行筛选, 基于筛选结果优化车辆的检 测过程。 权利要求书3页 说明书7页 附图1页 CN 115358348 A 2022.11.18 CN 115358348 A 1.一种车辆直 通率影响特 征确定方法, 包括以下步骤: 对下线检测不 通过的车辆检测数据进行 预处理; 基于所述预处 理的数据构建并训练机器学习分类模型; 基于所述机器学习分类模型计算所述预处 理的数据中特 征的SHAP值; 对若干SHAP值 通过预设的处 理方式进行筛 选, 基于筛选结果优化车辆的检测过程。 2.如权利要求1所述的车辆直通率影响特征确定方法, 其特征在于, 所述预处理过程包 括标记所述车辆检测数据。 3.如权利要求1所述的车辆直通率影响特征确定方法, 其特征在于, 所述机器学习分类 模型训练过程包括: 将所述车辆检测数据集划分为训练数据集和验证数据集, 所述训练数据集用于训练所 述机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型是否达到可用标 准。 4.如权利要求1所述的车辆直 通率影响特 征确定方法, 其特 征在于: 所述SHAP值进行筛选过程包括: 将所述筛选后的SHAP值排序, 根据所述排序结果筛选 符合条件的SHAP值, 其对应的特 征为可用于优化车辆检测过程的特 征。 5.如权利要求2所述的车辆直 通率影响特 征确定方法, 其特 征在于: 所述的标记所述车辆检测数据过程为: 将所述下线检测不通过但重启测试通过的车辆 检测数据定义为正样本, 将所述下线检测不通过且重启测试仍未通过的数据定义为负样 本。 6.如权利要求2所述的车辆直通率影响特征确定方法, 其特征在于, 所述预处理过程包 括对所述车辆检测数据进行o ne‑hot编码。 7.如权利要求4所述的车辆直通率影响特征确定方法, 其特征在于, 所述筛选后的SHAP 值排序方式为降序排列。 8.如权利要求 4所述的车辆直 通率影响特 征确定方法, 其特 征在于: 筛选符合条件的SHAP值过程为: 筛选所述排序结果中SHAP值为正且均值排序Top ‑K的 特征及SHAP值 为负且均值 排序Last ‑K的特征。 9.如权利要求8所述的车辆直通率影响特征确定方法, 其特征在于, 所述的SHAP值为正 且均值排序Top ‑K的特征为最容易产生正样本数据的特征, 所述SHAP值为负且均值排序 Last‑K的特征为最容易导致汽车出故障的特 征。 10.一种车辆直 通率影响特 征确定模型训练方法, 其特 征在于, 包括以下步骤: 对下线检测不 通过的车辆检测数据进行 预处理; 构建机器学习分类模型; 基于所述预处 理的数据训练机器学习分类模型。 11.如权利要求10所述的一种车辆直通率影响特征确定模型训练方法, 其特征在于, 所 述训练机器学习分类模型包括: 将所述预处理 的数据划分为训练数据集和验证数据集, 所述训练数据集用于训练所述 机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型 是否达到可用标准。 12.一种车辆直 通率影响特 征确定装置, 其特 征在于, 包括: 数据预处 理模块, 用于对下线检测不 通过的车辆检测数据进行 预处理;权 利 要 求 书 1/3 页 2 CN 115358348 A 2模型训练模块, 用于基于所述预处 理的数据构建并训练机器学习分类模型; 检测过程优化模块, 用于基于所述机器学习分类模型计算所述预处理 的数据中特征的 SHAP值, 对若干SHAP值 通过预设的处 理方式进行筛 选, 基于筛选结果优化车辆的检测过程。 13.如权利要求12所述的车辆直通率影响特征确定装置, 其特征在于, 所述预处理过程 包括标记所述车辆检测数据。 14.如权利要求12所述的车辆直通率影响特征确定装置, 其特征在于, 所述机器学习分 类模型训练过程包括: 将所述车辆检测数据集划分为训练数据集和验证数据集, 所述训练数据集用于训练所 述机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型是否达到可用标 准。 15.如权利要求12所述的车辆直通率影响特征确定装置, 其特征在于, 所述SHAP值进行 筛选过程包括: 将所述筛选后的SHAP值排序, 根据所述排序结果筛选 符合条件的SHAP值, 其 对应的特 征为可用于优化车辆检测过程的特 征。 16.如权利要求12所述的车辆直 通率影响特 征确定装置, 其特 征在于: 所述的标记所述车辆检测数据过程为: 将所述下线检测不通过但重启测试通过的车辆 检测数据定义为正样本, 将所述下线检测不通过且重启测试仍未通过的数据定义为负样 本。 17.如权利要求13所述的车辆直通率影响特征确定装置, 其特征在于, 所述预处理过程 包括对所述车辆检测数据进行o ne‑hot编码。 18.如权利要求15所述的车辆直通率影响特征确定装置, 其特征在于, 所述筛选后的 SHAP值排序方式为降序排列。 19.如权利要求15所述的车辆直 通率影响特 征确定装置, 其特 征在于: 筛选符合条件的SHAP值过程为: 筛选所述排序结果中SHAP值为正且均值排序Top ‑K的 特征及SHAP值 为负且均值 排序Last ‑K的特征。 20.如权利要求19所述的车辆直通率影响特征确定装置, 其特征在于, 所述的SHAP值为 正且均值排序Top ‑K的特征为最容易产生正样本数据的特征, 所述SHAP值为负且均值排序 Last‑K的特征为最容易导致汽车出故障的特 征。 21.一种车辆直 通率影响特 征确定模型训练装置, 其特 征在于, 包括: 数据预处 理模块, 用于对下线检测不 通过的车辆检测数据进行 预处理; 模型构建模块, 用于构建机器学习分类模型; 模型训练模块, 用于基于所述预处 理的数据训练机器学习分类模型。 22.如权利要求21所述的一种车辆直通率影响特征确定模型训练装置, 其特征在于, 所 述训练机器学习分类模型包括: 将所述预处理 的数据划分为训练数据集和验证数据集, 所述训练数据集用于训练所述 机器学习分类模型, 所述验证数据集用于验证所述机器学习分类模型 是否达到可用标准。 23.一种电子设备, 其特征在于, 该电子设备包括存储器和 处理器, 所述存储器中存储 有计算机程序, 所述处理器执行所述计算机程序, 实现如权利要求1 ‑11中任一项所述的方 法。 24.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有计算机权 利 要 求 书 2/3 页 3 CN 115358348 A 3

PDF文档 专利 一种车辆直通率影响特征确定方法、装置、设备及介质

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种车辆直通率影响特征确定方法、装置、设备及介质 第 1 页 专利 一种车辆直通率影响特征确定方法、装置、设备及介质 第 2 页 专利 一种车辆直通率影响特征确定方法、装置、设备及介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:49上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。