水利行业标准网
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211261286.X (22)申请日 2022.10.14 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 毛丽雯 卢成业 南方 (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 张思淼 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 10/10(2012.01) G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 一种用于员工离职倾向预测的模型训练方 法及装置 (57)摘要 本申请公开一种用于员工离职倾向预测的 模型训练方法, 包括: 将员工数据样本进行预处 理得到不完整数据样本, 并将不完整数据样本进 行预填补后加入到模型训练的过程中, 有效提高 了员工数据样本的利用率, 将填补数据作为变 量, 在模型训练的过程中动态更新, 通过计算代 价函数更新模 型的参数, 逐渐降低了预填补带来 的估计误差, 实现了对与不完整数据样本中缺失 数据的填补, 得到的预测模型不仅能够预测离职 倾向率, 当输入模型的员工基本信息不完整时, 还可以获得完整的员工数据, 使用完整的员工数 据进行预测, 提高了员工 离职预测的准确率。 权利要求书2页 说明书9页 附图5页 CN 115511199 A 2022.12.23 CN 115511199 A 1.一种用于员工 离职倾向预测的模型训练方法, 其特 征在于, 所述方法包括: 对员工数据样本进行预处理, 得到不完整数据样本; 其中, 所述不完整数据样本 中的员 工数据缺失挽留难度和至少一项员工基本信息; 对所述不完整数据样本中的缺失数据进行预填补, 得到输入数据样本, 并在所述输入 数据样本中标记填补数据的位置; 将所述输入数据样本输入模型训练, 对所述填补数据进行更新得到预测数据样本, 并 根据所述预测数据样本计算离职倾向率; 根据代价函数对所述模型进行优化; 其中, 所述代价函数是由所述员工数据样本和所 述预测数据样本计算得到的; 将第m次训练得到的预测数据样本作为第m+1次训练的输入数据样本, 输入所述模型进 行训练, 直至训练次数达到阈值n时, 将第n次训练后的模型保存为预测模型; 其中, 所述预 测模型通过对所述填补数据的更新获得完整员工数据, 并根据所述完整员工数据预测所述 离职倾向率。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述不完整数据样本 中的缺失数据 进行预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置包括: 将所述不完整数据样本按照4:1的比例划分为训练集和测试集, 对所述训练集中的缺 失数据进行 预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置 。 3.根据权利要求2所述的方法, 其特征在于, 在所述直至训练次数达到阈值n时, 将第n 次训练后的模型保存为预测模型之后进一 步包括: 对所述测试集中的缺失数据进行 预填补, 得到测试 数据样本; 将所述测试 数据样本 输入所述预测模型, 得到所述预测数据样本和所述离职倾向率; 根据所述挽留难度与挽留因素之间的对应关系, 将所述预测数据样本中的挽留难度转 换为所述挽留因素; 其中, 所述挽留因素与所述挽留难度一 一对应; 将所述挽留因素和所述离职倾向率可视化输出, 以便企业及时采取相对应的措施。 4.根据权利要求1所述的方法, 其特征在于, 在所述对员工数据样本进行预处理, 得到 不完整数据样本之前进一 步包括: 收集员工数据, 生成初始数据样本; 对所述初始数据样本进行数据清洗, 删除与预测员工离职无关的信息, 并对字符串型 数据进行数值化处理, 对离散型数据进 行二值化处理, 对连续性数据进 行归一化处理, 得到 所述员工数据样本 。 5.根据权利要求1所述的方法, 其特征在于, 所述对员工数据样本进行预处理, 得到不 完整数据样本包括: 删除员工数据样本 中的每条员工数据的挽留难度, 并在每条员工数据中随机删除至少 一项员工基本信息, 得到不完整数据样本 。 6.一种用于员工 离职倾向预测的模型训练装置, 其特 征在于, 所述装置包括: 数据预处理单元, 用于: 对员工数据样本进行预处理, 得到不完整数据样本; 其中, 所述 不完整数据样本中的员工数据缺失挽留难度和至少一项员工基本信息; 数据预填补单元, 用于: 对所述不完整数据样本中的缺失数据进行预填补, 得到输入数 据样本, 并在所述输入数据样本中标记填补数据的位置;权 利 要 求 书 1/2 页 2 CN 115511199 A 2模型训练单元, 用于: 将所述输入数据样本输入模型训练, 对所述填补数据进行更新得 到预测数据样本, 并根据所述预测数据样本计算离职倾向率; 模型优化单元, 用于: 根据代价函数对所述模型进行优化; 其中, 所述代价函数是由所 述员工数据样本和所述预测数据样本计算得到的; 所述模型训练单元还用于: 将第m次训练得到的预测数据样本作为第m+1次训练的输入 数据样本, 输入所述模型进 行训练, 直至训练 次数达到阈值n时, 将第n次训练后的模型保存 为预测模 型; 其中, 所述预测模 型通过对所述填补数据的更新获得完整员工数据, 并根据所 述完整员工数据预测所述离职倾向率。 7.根据权利要求6所述的装置, 其特 征在于, 所述数据预填补单 元还用于: 将所述不完整数据样本按照4:1的比例划分为训练集和测试集, 对所述训练集中的缺 失数据进行 预填补, 得到 输入数据样本, 并在所述输入数据样本中标记填补数据的位置 。 8.根据权利要求7 所述的装置, 其特 征在于, 所述装置进一 步包括: 模型测试 单元, 用于: 对所述测试集中的缺失数据进行 预填补, 得到测试 数据样本; 所述模型测试单元还用于: 将所述测试数据样本输入所述预测模型, 得到所述预测数 据样本和所述离职倾向率; 所述模型测试单元还用于: 根据所述挽留难度与挽留因素之间的对应关系, 将所述预 测数据样本中的挽留难度转换为所述挽留因素; 其中, 所述挽留因素与所述挽留难度一一 对应; 所述模型测试单元还用于: 将所述挽留因素和所述离职倾向率可视化输出, 以便企业 及时采取相对应的措施。 9.根据权利要求6所述的装置, 其特 征在于, 所述装置进一 步包括: 数据清洗单 元, 用于: 收集员工数据, 生成初始数据样本; 所述数据清洗单元还用于: 对所述初始数据样本进行数据清洗, 删除与预测员工离职 无关的信息, 并对字符串 型数据进行数值化处理, 对离散型数据进 行二值化处理, 对连续性 数据进行归一 化处理, 得到所述员工数据样本 。 10.根据权利要求6所述的装置, 其特 征在于, 所述数据预处 理单元还用于: 删除员工数据样本 中的每条员工数据的挽留难度, 并在每条员工数据中随机删除至少 一项员工基本信息, 得到不完整数据样本 。权 利 要 求 书 2/2 页 3 CN 115511199 A 3
专利 一种用于员工离职倾向预测的模型训练方法及装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2024-02-18 22:24:35
上传分享
举报
下载
原文档
(826.1 KB)
分享
友情链接
T-CI 072—2023 绿色低碳乡村建设及评价技术指南.pdf
创业黑马 aigc安全研究报告新版.pdf
GB-T 22071.1-2018 互感器试验导则 第1部分:电流互感器.pdf
DB13-T 2957-2019 工业计量与控制数字化应用规范 河北省.pdf
YD-T 3763.8-2021 研发运营一体化(DevOps)能力成熟度模型 第8部分:系统和工具技术要求.pdf
GB-T 35290-2017 信息安全技术 射频识别(RFID)系统通用安全技术要求.pdf
GB-T 32124-2015 磷石膏的处理处置规范.pdf
GB-T 20909-2017 钢门窗.pdf
NB-T 10639—2021 风电场工程场址选择技术规范.pdf
GB-T 6614-2014 钛及钛合金铸件.pdf
MH-T 1020-2018 锂电池航空运输规范.pdf
20230129-中信建投-人工智能行业从CHAT_GPT到生成式AI(Generative AI):人工智能新范式,重新定义生产力.pdf
DB3708-T 10-2022 公共机构节能监管平台建设指南 济宁市.pdf
野村深度报告 日本疫情后的消费复苏情况 2022.pdf
信通院 移动互联网应用程序-APP个人信息保护治理白皮书.pdf
炼石图解-网络数据安全风险评估实施指引V1.0.pdf
GB-T 36972-2018 电动自行车用锂离子蓄电池.pdf
GB-T 18921-2019 城市污水再生利用 景观环境用水水质.pdf
GB-T 3730.1-2022 汽车、挂车及汽车列车的术语和定义 第1部分:类型.pdf
GB-T 9254.1-2021 信息技术设备、多媒体设备和接收机 电磁兼容 第1部分:发射要求.pdf
1
/
17
评价文档
赞助2.5元 点击下载(826.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。