水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211271947.7 (22)申请日 2022.10.18 (71)申请人 中国银行股份有限公司 地址 100818 北京市西城区复兴门内大街1 号 (72)发明人 刘京 李亚雄 马小菲 刘航  (74)专利代理 机构 北京三友知识产权代理有限 公司 11127 专利代理师 王曦 张祥意 (51)Int.Cl. G06K 9/62(2022.01) G06N 20/00(2019.01) G06Q 40/02(2012.01) (54)发明名称 基于KNN算法的用户分类方法及装置 (57)摘要 本发明提供了一种基于KNN算法的用户分类 方法及装置, 对应的方法包括: 接收用户的个人 信息; 根据所述个人信息以及预先建立的KNN用 户分类模型对多个用户进行分类, 所述KNN用户 分类模型是基于KNN算法所生成的。 本发明采用 的KNN分类算法简单易用, 模型训练时间快, 其 建 立的模型结构完全是根据数据来决定的, 符合现 实情况, 比较适用于样本容量较大的分类情况, 对异常值不敏感, 因此对于银行贷款数据分类的 适用性很高, 并且KNN分类算法具有很好的预测 效果, 对于贷款违约风险的预测把控 可以提供较 为可信的参 考。 权利要求书1页 说明书9页 附图5页 CN 115545113 A 2022.12.30 CN 115545113 A 1.一种基于KN N算法的用户分类方法, 其特 征在于, 包括: 接收用户的个人信息; 根据所述个人信息以及预先建立的KNN用户分类模型对多个用户进行分类, 所述KNN用 户分类模型 是基于KN N算法所生成的。 2.如权利 要求1所述的基于KNN算法的用户分类方法, 其特征在于, 建立所述KNN用户分 类模型的方法包括: 利用Python机器学习sklearn库中的KNeighborsClassifier函数, 基于前期收集到的 客户数据建立所述KN N用户分类模型的初始模型; 通过skle arn库中的fit(X_train,y_train)函数训练所述初始模型, 以生成所述KNN用 户分类模型。 3.如权利要求1所述的基于KN N算法的用户分类方法, 其特 征在于, 还 包括: 利用rain_test_spl it函数来将数据集随机划分为训练集以及测试集。 4.如权利要求3所述的基于KN N算法的用户分类方法, 其特 征在于, 还 包括: 对所述个人信息进行 预处理; 对所述训练集进行归一 化处理。 5.一种基于KN N算法的用户分类装置, 其特 征在于, 包括: 个人信息 接收模块, 用于 接收用户的个人信息; 用户分类模块, 用于根据所述个人信息以及预先建立的KNN用户分类模型对多个用户 进行分类, 所述KN N用户分类模型 是基于KN N算法所生成的。 6.如权利要求5所述的基于KNN算法的用户分类装置, 其特征在于, 还包括: 分类模型建 立模块, 用于建立所述KN N用户分类模型, 所述分类模型建立模块包括: 初始模型建立模块, 用于利用Python机器学习sklearn库中的KNeighborsClassifier 函数, 基于前期收集到的客户数据建立所述KN N用户分类模型的初始模型; 分类模型建立单元, 用于通过sklearn库中的fit(X_train,y_train)函数训练所述初 始模型, 以生成所述KN N用户分类模型。 7.如权利要求5所述的基于KN N算法的用户分类装置, 其特 征在于, 还 包括: 数据集划分模块, 用于利用Python中机器学习库sklearn.model_selection中的 train_test_spl it函数来将数据集随机划分为训练集以及测试集。 8.如权利要求7 所述的基于KN N算法的用户分类装置, 其特 征在于, 还 包括: 信息预处 理模块, 用于对所述个人信息进行 预处理; 训练集归一 化模块, 用于对所述训练集进行归一 化处理。 9.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 该计算机程序/指令被处 理器执行时实现权利要求1至4任一项所述的基于KN N算法的用户分类方法的步骤。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至4任一项所述一种基于 KNN算法的用户分类方法的步骤。 11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被 处理器执行时实现权利要求1至4任一项所述的基于KN N算法的用户分类方法的步骤。权 利 要 求 书 1/1 页 2 CN 115545113 A 2基于KNN算法的用户分类方 法及装置 技术领域 [0001]本申请属于计算机数据处理技术领域, 具体涉及一种基于KNN算法的用户分类方 法及装置 。 背景技术 [0002]在现有技术中, 随着市场需求的日益增多, 银行业的贷款业务数量不断上升。 出于 经济效益最大化和信用风险规避的双重考量, 银行有必 要对涉及贷款业务客户的贷款状态 进行准确分类, 并在此基础上实现较为准确的分类预测, 从而有助于银行把控客户信贷违 约风险, 有效规避损失, 达 到对商业银 行的贷款 风险控制的要求。 发明内容 [0003]本发明可用于计算机数据处理技术在金融方面应用的技术领域, 也可用于除金 融 领域之外的任意领域, 本发明所提供的基于KNN算法 的用户分类方法及装置, 采用的KNN分 类算法与SVM支持向量机算法相比具有 更低的训练 时间复杂度, 对数据的分布没有假设, 分 类准确度高且对异常点不敏感, 比较适用于样本容量较大的分类情况, KNN模型仅涉及一个 参数K的取值选择, 在应用中通常可以通过交叉验证法来选择最优的K值。 [0004]为解决上述 技术问题, 本发明提供以下技 术方案: [0005]第一方面, 本发明提供一种基于KN N算法的用户分类方法包括: [0006]接收用户的个人信息; [0007]根据所述个人信息以及预先建立的KNN用户分类模型对多个用户进行分类, 所述 KNN用户分类模型 是基于KN N算法所生成的。 [0008]一实施例中, 建立所述KN N用户分类模型的方法包括: [0009]利用Python机器学习sklearn库中的KNeighborsClassifier函数, 基于前期收集 到的客户数据建立所述KN N用户分类模型的初始模型; [0010]通过sklearn库中的fit(X_tr ain,y_tr ain)函数训练所述初始模型, 以生成所述 KNN用户分类模型。 [0011]一实施例中, 基于KN N算法的用户分类方法还 包括: [0012]利用Python中机器学习 库sklear n.model_ selection中的train_test_ split函数 来将数据集随机划分为训练集以及测试集。 [0013]一实施例中, 基于KN N算法的用户分类方法还 包括: [0014]对所述个人信息进行 预处理; [0015]对所述训练集进行归一 化处理。 [0016]第二方面, 本发明提供一种基于KN N算法的用户分类方法及装置, 该装置包括: [0017]个人信息 接收模块, 用于 接收用户的个人信息; [0018]用户分类模块, 用于根据所述个人信息以及预先建立的KNN用户分类模型对多个 用户进行分类, 所述KN N用户分类模型 是基于KN N算法所生成的。说 明 书 1/9 页 3 CN 115545113 A 3

PDF文档 专利 基于KNN算法的用户分类方法及装置

文档预览
中文文档 16 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于KNN算法的用户分类方法及装置 第 1 页 专利 基于KNN算法的用户分类方法及装置 第 2 页 专利 基于KNN算法的用户分类方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:49上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。