(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211271947.7
(22)申请日 2022.10.18
(71)申请人 中国银行股份有限公司
地址 100818 北京市西城区复兴门内大街1
号
(72)发明人 刘京 李亚雄 马小菲 刘航
(74)专利代理 机构 北京三友知识产权代理有限
公司 11127
专利代理师 王曦 张祥意
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 20/00(2019.01)
G06Q 40/02(2012.01)
(54)发明名称
基于KNN算法的用户分类方法及装置
(57)摘要
本发明提供了一种基于KNN算法的用户分类
方法及装置, 对应的方法包括: 接收用户的个人
信息; 根据所述个人信息以及预先建立的KNN用
户分类模型对多个用户进行分类, 所述KNN用户
分类模型是基于KNN算法所生成的。 本发明采用
的KNN分类算法简单易用, 模型训练时间快, 其 建
立的模型结构完全是根据数据来决定的, 符合现
实情况, 比较适用于样本容量较大的分类情况,
对异常值不敏感, 因此对于银行贷款数据分类的
适用性很高, 并且KNN分类算法具有很好的预测
效果, 对于贷款违约风险的预测把控 可以提供较
为可信的参 考。
权利要求书1页 说明书9页 附图5页
CN 115545113 A
2022.12.30
CN 115545113 A
1.一种基于KN N算法的用户分类方法, 其特 征在于, 包括:
接收用户的个人信息;
根据所述个人信息以及预先建立的KNN用户分类模型对多个用户进行分类, 所述KNN用
户分类模型 是基于KN N算法所生成的。
2.如权利 要求1所述的基于KNN算法的用户分类方法, 其特征在于, 建立所述KNN用户分
类模型的方法包括:
利用Python机器学习sklearn库中的KNeighborsClassifier函数, 基于前期收集到的
客户数据建立所述KN N用户分类模型的初始模型;
通过skle arn库中的fit(X_train,y_train)函数训练所述初始模型, 以生成所述KNN用
户分类模型。
3.如权利要求1所述的基于KN N算法的用户分类方法, 其特 征在于, 还 包括:
利用rain_test_spl it函数来将数据集随机划分为训练集以及测试集。
4.如权利要求3所述的基于KN N算法的用户分类方法, 其特 征在于, 还 包括:
对所述个人信息进行 预处理;
对所述训练集进行归一 化处理。
5.一种基于KN N算法的用户分类装置, 其特 征在于, 包括:
个人信息 接收模块, 用于 接收用户的个人信息;
用户分类模块, 用于根据所述个人信息以及预先建立的KNN用户分类模型对多个用户
进行分类, 所述KN N用户分类模型 是基于KN N算法所生成的。
6.如权利要求5所述的基于KNN算法的用户分类装置, 其特征在于, 还包括: 分类模型建
立模块, 用于建立所述KN N用户分类模型, 所述分类模型建立模块包括:
初始模型建立模块, 用于利用Python机器学习sklearn库中的KNeighborsClassifier
函数, 基于前期收集到的客户数据建立所述KN N用户分类模型的初始模型;
分类模型建立单元, 用于通过sklearn库中的fit(X_train,y_train)函数训练所述初
始模型, 以生成所述KN N用户分类模型。
7.如权利要求5所述的基于KN N算法的用户分类装置, 其特 征在于, 还 包括:
数据集划分模块, 用于利用Python中机器学习库sklearn.model_selection中的
train_test_spl it函数来将数据集随机划分为训练集以及测试集。
8.如权利要求7 所述的基于KN N算法的用户分类装置, 其特 征在于, 还 包括:
信息预处 理模块, 用于对所述个人信息进行 预处理;
训练集归一 化模块, 用于对所述训练集进行归一 化处理。
9.一种计算机程序产品, 包括计算机程序/指令, 其特征在于, 该计算机程序/指令被处
理器执行时实现权利要求1至4任一项所述的基于KN N算法的用户分类方法的步骤。
10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 其特征在于, 所述处理器执行所述程序时实现权利要求1至4任一项所述一种基于
KNN算法的用户分类方法的步骤。
11.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该计算机程序被
处理器执行时实现权利要求1至4任一项所述的基于KN N算法的用户分类方法的步骤。权 利 要 求 书 1/1 页
2
CN 115545113 A
2基于KNN算法的用户分类方 法及装置
技术领域
[0001]本申请属于计算机数据处理技术领域, 具体涉及一种基于KNN算法的用户分类方
法及装置 。
背景技术
[0002]在现有技术中, 随着市场需求的日益增多, 银行业的贷款业务数量不断上升。 出于
经济效益最大化和信用风险规避的双重考量, 银行有必 要对涉及贷款业务客户的贷款状态
进行准确分类, 并在此基础上实现较为准确的分类预测, 从而有助于银行把控客户信贷违
约风险, 有效规避损失, 达 到对商业银 行的贷款 风险控制的要求。
发明内容
[0003]本发明可用于计算机数据处理技术在金融方面应用的技术领域, 也可用于除金 融
领域之外的任意领域, 本发明所提供的基于KNN算法 的用户分类方法及装置, 采用的KNN分
类算法与SVM支持向量机算法相比具有 更低的训练 时间复杂度, 对数据的分布没有假设, 分
类准确度高且对异常点不敏感, 比较适用于样本容量较大的分类情况, KNN模型仅涉及一个
参数K的取值选择, 在应用中通常可以通过交叉验证法来选择最优的K值。
[0004]为解决上述 技术问题, 本发明提供以下技 术方案:
[0005]第一方面, 本发明提供一种基于KN N算法的用户分类方法包括:
[0006]接收用户的个人信息;
[0007]根据所述个人信息以及预先建立的KNN用户分类模型对多个用户进行分类, 所述
KNN用户分类模型 是基于KN N算法所生成的。
[0008]一实施例中, 建立所述KN N用户分类模型的方法包括:
[0009]利用Python机器学习sklearn库中的KNeighborsClassifier函数, 基于前期收集
到的客户数据建立所述KN N用户分类模型的初始模型;
[0010]通过sklearn库中的fit(X_tr ain,y_tr ain)函数训练所述初始模型, 以生成所述
KNN用户分类模型。
[0011]一实施例中, 基于KN N算法的用户分类方法还 包括:
[0012]利用Python中机器学习 库sklear n.model_ selection中的train_test_ split函数
来将数据集随机划分为训练集以及测试集。
[0013]一实施例中, 基于KN N算法的用户分类方法还 包括:
[0014]对所述个人信息进行 预处理;
[0015]对所述训练集进行归一 化处理。
[0016]第二方面, 本发明提供一种基于KN N算法的用户分类方法及装置, 该装置包括:
[0017]个人信息 接收模块, 用于 接收用户的个人信息;
[0018]用户分类模块, 用于根据所述个人信息以及预先建立的KNN用户分类模型对多个
用户进行分类, 所述KN N用户分类模型 是基于KN N算法所生成的。说 明 书 1/9 页
3
CN 115545113 A
3
专利 基于KNN算法的用户分类方法及装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:49上传分享