(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210487943.6
(22)申请日 2022.05.06
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 曹佳炯 丁菁汀
(74)专利代理 机构 北京国昊天诚知识产权代理
有限公司 1 1315
专利代理师 朱文杰
(51)Int.Cl.
G06V 40/10(2022.01)
G06F 21/62(2013.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种生物 识别处理方法、 装置及设备
(57)摘要
本说明书实施例公开了一种生物识别处理
方法、 装置及设备, 该方法包括: 获取目标用户的
生物识别请求, 该生物识别请求中包括目标用户
的用户生物信息; 将该用户生物信息分别输入到
模型架构相同的两个脱 敏模型中, 得到每个脱 敏
模型输出的脱敏后的用户生物信息, 两个脱 敏模
型在进行模型训练的过程中使用的训练样本数
据不同, 且其中的一个脱 敏模型使用的训练样本
数据的类型分布中存在长尾分布的数据类型在
另一个脱敏模型使用的训练样本数据的类型分
布中不属于长尾 分布; 基于两个脱敏模型输出的
脱敏后的用户生物信息, 确定该生物识别请求对
应的隐私保护后的用户生物信息; 基于确定的隐
私保护后的用户生物信息对目标用户进行生物
识别处理。
权利要求书4页 说明书26页 附图5页
CN 114863481 A
2022.08.05
CN 114863481 A
1.一种生物 识别处理方法, 所述方法包括:
获取目标用户的生物识别请求, 所述生物识别请求中包括所述目标用户的用户生物信
息;
将所述用户生物信 息分别输入到模型架构相同的两个脱敏模型中, 得到每个脱敏模型
输出的脱敏后的用户生物信息, 所述两个脱敏模型在进行模型训练的过程中使用的训练样
本数据不同, 且其中的一个脱敏模型使用的训练样本数据的类型分布中存在长尾分布的数
据类型在另一个脱敏模型使用的训练样本数据的类型分布中不属于 长尾分布;
基于两个脱敏模型输出的脱敏后的用户生物信 息, 确定所述生物识别请求对应的隐私
保护后的用户生物信息;
基于确定的所述隐私保护后的用户生物信息对所述目标用户进行生物 识别处理。
2.根据权利要求1所述的方法, 所述基于两个脱敏模型输出的脱敏后的用户生物信 息,
确定所述 生物识别请求对应的隐私保护后的用户生物信息, 包括
计算两个脱敏模型输出的脱敏后的用户生物信息的平均值;
将计算得到的平均值对应的用户生物信息作为所述生物识别请求对应的隐私保护后
的用户生物信息 。
3.根据权利要求1所述的方法, 所述基于确定的所述隐私保护后的用户生物信息对所
述目标用户进行生物 识别处理, 包括:
将所述确定的所述隐私保护后的用户生物信 息发送给服务器, 所述确定的所述隐私保
护后的用户生物信息用于触发所述服务器基于预先存储的基准用户生物信息和所述隐私
保护后的用户生物信息, 对所述目标用户进行生物 识别处理;
接收所述 服务器发送的对所述目标用户进行生物 识别处理的生物 识别结果。
4.根据权利要求1所述的方法, 所述两个脱敏模型包括第 一脱敏模型和第 二脱敏模型,
所述方法还 包括:
从不存在长尾分布的第 一训练样本池中获取第 一数量的第 一训练样本数据, 并从存在
长尾分布的第二训练样本池中获取第二数量的第二训练样本数据, 所述第一数量大于所述
第二数量, 基于所述第一数量的第一训练样本数据和所述第二数量的第二训练样本数据构
建第三训练样本集;
从不存在长尾分布的第 一训练样本池中获取第 二数量的第 一训练样本数据, 并从存在
长尾分布的第二训练样本池中获取第一数量的第二训练样本数据, 基于所述第二数量的第
一训练样本数据和所述第一数量的第二训练样本数据构建第四训练样本集;
基于所述第三训练样本集中的训练样本数据和预设的第一损失函数对所述第一脱敏
模型进行模型训练, 得到训练后的第一脱敏模型;
基于所述第四训练样本集中的训练样本数据和预设的第二损失函数对所述第二脱敏
模型进行模型训练, 得到训练后的第二脱敏模型。
5.根据权利要求 4所述的方法, 所述方法还 包括:
基于所述第一损失函数对所述第三训练样本集中的训练样本数据对应的权重进行调
整, 得到调整后的权 重;
所述基于所述第三训练样本集中的训练样本数据和预设的第一损失函数对所述第一
脱敏模型进行模型训练, 得到训练后的第一脱敏模型, 包括:权 利 要 求 书 1/4 页
2
CN 114863481 A
2基于所述第 三训练样本集中的训练样本数据、 所述调 整后的权重和预设的第 一损失函
数对所述第一脱敏模型进行模型训练, 得到训练后的第一脱敏模型。
6.根据权利要求4或5所述的方法, 所述基于所述第 三训练样本集中的训练样本数据和
预设的第一损失函数对所述第一脱敏模型进行模型训练, 得到训练后的第一脱敏模型, 包
括:
分别将所述第 三训练样本集中的训练样本数据输入到所述第 一脱敏模型中, 得到所述
第三训练样本集中每 个训练样本数据对应的脱敏后的第一样本数据;
分别将所述第三训练样本集中每个训练样本数据对应的脱敏后的第一样本数据输入
到第一反脱敏模型中, 以对所述脱敏后的第一样本数据进行样本还原, 得到所述第三训练
样本集中重建的训练样本数据;
基于所述第 三训练样本集中的训练样本数据、 所述脱敏后的第 一样本数据和所述第 三
训练样本集中重建的训练样本数据, 通过预设的第一损失函数, 确定所述第一脱敏模型和
所述第一反脱敏模型是否 收敛, 如果否, 则基于所述第三训练样本集继续对所述第一脱敏
模型和所述第一反脱敏模型进 行模型训练, 直到所述第一脱敏模型和所述第一反脱敏模型
收敛, 得到训练后的第一脱敏模型。
7.根据权利要求6所述的方法, 所述第一损失函数由所述脱敏后的第一样本数据与所
述脱敏后的第一样本数据对应的原始训练样本数据之 间的相似度的最大值, 以及所述脱敏
后的第一样本数据中是否包括用户的身份信息的特 征确定。
8.根据权利要求 4所述的方法, 所述方法还 包括:
基于所述第二损失函数对所述第四训练样本集中的训练样本数据对应的权重进行调
整, 得到调整后的权 重;
所述基于所述第四训练样本集中的训练样本数据和预设的第二损失函数对所述第二
脱敏模型进行模型训练, 得到训练后的第二脱敏模型, 包括:
基于所述第四训练样本集中的训练样本数据、 所述调 整后的权重和预设的第 二损失函
数对所述第二脱敏模型进行模型训练, 得到训练后的第二脱敏模型。
9.根据权利要求4或8所述的方法, 所述基于所述第四训练样本集中的训练样本数据和
预设的第二损失函数对所述第二脱敏模型进行模型训练, 得到训练后的第二脱敏模型, 包
括:
分别将所述第四训练样本集中的训练样本数据输入到所述第 二脱敏模型中, 得到所述
第四训练样本集中每 个训练样本数据对应的脱敏后的第二样本数据;
分别将所述第四训练样本集中每个训练样本数据对应的脱敏后的第二样本数据输入
到第二反脱敏模型中, 以对所述脱敏后的第二样本数据进行样本还原, 得到所述第四训练
样本集中重建的训练样本数据;
基于所述第四训练样本集中的训练样本数据、 所述脱敏后的第 二样本数据和所述第四
训练样本集中重建的训练样本数据, 通过预设的第二损失函数, 确定所述第二脱敏模型和
所述第二反脱敏模型是否 收敛, 如果否, 则基于所述第四训练样本集继续对所述第二脱敏
模型和所述第二反脱敏模型进 行模型训练, 直到所述第二脱敏模型和所述第二反脱敏模型
收敛, 得到训练后的第二脱敏模型。
10.根据权利要求9所述的方法, 所述第 二损失函数由所述脱敏后的第二样本数据与 所权 利 要 求 书 2/4 页
3
CN 114863481 A
3
专利 一种生物识别处理方法、装置及设备
文档预览
中文文档
36 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共36页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:20上传分享