专利 一种生物识别处理方法、装置及设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210487943.6 (22)申请日 2022.05.06 (71)申请人支付宝（杭州）信息技术有限公司地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人曹佳炯　丁菁汀　 (74)专利代理机构北京国昊天诚知识产权代理有限公司 1 1315 专利代理师朱文杰 (51)Int.Cl. G06V 40/10(2022.01) G06F 21/62(2013.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种生物识别处理方法、装置及设备 (57)摘要本说明书实施例公开了一种生物识别处理方法、装置及设备，该方法包括：获取目标用户的生物识别请求，该生物识别请求中包括目标用户的用户生物信息；将该用户生物信息分别输入到模型架构相同的两个脱敏模型中，得到每个脱敏模型输出的脱敏后的用户生物信息，两个脱敏模型在进行模型训练的过程中使用的训练样本数据不同，且其中的一个脱敏模型使用的训练样本数据的类型分布中存在长尾分布的数据类型在另一个脱敏模型使用的训练样本数据的类型分布中不属于长尾分布；基于两个脱敏模型输出的脱敏后的用户生物信息，确定该生物识别请求对应的隐私保护后的用户生物信息；基于确定的隐私保护后的用户生物信息对目标用户进行生物识别处理。权利要求书4页说明书26页附图5页 CN 114863481 A 2022.08.05 CN 114863481 A 1.一种生物识别处理方法，所述方法包括：获取目标用户的生物识别请求，所述生物识别请求中包括所述目标用户的用户生物信息；将所述用户生物信息分别输入到模型架构相同的两个脱敏模型中，得到每个脱敏模型输出的脱敏后的用户生物信息，所述两个脱敏模型在进行模型训练的过程中使用的训练样本数据不同，且其中的一个脱敏模型使用的训练样本数据的类型分布中存在长尾分布的数据类型在另一个脱敏模型使用的训练样本数据的类型分布中不属于长尾分布；基于两个脱敏模型输出的脱敏后的用户生物信息，确定所述生物识别请求对应的隐私保护后的用户生物信息；基于确定的所述隐私保护后的用户生物信息对所述目标用户进行生物识别处理。 2.根据权利要求1所述的方法，所述基于两个脱敏模型输出的脱敏后的用户生物信息，确定所述生物识别请求对应的隐私保护后的用户生物信息，包括计算两个脱敏模型输出的脱敏后的用户生物信息的平均值；将计算得到的平均值对应的用户生物信息作为所述生物识别请求对应的隐私保护后的用户生物信息。 3.根据权利要求1所述的方法，所述基于确定的所述隐私保护后的用户生物信息对所述目标用户进行生物识别处理，包括：将所述确定的所述隐私保护后的用户生物信息发送给服务器，所述确定的所述隐私保护后的用户生物信息用于触发所述服务器基于预先存储的基准用户生物信息和所述隐私保护后的用户生物信息，对所述目标用户进行生物识别处理；接收所述服务器发送的对所述目标用户进行生物识别处理的生物识别结果。 4.根据权利要求1所述的方法，所述两个脱敏模型包括第一脱敏模型和第二脱敏模型，所述方法还包括：从不存在长尾分布的第一训练样本池中获取第一数量的第一训练样本数据，并从存在长尾分布的第二训练样本池中获取第二数量的第二训练样本数据，所述第一数量大于所述第二数量，基于所述第一数量的第一训练样本数据和所述第二数量的第二训练样本数据构建第三训练样本集；从不存在长尾分布的第一训练样本池中获取第二数量的第一训练样本数据，并从存在长尾分布的第二训练样本池中获取第一数量的第二训练样本数据，基于所述第二数量的第一训练样本数据和所述第一数量的第二训练样本数据构建第四训练样本集；基于所述第三训练样本集中的训练样本数据和预设的第一损失函数对所述第一脱敏模型进行模型训练，得到训练后的第一脱敏模型；基于所述第四训练样本集中的训练样本数据和预设的第二损失函数对所述第二脱敏模型进行模型训练，得到训练后的第二脱敏模型。 5.根据权利要求 4所述的方法，所述方法还包括：基于所述第一损失函数对所述第三训练样本集中的训练样本数据对应的权重进行调整，得到调整后的权重；所述基于所述第三训练样本集中的训练样本数据和预设的第一损失函数对所述第一脱敏模型进行模型训练，得到训练后的第一脱敏模型，包括：权　利　要　求　书 1/4 页 2 CN 114863481 A 2基于所述第三训练样本集中的训练样本数据、所述调整后的权重和预设的第一损失函数对所述第一脱敏模型进行模型训练，得到训练后的第一脱敏模型。 6.根据权利要求4或5所述的方法，所述基于所述第三训练样本集中的训练样本数据和预设的第一损失函数对所述第一脱敏模型进行模型训练，得到训练后的第一脱敏模型，包括：分别将所述第三训练样本集中的训练样本数据输入到所述第一脱敏模型中，得到所述第三训练样本集中每个训练样本数据对应的脱敏后的第一样本数据；分别将所述第三训练样本集中每个训练样本数据对应的脱敏后的第一样本数据输入到第一反脱敏模型中，以对所述脱敏后的第一样本数据进行样本还原，得到所述第三训练样本集中重建的训练样本数据；基于所述第三训练样本集中的训练样本数据、所述脱敏后的第一样本数据和所述第三训练样本集中重建的训练样本数据，通过预设的第一损失函数，确定所述第一脱敏模型和所述第一反脱敏模型是否收敛，如果否，则基于所述第三训练样本集继续对所述第一脱敏模型和所述第一反脱敏模型进行模型训练，直到所述第一脱敏模型和所述第一反脱敏模型收敛，得到训练后的第一脱敏模型。 7.根据权利要求6所述的方法，所述第一损失函数由所述脱敏后的第一样本数据与所述脱敏后的第一样本数据对应的原始训练样本数据之间的相似度的最大值，以及所述脱敏后的第一样本数据中是否包括用户的身份信息的特征确定。 8.根据权利要求 4所述的方法，所述方法还包括：基于所述第二损失函数对所述第四训练样本集中的训练样本数据对应的权重进行调整，得到调整后的权重；所述基于所述第四训练样本集中的训练样本数据和预设的第二损失函数对所述第二脱敏模型进行模型训练，得到训练后的第二脱敏模型，包括：基于所述第四训练样本集中的训练样本数据、所述调整后的权重和预设的第二损失函数对所述第二脱敏模型进行模型训练，得到训练后的第二脱敏模型。 9.根据权利要求4或8所述的方法，所述基于所述第四训练样本集中的训练样本数据和预设的第二损失函数对所述第二脱敏模型进行模型训练，得到训练后的第二脱敏模型，包括：分别将所述第四训练样本集中的训练样本数据输入到所述第二脱敏模型中，得到所述第四训练样本集中每个训练样本数据对应的脱敏后的第二样本数据；分别将所述第四训练样本集中每个训练样本数据对应的脱敏后的第二样本数据输入到第二反脱敏模型中，以对所述脱敏后的第二样本数据进行样本还原，得到所述第四训练样本集中重建的训练样本数据；基于所述第四训练样本集中的训练样本数据、所述脱敏后的第二样本数据和所述第四训练样本集中重建的训练样本数据，通过预设的第二损失函数，确定所述第二脱敏模型和所述第二反脱敏模型是否收敛，如果否，则基于所述第四训练样本集继续对所述第二脱敏模型和所述第二反脱敏模型进行模型训练，直到所述第二脱敏模型和所述第二反脱敏模型收敛，得到训练后的第二脱敏模型。 10.根据权利要求9所述的方法，所述第二损失函数由所述脱敏后的第二样本数据与所权　利　要　求　书 2/4 页 3 CN 114863481 A 3

专利 一种生物识别处理方法、装置及设备

专利一种生物识别处理方法、装置及设备