(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210502652.X
(22)申请日 2022.05.10
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 杜健 崔锦铭 张磊 陆宇飞
段普
(74)专利代理 机构 北京亿腾知识产权代理事务
所(普通合伙) 11309
专利代理师 陈霁 周良玉
(51)Int.Cl.
G06F 21/60(2013.01)
G06F 21/62(2013.01)
G06F 21/64(2013.01)
G06Q 30/02(2012.01)G06Q 40/02(2012.01)
(54)发明名称
保护隐私的确定共有数据的方法、 装置和系
统
(57)摘要
本说明书实施例提供一种保护隐私的确定
共有数据的方法、 装置和系统。 第一方利用第一
密钥, 将其持有的第一数据集进行加密, 将得到
的单加密全 数据集发送给第二方。 第二方利用第
二密钥对单加密全数据集再次加密, 得到双加密
全数据集, 还基于本方的第二数据集进行下采样
和基于第二密钥的单次加密, 得到单加密采样数
据集, 发送给第一方。 第一方又利用第一密钥对
单加密采样数据集进行加密, 得到双加密采样数
据集, 并确定双加密全数据集和双加密采样数据
集的交集。 此外, 还对双加密采样数据集中除交
集外的补集进行上采样, 将得到的元素添加到交
集, 得到加噪交集, 将其中的元素索引发送给第
二方。 第二方基于元素索引, 确定与共有数据相
关的信息 。
权利要求书4页 说明书11页 附图4页
CN 114611131 A
2022.06.10
CN 114611131 A
1.一种保护隐私的确定共有数据的方法, 通过第一方 执行, 包括:
利用第一方持有的第一密钥, 将其持有的第一数据集中的各条第一数据进行加密, 得
到第一单加密全数据集, 并将其发送给第二方;
从第二方接收第一双加密全数据集和第二单加密采样数据集, 其中, 所述第一双加密
全数据集至少通过对所述第一单加密全数据集中的各条数据利用所述第二方 的第二密钥
进行再次加密而得到, 所述第二单加密采样数据集是第二方对其持有的第二数据集进 行第
一采样和基于第二密钥的单次加密得到的;
利用所述第 一密钥对所述第 二单加密采样数据集进行再次加密, 得到第 二双加密采样
数据集, 并确定所述第一双加密全数据集和第二双加密采样数据集的交集作为原 始交集;
对所述第二双加密采样数据集中除所述原始交集外的补集进行第 二采样, 将得到的附
加元素添加至所述原 始交集, 得到加噪交集;
将所述加噪交集的元 素索引发送给 所述第二方, 使其确定与共有数据相关的信息 。
2.根据权利要求1所述的方法, 其中, 所述第 一数据集包括用户账号或用户个人信 息作
为第一数据。
3.根据权利要求1所述的方法, 其中, 利用第一方持有的第一密钥, 将其持有的第一数
据集中的各 条第一数据进行加密, 包括:
利用约定的哈希函数, 计算得到各 条第一数据对应的各个哈希值;
利用所述第一密钥, 分别对所述各个哈希值进行加密操作, 得到所述第一单加密全数
据集。
4.根据权利要求1所述的方法, 其中, 所述第二采样包括:
以第二概率对所述补集中的元素进行采样, 所述第 二概率负相关于预设的第 二隐私预
算。
5.根据权利要求1所述的方法, 其中, 所述第 一双加密全数据集是基于所述第 一单加密
全数据集进行乱序和所述再次加密得到的。
6.一种保护隐私的确定共有数据的方法, 通过第二方 执行, 包括:
从第一方接收第一单加密全数据集, 其为第 一方利用第 一密钥对其持有的第 一数据集
中的各条第一数据进 行加密而得到; 至少通过利用第二方的第二密钥对所述第一单加密 全
数据集中各 条数据进行 再次加密, 得到第一双加密全数据集;
基于本方持有的第 二数据集进行第 一采样和基于第 二密钥的单次加密, 得到第 二单加
密采样数据集;
将所述第一双加密全数据集和所述第二单加密采样数据集发送给第一方;
从第一方接收加噪交集的元素索引, 所述加噪交集是在原始交集中添加附加元素得到
的, 所述原始交集是所述第一双加密全数据集和第二双加密采样数据集的交集, 所述第二
双加密采样数据集是第一方利用所述第一密钥对所述第二单加密采样数据集进行加密得
到的; 所述附加元素是对所述第二双加密 采样数据集中除所述原始交集外的补集进行第二
采样得到的;
根据所述元 素索引, 确定与共有数据相关的信息 。
7.根据权利要求6所述的方法, 其中, 所述第二数据集包括用户账号或用户个人信息 。
8.根据权利要求6所述的方法, 其中, 得到第一双加密全数据集, 包括:权 利 要 求 书 1/4 页
2
CN 114611131 A
2对所述第一单加密全数据集中各条数据进行乱序, 利用第 二密钥对乱序后的各条数据
进行再次加密; 或者,
利用第二密钥对所述第 一单加密全数据集中各条数据进行再次加密, 并对再次加密后
的数据进行乱序。
9.根据权利要求6所述的方法, 其中, 得到第二单加密采样数据集, 包括:
对本方持有的第二数据集进行第 一采样, 对第 一采样得到的采样数据集施加基于第 二
密钥的单次加密; 或者,
对本方持有的第二数据集中的各条第 二数据施加基于第 二密钥的单次加密, 对单次加
密得到的第二单加密数据集进行第一采样。
10.根据权利要求6或9所述的方法, 其中, 所述基于第二密钥的单次加密包括:
利用约定的哈希函数, 计算得到各加密对象的各个哈希值;
利用所述第二密钥, 分别对所述各个哈希值进行加密操作。
11.根据权利要求6或9所述的方法, 其中, 所述第一采样包括:
对有待采样的目标集中的各个元素, 以第一概率保留该元素作为采样元素, 其中所述
第一概率正相关于预设的第一隐私预算。
12.根据权利要求6所述的方法, 其中, 根据所述元素索引, 确定与共有数据相关的信
息, 包括:
根据所述元 素索引, 确定第二数据集中对应的第二数据作为加噪的共有数据。
13.根据权利要求12所述的方法, 其中, 根据所述元素索引, 确定与共有数据相关的信
息, 还包括:
获取所述加噪的共有数据对应的各个对象的属性特 征;
根据各个对象的属性特 征, 确定共有数据的与所述属性特 征相关的加噪统计结果。
14.根据权利要求13所述的方法, 其中, 所述加噪统计结果包括以下之一: 均值, 分布,
总量, 均方差 。
15.一种保护隐私的确定共有数据的方法, 包括:
第一方利用第一密钥, 将其持有的第一数据集中的各条第一数据进行加密, 得到第一
单加密全数据集, 并将其发送给第二方;
第二方至少通过利用第 二密钥对所述第 一单加密全数据集中各条数据进行再次加密,
得到第一双加密全数据集;
第二方基于本方持有的第 二数据集进行第 一采样和基于第 二密钥的单次加密, 得到第
二单加密采样数据集;
第二方将所述第一双加密全数据集和所述第二单加密采样数据集发送给第一方;
第一方利用所述第 一密钥对所述第 二单加密采样数据集进行加密, 得到第 二双加密采
样数据集, 并确定所述第一双加密全数据集和第二双加密采样数据集的交集作为原始交
集; 对所述第二双加密采样数据集中除所述原始交集外的补集进行第二采样, 将得到的元
素添加至所述原 始交集, 得到加噪交集;
第一方将所述加噪交集的元 素索引发送给 所述第二方;
第二方基于所述元 素索引, 确定与共有数据相关的信息 。
16.一种保护隐私的确定共有数据的装置, 部署在第一方中, 包括:权 利 要 求 书 2/4 页
3
CN 114611131 A
3
专利 保护隐私的确定共有数据的方法、装置和系统
文档预览
中文文档
20 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:17上传分享