(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210499637.4
(22)申请日 2022.05.09
(71)申请人 北京沃东天骏信息技 术有限公司
地址 100176 北京市北京经济技 术开发区
科创十一 街18号院2号楼4层A402室
申请人 北京京东世纪贸易有限公司
(72)发明人 伍星 孙小朋 贾牧 王畅 孙林
关诚
(74)专利代理 机构 中原信达知识产权代理有限
责任公司 1 1219
专利代理师 孙磊 韩黎捷
(51)Int.Cl.
G06F 16/2455(2019.01)
G06F 21/62(2013.01)
(54)发明名称
一种处理数据的方法、 装置和系统
(57)摘要
本发明公开了一种处理数据的方法、 装置和
系统, 涉及信息安全领域。 该方法的一具体实施
方式包括: 接收数据需求端发送的数据获取请
求, 从数据源中获取对应于请求数据范围 的多条
原始数据; 根据所述数据处理类型以及针对数据
处理类型确定的噪声数据, 为每一条所述原始数
据生成对应的目标数据, 发送多个目标数据给数
据需求方, 以使所述数据需求方基于所述数据处
理类型对多个所述目标数据进行分组处理。 克服
了无法满足数据需求方的分组处理数据的需求
的问题, 提高了数据提供方的数据安全性, 提高
了数据需求方处 理数据的灵活性和效率。
权利要求书3页 说明书13页 附图4页
CN 114817330 A
2022.07.29
CN 114817330 A
1.一种处 理数据的方法, 其特 征在于, 包括:
接收数据需求方发送的数据获取请求; 所述数据获取请求指示一个或多个数据 范围以
及数据处 理类型;
根据所述数据获取请求指示的一个或多个所述数据 范围, 从数据源中获取属于一个或
多个所述数据范围内的多条原 始数据;
根据所述数据处理类型以及所述确定出的所述多条原始数据的对应于所述数据处理
类型的噪声 数据, 为每一条所述原始数据生成对应的目标数据, 其中, 对应于所述数据处理
类型的噪声数据使 多条所述目标 数据满足分组需求;
发送多个所述目标数据给数据需求方, 以使所述数据需求方基于所述数据处理类型对
多个所述目标 数据进行处 理。
2.根据权利要求1所述的方法, 其特 征在于,
所述数据获取请求进一步指示所述数据需求方所需数据组的个数以及每一个所述数
据组的第一数据量阈值;
在所述接收数据需求方发送的数据获取请求之后, 进一 步包括:
在确定出任一所述数据组的第 一数据量阈值小于第 二数据量阈值的情况下, 发送指示
请求异常的信息给所述数据需求方, 其中, 所述第二数据量阈值指示任意一种数据 处理类
型的噪声数据满足分组需求所需的最小数据量。
3.根据权利要求2所述的方法, 其特 征在于, 进一 步包括:
在确定出任一所述数据组的第一数据量阈值 不小于所述第二数据量阈值的情况 下,
确定所述多条原 始数据的数量;
在确定出所述多条原始数据的数量小于或等于所述第 二数据量阈值的情况下, 发送指
示请求异常的信息给 所述数据需求方;
在确定出所述多条原始数据的数量大于所述第 二数据量阈值的情况下, 执行所述为每
一条所述原始数据生成对应的目标 数据的步骤。
4.根据权利要求1所述的方法, 其特 征在于,
在所述从数据源中获取属于一个或多个所述数据范围内的多条原始数据之后, 还包
括:
基于所述多个原 始数据, 计算所述数据处 理类型对应的均值;
基于所述数据处理类型对应的均值、 所述数据获取请求进一步指示的任一数据组的数
据的第一数据量阈值和处 理误差, 生成所述数据处 理类型的噪声数据。
5.根据权利要求 4所述的方法, 其特 征在于,
针对所述数据处 理类型指示 求总和或者 求均值的情况,
所述计算所述数据处 理类型对应的均值, 包括:
计算所述多个原 始数据的均值。
6.根据权利要求 4所述的方法, 其特 征在于, 进一 步包括:
针对数据处 理类型为方差或标准差的情况,
所述计算所述数据处理类型对应的均值, 包括: 针对每一条所述原始数据, 执行对所述
原始数据进行平方运 算, 生成所述原 始数据对应的第一数据;
计算多个所述第一数据的均值。权 利 要 求 书 1/3 页
2
CN 114817330 A
27.根据权利要求4所述的方法, 其特征在于, 所述生成所述数据处理类型的噪声数据,
包括:
基于所述数据处理类型对应的均值、 所述数据获取请求进一步指示的任一数据组的数
据的第一数据量阈值和处 理误差, 计算隐私预算 参数;
将所述隐私预算 参数输入拉普拉斯分布函数, 得到所述噪声数据。
8.一种处 理数据的方法, 其特 征在于, 包括:
发送数据获取请求给数据提供方, 其中, 所述数据获取请求指示一个或多个数据范围
以及数据处 理类型;
在接收到所述数据提供方发送的多条目标数据的情况下, 将所述多条目标数据分为一
个或多个数据组, 并对所述数据组内的目标数据进 行处理, 其中, 所述目标数据是基于所述
数据提供方的原始数据以及 对应于所述数据处理类型的噪声 数据形成, 对应于所述数据处
理类型的噪声数据使 多条所述目标 数据满足分组需求。
9.根据权利要求8所述的处 理数据的方法, 其特 征在于,
还包括: 设置有所需数据组的个数以及每一个所述数据组的第一数据量阈值,
所述将所述多条目标 数据分为 一个或多个数据组, 包括:
在所述多条目标 数据的数量 不小于各个所述数据组的第一数据量阈值之和的情况 下,
根据所述数据组 的个数以及每一个所述数据组的第 一数据量阈值, 划分所述多条目标
数据。
10.根据权利要求9所述的处 理数据的方法, 其特 征在于, 进一 步包括:
在所述多条目标 数据的数量小于各个所述数据组的第一数据量阈值之和的情况 下,
获取第一数据量阈值小于所述多条目标数据的数量的一个或多个目标数据组, 并对所
述目标数据组内的目标 数据进行处 理。
11.根据权利要求8所述的处 理数据的方法, 其特 征在于,
所述对所述数据组内的目标 数据进行处 理, 包括:
针对数据处 理类型为方差或标准差的情况,
为所述数据组确定所述数据提供方提供的数据处理类型为总和或均值对应的第一目
标数据、 以及数据处 理类型为方差或标准差对应的第二目标 数据;
基于所述第一目标数据的均值的平方、 以及所述第二目标数据的均值之间的计算关
系, 计算所述数据组的方差或标准差 。
12.一种处理数据的装置, 其特征在于, 应用于数据提供端, 包括: 获取数据模块、 处理
数据模块和发送数据模块; 其中,
所述获取数据模块, 用于接收数据需求方发送的数据获取请求; 所述数据获取请求指
示一个或多个数据范围以及数据处理类型; 根据所述数据获取请求指示的一个或多个所述
数据范围, 从数据源中获取属于一个或多个所述数据范围内的多条原 始数据;
所述处理数据模块, 用于根据 所述数据处理类型以及所述确定出的所述多条原始数据
的对应于所述数据 处理类型 的噪声数据, 为每一条所述原始数据生成对应的目标数据, 其
中, 对应于所述数据处 理类型的噪声数据使 多条所述目标 数据满足分组需求;
所述发送数据模块, 用于发送多个所述目标数据给数据需求方, 以使所述数据需求方
基于所述数据处 理类型对多个所述目标 数据进行处 理。权 利 要 求 书 2/3 页
3
CN 114817330 A
3
专利 一种处理数据的方法、装置和系统
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:17上传分享