水利行业标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210525174.4 (22)申请日 2022.05.15 (71)申请人 山西墨丘利科技有限公司 地址 030006 山西省太原市综改示范区太 原学府园区长治路249号 (72)发明人 周志刚 白增亮  (51)Int.Cl. G06F 21/62(2013.01) G06F 16/9536(2019.01) G06K 9/62(2022.01) G06N 7/00(2006.01) (54)发明名称 一种多方数据融合场景下的隐私策略组合 优化方法 (57)摘要 本发明公开了一种多方数据融合场景下的 隐私策略组合优化方法, 包括内层匿名、 网络融 合和外层匿名三个阶段, 内层匿名阶段: 数据融 合各方借助贝叶斯生成技术将各自局部数据转 化为贝叶斯网络, 并将匿名化处理后的贝叶斯网 络上传至数据中心以备融合; 网络融合阶段: 利 用协同过滤算法预测各方贝叶斯网络节点之间 的关联关系, 以实现网络之间的融合, 从而消除 了个人用户隐私与原始数据之间的映射关系; 外 层匿名阶段: 本发明提出了一种多方隐私保护策 略的组合优化方法, 将隐私保护策略映射到超图 并设计相应的启发式规则, 使用超图消解技术来 满足隐私约束的同时, 消除多源 数据融合中可能 出现的过保护或欠保护现象, 使融合后数据的效 用最大化。 权利要求书5页 说明书12页 附图5页 CN 115098880 A 2022.09.23 CN 115098880 A 1.一种基于隐私策略组合优化的多源数据融合隐私保护方法, 其特征在于包括以下步 骤: 步骤一、 数据拥有者对其局部数据的内层匿名阶段: 参与数据融合的各数据拥有者分 别借助贝叶斯生成技术将各自局部数据转化为贝叶斯网络, 并将匿名化处理后的贝叶斯网 络上传至数据中心以备融合; 步骤一一, 各数据拥 有者应用基于爬山法的贝叶斯网络生成算法将各自拥 有的局部原 数据转化为相应的贝叶斯网络; 步骤一二, 各数据拥 有者根据 各自的隐私保护需求对原数据转化的贝叶斯网络实施隐 私保护操作; 步骤一三, 参与数据融合的各数据拥 有者将局部匿名后的贝叶斯网络上传至数据中心 以备融合。 步骤二、 各局部贝叶斯网络的融合阶段: 使用协同过滤算法预测各方贝叶斯网络节点 之间的关联关系, 以实现网络之间的融合, 从而消除了个人用户隐私与原始数据之间的映 射关系; 步骤二一, 根据各局部贝叶斯网络构建扩展依赖矩阵; 步骤二二, 通过矩阵分解 来预测扩展依赖矩阵中未知元 素对应的元 素值; 步骤三、 基于多策略组合优化机制的外层匿名阶段: 参与数据融合的各方根据数据使 用者的角色与权限对融合后的贝叶斯网络进 行外层匿名, 本发明提出一种多方隐私保护策 略的组合优化方法, 将隐私保护策略映射到超图并设计相应的启发式规则, 使用超图消 解 技术来满足隐私约束的同时, 消除多源数据融合中可能出现的过保护或欠保护 现象, 使融 合后数据的效用最大化。 2.根据权利要求1所述的将原数据转化的贝叶斯网络实施隐私保护操作, 其特征在于: 贝叶斯网络实施属性 值泛化、 t ‑近邻性和l ‑多样性三种隐私保护操作: 敏感属性值泛化操作: 根据数据拥有者对数据属性设置的属性值泛化层次树, 将属性 值域中待匿名保护的属 性叶节点与其同父节点的所有兄弟叶节点聚合为一个属 性节点并 由其直接父节点进行替换, 形成新的叶节点, 该叶节点所对应的属 性值概率分布继承自参 与聚合的所有原叶节点, 其 值为所有参与聚合节点的概 率分布之和; t‑近邻保护操作: a)将待匿名保护的属性值域空间中导致信息熵最大化的值分布情况 定义为理论基准(其分布值记 为Xmin), 属性值概率分布最大者定义为待平滑基准(其分布 值 记为Xmax); b)使用方差进行度量, 将 定义为平滑操作单位(其中, m为正整数), 对 理 论 基 准 和 待 平 滑 基 准 进 行 迭 代 式 单 位 修 正 ,即 每 一 轮 次 修 正 使 得 若使得属性各值出现概 率与理论基准的方差不高于t则停止迭代, 否则跳转执 行a); l‑多样性保护操作: 将待隐私保护属性在贝叶斯网络中的值域空间进行扩充, 使得其 值域空间中不同值的数量大于等于l; 基于修正后属 性中各值的概率分布根据信息熵最大 化的修正原则, 在每一轮修正的过程中, a)仅选择一个概率分布最大的值作为待修正的目 标对象(其分布 值记为Xmax)且当前属性值域空间中不同值的数量记 为m(m<l), 将其高于均权 利 要 求 书 1/5 页 2 CN 115098880 A 2值的概率分布值 平均分配给新增的属性值{Xm+1, ..., Xl}, 即 (i∈[m+ 1, l]); b)跳转执 行a), 直到 ( 为预设的概 率分布最小阈值, 且 )。 3.根据权利要求1所述的使用协同过滤算法预测各方贝叶斯网络节点之间的关联关 系, 其特征在于: 步骤二一, 根据各局部贝叶斯网络构建扩展依赖矩阵EDMm×m, 其中, 每 个元素entryij表示从原始数据中观察到的网络节点依赖关系, 当entryij=1时, 表示节点ai 和节点aj之间存在依赖关系, 它们之间的条件概率为P(aj|ai); 当entryij=0时, 表示节点ai 和节点aj之间没有依赖关系; ent ryij=? 表示节点ai和节点aj之间的关系不明确; 步骤二二, 通过矩阵分解来预测扩展依赖矩阵中 “?”对应的元素值, 给定Qi, k矩阵和Rk, j 矩阵, 以及融合后的M矩阵, 为了实现预测, 最小化损失函数: 将其化简后得到: 其中, 第一项为矩阵中每个观测值与 相应预测值的二范数距离, 第二项为正则化惩罚项, 用于防止过拟合, λ为一个参数, 用于控 制正则化项。 4.根据权利要求1所述的根据 各局部贝叶斯网络构建扩展依赖矩阵, 其特征在于: 给定 一系列贝叶斯网络G={G1, ..., Gk}, (k≥2)进行融合, 形成相应的依赖矩阵DM={DM1, ..., DMk}(DMi=(Vi, Ei)), 通过依赖矩阵DM构造一个扩展依赖矩阵EDMm×m, 其中, 扩展依赖矩阵EDMm×m中每个元素定义如下: 其中, 每个元素entryij表示从原始数据中观察到的网络节点依赖关系, 当entryij=1 时, 表示节点ai和节点aj之间存在依赖关系, 它们之间的条件概率为P(aj|ai); 当entryij=0 时, 表示节点ai和节点aj之间没有依赖关系; entryij=? 表示节点ai和节点aj之间的关系不 明确。 5.根据权利要求1所述的通过矩阵分解来预测扩展依赖矩阵中未知元素对应的元素 值, 其特征在于: 给定一个依赖矩阵DMm×m以及它的秩rank(DM)=d, 若存在 矩阵Lm×d, Rd×m, 使 得Lm×d×Rd×m=DMm×m成立, 则{Lm×d, Rd×m}称为矩阵DMm×m的二因子分解; 一般来说, 若 (||·||2表示二范数距离), 令 则 {Lm×d, Rd×m}是DMm×m矩阵分解的ε ‑估计; 矩阵中的“?”可以通过矩阵分解来预测, 而之前原矩阵为 “1”或“0”的值, 可能在网络融权 利 要 求 书 2/5 页 3 CN 115098880 A 3

PDF文档 专利 一种多方数据融合场景下的隐私策略组合优化方法

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种多方数据融合场景下的隐私策略组合优化方法 第 1 页 专利 一种多方数据融合场景下的隐私策略组合优化方法 第 2 页 专利 一种多方数据融合场景下的隐私策略组合优化方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:39:12上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。