(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210531839.2
(22)申请日 2022.05.17
(71)申请人 中电云数智科技有限公司
地址 430058 湖北省武汉市蔡甸区经济技
术开发区人工智能科技园N栋研发楼3
层N3013号
(72)发明人 陆林 何德峰 窦书明 张晓娟
余文峰 黄飞
(74)专利代理 机构 北京尚钺知识产权代理事务
所(普通合伙) 11723
专利代理师 王海荣
(51)Int.Cl.
G16H 70/40(2018.01)
G16H 10/60(2018.01)
G16H 10/20(2018.01)G06F 21/62(2013.01)
(54)发明名称
一种保护隐私的药物临床应用频谱统计方
法和装置
(57)摘要
本发明提供一种保护隐私的药物临床应用
频谱统计方法, 包括: 查询方获取目标药物成分
和分组项, 向样本方下发局部统计任务; 样本方
接收并执行查询方下发的局部统计任务, 将局部
统计任务的结果返回至查询方; 查询方对局部统
计任务的结果进行聚合处理, 得到全局统计结
果。 根据本发 明示例性实施例的保护隐私的药物
临床应用频谱统计方法及装置, 通过联邦学习的
方式通过局部统计和全局聚合的方式得到分析
结果, 避免原始诊疗记录 隐私信息的泄露; 样本
方对局部统计结果通过添加差分隐私噪声, 避免
了查询方对样本方的差分攻击 。
权利要求书2页 说明书6页 附图2页
CN 114628043 A
2022.06.14
CN 114628043 A
1.一种保护隐私的药物临床应用频谱统计方法, 其特 征在于, 所述方法包括:
S1: 查询方获取目标 药物成分和分组项, 向样本方 下发局部统计任务;
S2: 样本方接收并执行查询方下发的局部统计任务, 将局部统计任务的结果返回至查
询方;
S3: 查询方对局部统计任务的结果进行聚合处 理, 得到全局统计结果。
2.根据权利要求1所述的保护隐私的药物 临床应用频谱统计方法, 其特征在于, 步骤S2
中所述样本方接收并执 行查询方 下发的局部统计任务, 包括:
S21: 查询包 含目标药物成分、 分组项的病例信息, 得到查询结果;
S22: 按照分组项对所述查询结果进行分组, 得到分组项集合, 统计每个分组项的真实
计数值, 得到真实计数值 集合;
S23: 对真实计数值进行差分隐私处 理, 得到添加噪声后的噪声计数值 集合;
S24: 将所述分组项集合和对应的所述噪声计数值集合作为局部统计任务的结果, 返回
给查询方。
3.根据权利要求2所述的保护隐私的药物临床应用频谱统计方法, 其特征在于, 步骤
S22中, 按照分组项对所述 查询结果进行分组, 得到分组项集 合, 采用以下 方式表示:
式中,
表示样本方t的分组项集合, t表示样本方序数, m表示分组ID,
表示样本
方t中第m个分组项。
4.根据权利要求3所述的保护隐私的药物临床应用频谱统计方法, 其特征在于, 步骤
S22中, 真实计数值 集合采用以下 方式表示:
式中,
表示样本方t的真实计数值集合, t表示样本方序数, m表示分组ID,
表示样
本方t中第i个分组项对应的真实计数值。
5.根据权利要求4所述的保护隐私的药物临床应用频谱统计方法, 其特征在于, 步骤
S23中, 对真实计数值进 行差分隐私处理, 包括: 遍历所有分组项对应的真实计数值, 对每一
个真实计数值加上一个从拉普拉斯分布 L(0, 1/ ε )采样的随机噪声值, 1/ ε为拉普拉斯分布
的尺度参数。
6.根据权利5所述的保护隐私的药物临床应用频谱统计方法, 其特征在于, 步骤S23中,
按以下方法得到添加噪声后的噪声计数值:
式中,
为添加噪声后样本方t的噪声计数值集合,
为从拉普拉斯分布L(0, 1/
ε )采样的随机噪声值。
7.根据权利1所述的保护隐私的药物临床应用频谱统计方法, 其特征在于, 步骤S3中,
查询方对局部统计任务的结果进行聚合处 理, 包括: 遍历所有样本方局部统计任务的结果。
8.根据权利要求7所述的保护隐私的药物 临床应用频谱统计方法, 其特征在于, 步骤S3
中, 查询方对局部统计任务的结果进行聚合处 理, 按以下 方法进行:权 利 要 求 书 1/2 页
2
CN 114628043 A
2式中, k为分组项ID, Xk为第k个分组项的全局计数值,
为样本方t中真实计数值集合
中第k个真实计数值添加噪声后的噪声计数值,
表示样本方t的分组项集 合。
9.一种基于 差分联邦统计的药物临床应用分布分析装置, 所述装置包括:
查询模块, 包括任务调度 单元和聚合统计单元, 其中, 任务调度 单元用于获取目标药物
成分和分组项, 向样本方 下发局部统计任务; 聚合统计单 元用于;
样本模块, 包括样本库单元和差分统计单元, 其中, 差分统计单元用于从样本库单元中
查询包含目标药物成分、 分组项的病例 信息, 得到查询结果; 按照分组项对所述查询结果进
行分组, 统计每个分组内的病例数目和每个分组对应的真实计数值; 对真实计数值进行差
分隐私处理, 得到添加噪声后的噪声计数值; 将所述分组项和对应的所述噪声计数值作为
局部统计结果, 返回给查询方。
10.一种计算机设备, 其特征在于, 包括存储器、 处理器及存储在所述存储器上并可在
所述处理器上运行 的计算机程序, 所述处理器执行所述程序时实现权利要求4 ‑8中任一项
所述方法的步骤。权 利 要 求 书 2/2 页
3
CN 114628043 A
3
专利 一种保护隐私的药物临床应用频谱统计方法和装置
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:10上传分享