白话隐私计算
隐私计算
隐私计算的定义:
隐私计算是面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。
2019年《UN Handbook on Privacy-Preserving Computation Techniques》中 提到隐私保护计算是在提供隐私保护的前提下,实现数据价值挖掘的技术体系。
隐私计算全生命周期
- 隐私数据产生
- 隐私感知
- 隐私保护
- 隐私发布/存储/交换
- 隐私分析
- 隐私接收
- 隐私销毁
隐私计算能够做什么?
实现原始数据不离开安全的可信环境,数据“价值”和“知识”流通的目标,促进跨领域多维度数据的融合,构建 “数据可用不可见” 的合作新模式。
隐私计算关键技术
- 基于抗大数据分析的
举个例子:数据扰乱。市面上最常见的数据扰乱的方法——数据泛化,我打个比方,浅浅今天期末考试,语文考了99分,全班第一,但是老师觉得大家的分数差距有点儿大,要是说出去可能会伤了很多认真学习的心。所以决定 [85,100] 是甲等,依次每十分递减一个等级。所以浅浅就变成了甲等,数据内容被降低了粒度的有效范围,使得原始数据被泛化。之后还有数据扭曲、数据清洗以及数据屏蔽,实际上数据扭曲也可以被运用在MPC的秘密共享中。
- 基于密码学的
很常见的就有安全多方计算MPC、全同态加密FHE、差分隐私或者是机密计算,机密计算涉及到硬件可信执行环境,不是我研究的范畴。
- 基于网络隐写的
这一个方案大抵是利用载体中相邻元素的相关性提取特征,然后利用机器学习训练分类器区分载体和载密对象。但是随着目前大数据的分析能力逐渐增强,用户画像刻画也愈发清晰高效,所以结合网络隐写就需要朝着智能的隐写方向进行发展,探索出自适应的隐私策略。