社区精选 | 浅浅社区知识小课堂——隐私保护

社区精选 | 浅浅社区知识小课堂——隐私保护

我们通常提到的隐私保护,例如耳熟能详的同态加密(Homomorphic Encryption)、安全多方计算(Secure Multi-Party Computation)、密文搜索等方案均为基于密码学的隐私保护。

其中同态加密的原理在浅浅社区建设贴中有类似的提法,当时以用户发布的文章(动态)为例,给出明确的过程梳理。

这里我们所提到的同态加密,是指我们使用了某个加密函数,该函数允许用户直接对密文进行特定的代数运算,所得到的结果,仍然是加密的结果。

举个例子,浅浅在数自己有多少个LAT,这个时候发现第一个钱包里有10个LAT,第二个钱包里有20个LAT,但是她不想让计算器知道自己有多少个LAT,于是她找到了一个加密函数。这个函数特别神奇,当然对某个数字加密之后得到密文时,1号密文加上2号密文所得到的结果密文,竟然就是1号原文加上2号原文的结果原文加密之后的内容。

这里我们就称这个加密函数,具有加法同态的性质,乘法同态的道理跟这个类似,这里就不过多赘述了。

如果当一个加密函数,同时满足加法同态乘法同态,我们就称这个加密函数为全同态加密函数。Gentry在他2009年发表的论文 Fully Homomorphic Encryption Using Ideal Lattices 中提出了首个全同态加密的解决办法,此后有很多很多密码学家在他的工作基础上不断地钻研、拓展,直到今天。

我们还可以站在巨人的肩膀上,探索非密码学方向的抗大数据分析的隐私保护,其中就包含数据扰乱、匿名模型还有PPDM。

数据扰乱,是指利用某些特定的方法或策略对当前已有的数据样本做出干扰,防止有心人的非分之想。比如 l-diversity: privacy beyond k-anonymity 中提到的数据泛化,利用数值型或者枚举型的属性值来代替样本中的真实数据,降低样本中的信息粒度。

我举个简单的泛化案例。前几天期末考试的成绩出来了,我语文考了86分,按照五级积分制,我属于乙,这个时候有个男生特讨厌,跑来跟我说,他考了85分,然后问我考多少,我不想理他。我就说,我考了乙级,也就是80~89那一档。这样子我就把我的成绩数据粒度降低了。

但其实这种方法,是有问题的,尤其是在高维向低维泛化的时候,从高到低很简单,从低到高就很困难。这就是另外一个方向要讨论的内容,这里不再展开。

除此之外,数据扰乱还包含数据扭曲、数据清洗以及数据屏蔽。数据扭曲很好理解,就是对原始数据叠加随机数,可能是加法叠加或者乘法叠加,从而实现隐私保护;数据清洗其实跟数据脱敏差不多,就是把这批数据中的稠密关联项去掉,让攻击者很难利用统计学方法去挖掘数据内的关联规则,从而实现隐私保护;数据屏蔽则是利用符号来代替隐私数据中的部分属性值。

发布者:PlatONWorld,转载请注明出处:https://platonworld.org/zh/platon%e7%94%9f%e6%80%81/%e7%a4%be%e5%8c%ba%e7%b2%be%e9%80%89-%e6%b5%85%e6%b5%85%e7%a4%be%e5%8c%ba%e7%9f%a5%e8%af%86%e5%b0%8f%e8%af%be%e5%a0%82-%e9%9a%90%e7%a7%81%e4%bf%9d%e6%8a%a4/

发表评论

登录后才能评论