本地化差分隐私 (
Local Differential Privacy, LDP) 是一种保护个体隐私的方法,通过在本地对数据进行噪声扰动来保护隐私。信息熵可以用来评估
差分隐私机制的隐私保护能力,即机制添加的噪声对原始数据的影响程度。
在 LDP 中,通常用 Laplace 噪声或者指数噪声对原始数据进行噪声扰动。假设原始数据为 $x$,添加的噪声为 $n$,则扰动后的数据为 $y=x+n$。Laplace 噪声的概率密度函数为 $f(x)=frac{1}{2b}exp(-frac{|x-mu|}{b})$,其中 $mu$ 是噪声的均值,$b$ 是噪声的尺度参数。指数噪声的概率密度函数为 $f(x)=frac{1}{b}exp(-frac{|x-mu|}{b})$。
信息熵可以用来评估噪声扰动对隐私保护的影响程度。对于一个随机变量 $X$,其信息熵为 $H(X)=-sum_{xin X}p(x)log_2p(x)$,其中 $p(x)$ 是 $X$ 取值为 $x$ 的概率。对于一个 LDP 机制,其添加的噪声可以看作是一个随机变量 $N$,则扰动后的数据 $Y=X+N$ 也是一个随机变量。假设隐私攻击者知道扰动后的数据 $Y$,则攻击者可以根据噪声分布反推出原始数据 $X$ 的概率分布。攻击者的信息熵为 $H(X|Y)$,表示在知道扰动后的数据 $Y$ 的情况下,对原始数据 $X$ 的不确定性。