说明: 国外文章,全英文的,摘要:我们提出了一种实用的差分私有算法,用于回答高维数据集中的大量查询。与此任务的所有算法一样,我们的算法在数据维数上必然具有最坏情况下的复杂度指数。然而,我们的算法将计算困难的步骤打包成一个简洁定义的整数程序,这可以解决非私人使用标准的解决方案。我们证明了算法的准确性和保密性定理,并通过实验证明了算法的有效性。例如,我们的算法可以高效、准确地回答Netflix数据集上的数百万个查询,该数据集拥有17,000多个属性;这是对技术水平的几个数量级的改进。
<weixin_42716010> 上传 | 大小:478kb