@killa
2016-01-15T15:24:03.000000Z
字数 1485
阅读 630
课程
计算机系统安全分析
这篇文章出自NDSS2015,主要讨论了一种保护用户隐私信息在搜索引擎个性化过程中不被获取的技术。
搜索引擎已经成为我们日常生活中使用最多的WEB应用,然而在日常使用搜索引擎的过程中,会有很多由于检索关键词的二义性而导致的搜索结果的歧义。例如搜索“rock”,那么搜索引擎可能返回“石头”的搜索结果,也可能返回“滚石乐队”的搜索结果。
为了消除这种歧义性,给用户更好的企业,现在主流的搜索引擎都会根据用户过去的搜索记录来对搜索结果进行筛选和重新排序,将用户最可能想要的结果排在最前面。但是在进行搜索结果个性化化之前需要记录和获取用户的搜索日志,里面可能包含用户的一些个人隐私信息,比如最近访问过的部分网页。怎么在做到搜索结果个性化的同时又能保证用户的隐私不被侵犯是这篇文章主要解决的问题。
目前对于这个问题有两种主要解决方法:
但是这两种方法的可行性都不高。首先第一种方法可能会造成大量的网络数据传输而产生网络拥堵,况且搜索引擎提供商不能容忍自己的个性化算法被共开并放在客户端。第二种方法是现有最好的方法,但仍有很多不足之处,比如不能解决“用户链接”的安全隐患,而且需要以来一个受信任的第三方噪声库。
在这种情况下,作者提出了一种新型的方法来解决这个问题,作者提出了一种叫做Bloom Cookies的数据结构,用它来编码用户的搜索记录。这种方法实际上是上述第二种现有解决方案的改进。
Bloom Cookies实际上是一个固定长度的比特串,这个比特串每一位是一个0或1的值。下文假设这个比特串的长度为m。
要生成Bloom Cookies这个比特串,还需要k个哈希函数。k的取值由其他一些参数决定:
将一个链接编码进Bloom Cookies的方法如下:
对于一个给定的链接,判断其是否被编码进Bloom Cookies的方法是: