[关闭]
@yang12138 2023-01-13T17:41:29.000000Z 字数 2269 阅读 304

随机均匀抽奖

未分类


1 术语定义

随机均匀:每个抽奖参与者被抽中的概率是一样的。也就是如果有个参与者,奖项有个,那么每个人的中奖概率都是

随机数生成器:每次运行随机数生成器,都会等概率随机返回一个内的一个整数。不妨假设

哈希表:可以以均摊的时间复杂度进行增删查改的数据结构。

2 前言

团建的时候总监提到他在面试的时候经常问面试者的一个问题:有一个随机数生成器,需要在个人中随机均匀抽出个人,怎么做?

这个确实是一个老生常谈的面试题了,下面描述两种满足需求的算法。

3 两种算法

在描述抽奖算法之前,先描述一个重要的推论。

3.1 随机数生成器是本质相同的

这个推论的意思是,所有随机数生成器都可以在有限次数内等价转换成其他的随机数生成器。下面给出转换过程和证明:

过程:

是最小的满足的正整数。
1. 运行,可以得到一个内的随机整数
2. 如果,那么重新返回步骤1,否则进入步骤3。
3. 输出作为随机数生成器的输出。

证明:

  1. 正确性显然,略去。
  2. 步骤2跳回步骤1的概率为,故步骤1的运行次数期望,那么随机数生成器可以在期望次运行后得到一个随机数生成器。

3.2 RandomShuffle

基本每种编程语言中都会给一个shuffle接口,用于随机打乱数组的元素。其中一种可能的C++ std::random_shuffle实现是:

  1. template<class RandomIt>
  2. void random_shuffle(RandomIt be, RandomIt en) {
  3. int n = en - be;
  4. for (int i = 0; i < n; i++) {
  5. using std::swap;
  6. swap(be[i], be[G(i + 1)]);
  7. }
  8. }

那么一个简单的抽奖算法便是先对整个参与者序列进行random_shuffle,shuffle后每个参与者出现在每个位置的概率都是一样的。然后再按任意方式选出任意个中奖者即可,这样可以保证每个参与者中奖的概率是一样的。下面用数学归纳法证明这个random_shuffle的过程是随机均匀的:
1. 时,正确性显然。
2. 容易发现个参与者的shuffle和个参与者的shuffle的差异只有一步:后者在前者的基础上进行最后一次交换。那么假设个参与者进行shuffle后结果是随机均匀的(也就是每个参与者出现在每个位置的概率都是),进行第次交换后,显然第个参与者在每个位置出现的概率都是,对前个参与者来说如何呢?对这些参与者来说,被交换到第个位置的概率是,保留在原位(第次交换过后的位置)的概率是,在任意位置的概率是一样,那么可以得出前个参与者在第次交换过后出现在任意位置的概率都是
3. 根据数学归纳法,命题得证。

虽然这个算法可以被证明可以进行随机均匀抽奖,但是不管需要抽几个人,都需要次交换,有没有更快的算法?当然是有的,下面介绍一个基于哈希表的随机均匀抽奖算法。

3.3 基于哈希表的快速随机均匀抽奖算法

talk is cleap, show the code:

  1. // random pick m items from n candidates
  2. std::vector<int> RandomPick(int n, int m) {
  3. std::vector<int> result;
  4. std::unordered_map<int, int> hashmap;
  5. auto Get = [&hash_map](int k) {
  6. auto iter = hashmap.find(k);
  7. return iter == hashmap.end() ? k : iter->second;
  8. };
  9. for (int i = 0; i < m; i++, n--) {
  10. int rnd = G(n);
  11. result.push_back(Get(rnd));
  12. hashmap[rnd] = Get(n - 1);
  13. }
  14. return result;
  15. }

这个算法其实更贴合现实生活中抽奖的流程。目标是从个参与者中随机均匀抽出个中奖者,那么先随机抽出1个中奖者,随后将其移出候选池,继续随机抽,直到抽完个。所以上述代码的精髓在第12行,没看懂的读者可以细细品味。

算法的正确性已经十分显然,只要学过中学的初等概率,就可以容易证明,所以此处略去。交换次数也容易证明是次。

4 总结

根据以上算法,可以解答前言中的面试题了。首先是随机数生成器的转换,然后是具体的随机交换过程。下次面试遇到这个问题,你知道怎么秀面试官一脸了吗?

注1:以上代码均即兴编写,未经过严谨的运行测试或对输出的假设检验,如有读者发现谬误,烦请指正,万分感谢。

注2:以上推演和证明均本人所写,囿于本人水平,行文可能有不足之处,如有读者发现谬误,也烦请指正,便于本人改进,万分感谢。

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注