理解“随机性”

我无法理解这个，哪个更随机？

rand()

OR:

rand() * rand()

我发现这是一个真正的脑筋急转弯，你能帮我吗？

编辑：

直觉上，我知道数学上的答案是它们是同样随机的，但我不禁想，如果你在将两者相乘时“运行随机数算法”两次，你会创建比只做一次更随机的东西。

当前回答

用更离散的数字来考虑可能会有所帮助。考虑一下要生成1到36之间的随机数，所以您决定最简单的方法是投掷两个公平的6面骰子。你得到了这个：

     1    2    3    4    5    6
  -----------------------------
1|   1    2    3    4    5    6
2|   2    4    6    8   10   12
3|   3    6    9   12   15   18
4|   4    8   12   16   20   24   
5|   5   10   15   20   25   30
6|   6   12   18   24   30   36

所以我们有36个数字，但并不是所有数字都得到了公平的表示，有些数字根本没有出现。靠近中心对角线（左下角到右上角）的数字将以最高频率出现。

描述骰子之间不公平分布的相同原则同样适用于0.0和1.0之间的浮点数。

2010-10-18 20:25:07

其他回答

关于“随机性”的一些事情是反直觉的。

假设rand（）的平面分布，下面将得到非平面分布：

高偏差：sqrt（rand（范围^2））中间偏差峰值：（rand（range）+rand（range））/2低：偏差：范围-sqrt（rand（范围^2））

有很多其他方法可以创建特定的偏置曲线。我对rand（）*rand（（）做了一个快速测试，它得到了一个非常非线性的分布。

2010-10-18 04:03:57

你要寻找的概念是“熵”，即弦的无序程度位。从“最大熵”的概念来看，这个概念最容易理解。

具有最大熵的比特串的一个近似定义是，它不能用更短的比特串来精确表达（即，使用某种算法将较小的字符串扩展回原始字符串）。

最大熵与随机性的相关性源于以下事实：如果你“随机”选择一个数字，你几乎肯定会选择一个其比特串接近于具有最大熵，也就是说，它不能被压缩。这是我们对“随机”数特征的最好理解。

所以，如果你想从两个随机样本中产生一个随机数，它是随机，将两个位字符串连接在一起。实际上，你只是将样本填充到双倍长度单词的高半部分和低半部分。

从更实际的角度来看，如果你发现自己背负着一个蹩脚的rand（），它可以有时有助于将两个样本混合在一起——尽管，如果真的是盈亏平衡的话那个程序没用。

2010-10-18 19:01:15

假设你有一个简单的硬币翻转问题，偶数被认为是正面，奇数被认为是反面。逻辑实现是：

rand() mod 2

在足够大的分布范围内，偶数的数量应该等于奇数的数量。

现在考虑一个小小的调整：

rand() * rand() mod 2

如果其中一个结果是偶数，那么整个结果应该是偶数。考虑4种可能的结果（偶*偶=偶，偶*奇=偶，奇*偶=偶数，奇*奇=奇数）。现在，在足够大的分布范围内，答案应该是75%的时间。

如果我是你，我敢打赌。

这条评论实际上更多的是解释为什么不应该基于您的方法实现自定义随机函数，而不是讨论随机性的数学财产。

2010-10-18 23:13:33

大多数rand（）实现都有一定的周期。也就是说，在大量的调用之后，序列会重复。rand（）*rand（（）的输出序列在一半时间内重复，因此在这个意义上它“不那么随机”。

此外，如果没有仔细的构造，对随机值执行算术往往会导致较少的随机性。上面的一张海报引用了“rand（）+rand（（）+rand（）…”（例如，k倍），这实际上会倾向于rand（返回值范围的平均值的k倍。（这是一种随机行走，步数与平均值对称。）

具体来说，假设rand（）函数返回[0,1）范围内的均匀分布随机实数。（是的，这个例子允许无限精度。这不会改变结果。)您没有选择特定的语言，不同的语言可能会做不同的事情，但以下分析适用于对rand（）的任何非反常实现的修改。乘积rand（）*rand（（）也在[0,1）范围内，但不再均匀分布。事实上，乘积在区间[0,1/4）和区间[1/4,1）中的可能性一样大。更多的乘法将使结果进一步趋向于零。这使得结果更可预测。在广义上，更可预测的==更少的随机性。

几乎所有对均匀随机输入的操作序列都是非均匀随机的，从而提高了可预测性。小心的话，我们可以克服这一特性，但这样就可以更容易地在实际需要的范围内生成一个均匀分布的随机数，而不是在算术上浪费时间。

2010-10-18 04:10:06

大多数这种分布发生是因为你必须限制或规范随机数。

我们将其标准化为全部为正，符合范围，甚至符合指定变量类型的内存大小限制。

换句话说，因为我们必须将随机调用限制在0和X之间（X是变量的大小限制），所以我们将有一组介于0和X的“随机”数。

现在，当你将随机数与另一个随机数相加时，总和将介于0和2X之间。。。这会使值偏离边缘点（当两个随机数在较大范围内时，将两个小数字相加和将两个大数字相加的概率非常小）。

想象一下这样一个例子，你有一个接近于零的数字，你将它与另一个随机数相加，它肯定会变大，远离0（这对于大数字是正确的，因为随机函数不可能两次返回两个大数字（接近于X的数字）。

现在，如果你用负数和正数设置随机方法（跨越零轴），情况将不再如此。

例如，假设RandomReal（{-x，x}，50000，.01），那么你会得到负数和正数的偶数分布，如果你将随机数相加，它们将保持其“随机性”。

现在我不确定Random（）*Random（（）从负到正的跨度会发生什么。。。这将是一个有趣的图表。。。但我现在得回去写代码了-P

2010-10-18 16:47:48

理解“随机性”

推荐文章

最新文章

标签