理解“随机性”

我无法理解这个，哪个更随机？

rand()

OR:

rand() * rand()

我发现这是一个真正的脑筋急转弯，你能帮我吗？

编辑：

直觉上，我知道数学上的答案是它们是同样随机的，但我不禁想，如果你在将两者相乘时“运行随机数算法”两次，你会创建比只做一次更随机的东西。

当前回答

很容易证明两个随机数之和不一定是随机的。假设你有一个6面骰子。每个数字有1/6的机会出现。现在假设你有2个骰子，并将结果相加。这些总数的分布不是1/12。为什么？因为某些数字比其他数字更多。它们有多个分区。例如，数字2仅是1+1的和，但7可以由3+4、4+3或5+2等组成，因此它出现的机会更大。

因此，在本例中，对随机函数应用变换（在这种情况下为加法）不会使其更随机，或必然保持随机性。在上述骰子的情况下，分布偏向于7，因此随机性较小。

2011-09-26 04:20:35

其他回答

强制性的xkcd。。。

2010-10-18 20:36:17

这不是很明显，但rand（）通常比rand（*rand）更随机。重要的是，对于大多数用途来说，这实际上不是很重要。

但首先，它们产生了不同的分布。如果这是你想要的，这不是问题，但这很重要。如果你需要一个特定的分布，那么忽略整个“哪个更随机”的问题。那么为什么rand（）更随机呢？

rand（）之所以更随机（假设它产生的是[0..1]范围内的浮点随机数，这是非常常见的）的核心是，当你将两个FP数与尾数中的大量信息相乘时，你会在结尾处丢失一些信息；IEEE双精度浮点中没有足够的位来保存从[0..1]中均匀随机选择的两个IEEE双精度浮点数中的所有信息，这些额外的信息位将丢失。当然，这无关紧要，因为你（可能）不会使用这些信息，但损失是真实的。您产生哪种分布（即，使用哪种操作进行组合）也并不重要。这些随机数中的每一个都有（最多）52位随机信息——这就是IEEE双精度的容量——如果你将两个或多个随机数合并为一个，那么你仍然只能拥有最多52位的随机信息。

大多数随机数的使用甚至没有使用随机源中实际可用的那么多随机性。得到一个好的PRNG，不要太担心它。（“好”的程度取决于你在用它做什么；你在做蒙特卡洛模拟或密码学时必须小心，否则你可能会使用标准PRNG，因为这通常要快得多。）

2010-10-19 10:51:18

“随机”与“更随机”有点像问哪个零更为零。

在这种情况下，rand是PRNG，所以不是完全随机的。（事实上，如果种子是已知的，那是完全可以预测的）。将其乘以另一个值，使其不再随机。

真正的加密类型RNG实际上是随机的。通过任何类型的函数运行值都不能增加更多的熵，而且很可能会删除熵，使其不再随机。

2010-10-18 03:45:09

两者都不是“更随机”的。

rand（）基于伪随机种子生成一组可预测的数字（通常基于当前时间，该时间总是在变化）。将序列中的两个连续数字相乘，生成一个不同但同样可预测的数字序列。

关于这是否会减少冲突，答案是否定的。它实际上会增加冲突，这是因为在0<n<1的情况下，两个数字相乘的结果。结果将是一个较小的分数，导致结果偏向频谱的低端。

一些进一步的解释。在下文中，“不可预测”和“随机”是指某人根据先前的数字猜测下一个数字的能力，即预言。

给定生成以下值列表的种子x：

0.3, 0.6, 0.2, 0.4, 0.8, 0.1, 0.7, 0.3, ...

rand（）将生成上述列表，rand（*rand）将生成：

0.18, 0.08, 0.08, 0.21, ...

这两种方法将始终为同一种子生成相同的数字列表，因此预言者同样可以预测。但是如果你看一下两个调用相乘的结果，你会发现它们都在0.3以下，尽管在原始序列中分布良好。由于两个分数相乘的影响，这些数字是有偏差的。由此产生的数字总是较小，因此更可能发生碰撞，尽管仍然无法预测。

2010-10-18 03:45:19

浮动随机数通常基于一种算法，该算法产生一个介于零和一定范围之间的整数。因此，通过使用rand（）*rand（（），您实际上是在说int_rand（）*int_rand（）/rand_max ^2-这意味着您排除了任何素数/rand_max^2。

这显著改变了随机分布。

rand（）在大多数系统中都是均匀分布的，如果正确播种，很难预测。除非你有特殊的理由对其进行数学运算（例如，将分布成形为所需的曲线），否则使用该方法。

2010-10-18 05:38:42

理解“随机性”

推荐文章

最新文章

标签