理解“随机性”

我无法理解这个，哪个更随机？

rand()

OR:

rand() * rand()

我发现这是一个真正的脑筋急转弯，你能帮我吗？

编辑：

直觉上，我知道数学上的答案是它们是同样随机的，但我不禁想，如果你在将两者相乘时“运行随机数算法”两次，你会创建比只做一次更随机的东西。

当前回答

正如其他人已经指出的那样，这个问题很难回答，因为我们每个人的大脑中都有自己的随机性图景。

这就是为什么，我强烈建议您花一些时间阅读本网站，以更好地了解随机性：

http://www.random.org/

回到真正的问题。在这个术语中没有或多或少的随机性：

两者都只是随机出现的！

在这两种情况下-仅rand（）或rand（*rand）-情况相同：在几十亿个数字之后，序列将重复（！）。对观察者来说，它似乎是随机的，因为他不知道整个序列，但计算机没有真正的随机源，所以他也不能产生随机性。

天气是随机的吗？我们没有足够的传感器或知识来确定天气是否随机。

2013-05-17 20:26:35

其他回答

当你对随机数的组合会发生什么感到怀疑时，你可以利用你在统计理论中学到的经验。

在OP的情况下，他想知道X*X=X^2的结果是什么，其中X是沿统一[0,1]分布的随机变量。我们将使用CDF技术，因为它只是一对一映射。

由于X~Uniform[0,1]，其cdf为：fX（X）=1我们需要转换Y<-X^2，因此Y=X^2求逆x（y）：sqrt（y）=x，这给出了x作为y的函数。接下来，求导数dx/dy:d/dy（sqrt（y））=1/（2sqrt（y）

Y的分布如下：fY（Y）=fX（x（Y））|dx/dy |=1/（2 sqrt（Y）

我们还没有完成，我们必须得到Y的域，因为0<=x<1，0<=x^2<1因此Y在范围[0，1）内。如果你想检查Y的pdf是否真的是pdf，请在域中集成它：从0到1集成1/（2 sqrt（Y）），实际上，它会弹出为1。此外，请注意所述函数的形状看起来像belisarious发布的内容。

至于X1+X2+…+Xn，（其中Xi ~一致[0,1]），我们可以求助于中心极限定理，它适用于存在矩的任何分布。这就是Z检验存在的原因。

用于确定生成的pdf的其他技术包括雅可比变换（这是cdf技术的广义版本）和MGF技术。

编辑：作为澄清，请注意，我所说的是结果转换的分布，而不是其随机性。这实际上是一个单独的讨论。我实际上得到的是（rand（））^2。对于rand（）*rand（（），它要复杂得多，无论如何，这不会导致任何类型的均匀分布。

2010-10-18 14:02:34

大多数rand（）实现都有一定的周期。也就是说，在大量的调用之后，序列会重复。rand（）*rand（（）的输出序列在一半时间内重复，因此在这个意义上它“不那么随机”。

此外，如果没有仔细的构造，对随机值执行算术往往会导致较少的随机性。上面的一张海报引用了“rand（）+rand（（）+rand（）…”（例如，k倍），这实际上会倾向于rand（返回值范围的平均值的k倍。（这是一种随机行走，步数与平均值对称。）

具体来说，假设rand（）函数返回[0,1）范围内的均匀分布随机实数。（是的，这个例子允许无限精度。这不会改变结果。)您没有选择特定的语言，不同的语言可能会做不同的事情，但以下分析适用于对rand（）的任何非反常实现的修改。乘积rand（）*rand（（）也在[0,1）范围内，但不再均匀分布。事实上，乘积在区间[0,1/4）和区间[1/4,1）中的可能性一样大。更多的乘法将使结果进一步趋向于零。这使得结果更可预测。在广义上，更可预测的==更少的随机性。

几乎所有对均匀随机输入的操作序列都是非均匀随机的，从而提高了可预测性。小心的话，我们可以克服这一特性，但这样就可以更容易地在实际需要的范围内生成一个均匀分布的随机数，而不是在算术上浪费时间。

2010-10-18 04:10:06

我猜这两种方法都是随机的，尽管我的直觉会说rand（）*rand（（）不那么随机，因为它会产生更多的零。一旦一个rand（）为0，总数即为0

2010-10-18 20:32:29

两者都不是“更随机”的。

rand（）基于伪随机种子生成一组可预测的数字（通常基于当前时间，该时间总是在变化）。将序列中的两个连续数字相乘，生成一个不同但同样可预测的数字序列。

关于这是否会减少冲突，答案是否定的。它实际上会增加冲突，这是因为在0<n<1的情况下，两个数字相乘的结果。结果将是一个较小的分数，导致结果偏向频谱的低端。

一些进一步的解释。在下文中，“不可预测”和“随机”是指某人根据先前的数字猜测下一个数字的能力，即预言。

给定生成以下值列表的种子x：

0.3, 0.6, 0.2, 0.4, 0.8, 0.1, 0.7, 0.3, ...

rand（）将生成上述列表，rand（*rand）将生成：

0.18, 0.08, 0.08, 0.21, ...

这两种方法将始终为同一种子生成相同的数字列表，因此预言者同样可以预测。但是如果你看一下两个调用相乘的结果，你会发现它们都在0.3以下，尽管在原始序列中分布良好。由于两个分数相乘的影响，这些数字是有偏差的。由此产生的数字总是较小，因此更可能发生碰撞，尽管仍然无法预测。

2010-10-18 03:45:19

没有比这更随机的了。它要么是随机的，要么不是随机的。随机意味着“难以预测”。这并不意味着不确定性。如果random（）是随机的，那么random（（）和random（*random）都是随机的。就随机性而言，分布是无关紧要的。如果出现不均匀分布，则意味着某些值比其他值更有可能；它们仍然是不可预测的。由于涉及伪随机性，所以这些数字非常具有确定性。然而，在概率模型和模拟中，伪随机性通常是足够的。众所周知，使伪随机数生成器复杂化只会使其难以分析。不太可能提高随机性；它经常导致它无法通过统计测试。随机数的期望财产很重要：重复性和再现性、统计随机性、（通常）均匀分布和大周期是少数几个。关于随机数上的变换：正如有人所说，两个或多个均匀分布的和产生正态分布。这是加法中心极限定理。无论源分布如何，只要所有分布都是独立和相同的，它都适用。乘性中心极限定理表示两个或多个独立且一致分布的随机变量的乘积是对数正态的。其他人创建的图形看起来是指数型的，但实际上是对数正态的。因此random（）*random（（）是对数正态分布的（尽管它可能不是独立的，因为数字是从同一个流中提取的）。这在某些应用中可能是期望的。然而，通常最好生成一个随机数并将其转换为对数正态分布数。Random（）*Random（）可能很难分析。

欲了解更多信息，请访问www.performorama.org查阅我的书。这本书正在建设中，但相关材料已经存在。请注意，章节和章节编号可能会随时间而变化。第8章（概率论）——第8.3.1和8.3.3节，第10章（随机数）。

2011-06-02 18:15:53

理解“随机性”

推荐文章

最新文章

标签