偏差在神经网络中的作用是什么?

我知道梯度下降和反向传播算法。我不明白的是:什么时候使用偏见是重要的，你如何使用它?

例如，在映射AND函数时，当我使用两个输入和一个输出时，它不会给出正确的权重。然而，当我使用三个输入(其中一个是偏差)时，它给出了正确的权重。

当前回答

下面是一些进一步的插图，展示了一个简单的2层前馈神经网络在一个双变量回归问题上的结果。权重被随机初始化，并使用标准的ReLU激活。正如我前面的答案所总结的那样，没有偏差，relu网络无法在(0,0)处偏离零。

其他回答

在神经网络中:

每个神经元都有一个偏向您可以将偏差视为阈值(通常是阈值的相反值) 输入层的加权和+偏置决定神经元的激活偏差增加了模型的灵活性。

在没有偏差的情况下，仅考虑来自输入层的加权和可能不会激活神经元。如果神经元没有被激活，来自该神经元的信息就不会通过神经网络的其余部分传递。

偏见的价值是可以学习的。

实际上，bias = - threshold。你可以把偏差想象成让神经元输出1有多容易，如果偏差很大，神经元输出1很容易，但如果偏差很大，就很难了。

总而言之:偏置有助于控制激活函数的触发值。

观看这段视频了解更多细节。

一些更有用的链接:

Geeksforgeeks

走向数据科学

当您使用ann时，您很少了解您想要学习的系统的内部结构。有些东西没有偏见是学不来的。例如，看一下下面的数据:(0,1)，(1,1)，(2,1)，基本上是一个将任何x映射到1的函数。

如果你有一个单层网络(或线性映射)，你无法找到解决方案。然而，如果你有偏见，那就无关紧要了!

在理想情况下，偏差还可以将所有点映射到目标点的平均值，并让隐藏的神经元模拟该点的差异。

扩展zfy的解释:

一个输入，一个神经元，一个输出的方程如下:

y = a * x + b * 1    and out = f(y)

其中x是输入节点的值，1是偏置节点的值; Y可以直接作为输出，也可以传递给一个函数，通常是一个sigmoid函数。还要注意，偏差可以是任何常数，但为了使一切更简单，我们总是选择1(可能这太常见了，zfy没有显示和解释它)。

你的网络试图学习系数a和b来适应你的数据。所以你可以看到为什么添加元素b * 1可以让它更好地适应更多的数据:现在你可以改变斜率和截距。

如果你有一个以上的输入，你的方程将是这样的:

y = a0 * x0 + a1 * x1 + ... + aN * 1

请注意，这个方程仍然描述一个神经元，一个输出网络;如果你有更多的神经元，你只需在系数矩阵中增加一个维度，将输入相乘到所有节点，然后将每个节点的贡献相加。

可以写成向量化的形式

A = [a0, a1, .., aN] , X = [x0, x1, ..., 1]
Y = A . XT

即，将系数放在一个数组中，(输入+偏差)放在另一个数组中，你就有了你想要的解决方案，作为两个向量的点积(你需要转置X的形状是正确的，我写了XT a 'X转置')

所以最后你也可以看到你的偏差只是一个输入来代表输出的那部分实际上是独立于你的输入的。

在我研究的所有ML书籍中，W总是被定义为两个神经元之间的连通性指数，这意味着两个神经元之间的连通性更高。

放电神经元向目标神经元或Y = w * X传递的信号越强，为了保持神经元的生物学特性，我们需要保持1 >= w >= -1，但在实际回归中，w最终会变成| w | >=1，这与神经元的工作方式相矛盾。

因此，我提出W = cos(theta)，而1 >= |cos(theta)|， Y= a * X = W * X + b而a = b + W = b + cos(theta)， b是一个整数。

推荐文章