偏差在神经网络中的作用是什么?

我知道梯度下降和反向传播算法。我不明白的是:什么时候使用偏见是重要的，你如何使用它?

例如，在映射AND函数时，当我使用两个输入和一个输出时，它不会给出正确的权重。然而，当我使用三个输入(其中一个是偏差)时，它给出了正确的权重。

当前回答

简单来说，偏差允许学习/存储越来越多的权重变化……(注:有时给出一些阈值)。无论如何，更多的变化意味着偏差为模型的学习/存储权重添加了更丰富的输入空间表示。(更好的权重可以增强神经网络的猜测能力)

例如，在学习模型中，假设/猜测在给定输入的情况下被y=0或y=1所限制，可能是在某个分类任务中……例如，对于某些x=(1,1)，有些y=0，对于某些x=(0,1)，有些y=1。(假设/结果的条件是我上面谈到的阈值。注意，我的示例设置输入X为每个X =一个双值或2值向量，而不是Nate的某个集合X的单值X输入)。

如果我们忽略偏差，许多输入可能最终由许多相同的权重表示(即学习的权重大多出现在原点附近(0,0)。这样，模型就会被限制在较差的好权重上，而不是在有偏差的情况下更好地学习更多的好权重。(学习不好的权重会导致更差的猜测或神经网络的猜测能力下降)

因此，模型既要在靠近原点的地方学习，又要在阈值/决策边界内尽可能多的地方学习，这是最优的。有了偏差，我们可以使自由度接近原点，但不限于原点的直接区域。

2017-11-05 03:55:24

其他回答

简单来说，如果你有y=w1*x，其中y是你的输出，w1是权重，想象一个条件，x=0，那么y=w1*x等于0。

如果你想要更新你的权重，你必须计算delw=target-y的变化量，其中target是你的目标输出。在这种情况下，'delw'将不会改变，因为y被计算为0。所以，假设你可以添加一些额外的值，这将有助于y = w1x + w01，其中偏差=1，权重可以调整以获得正确的偏差。考虑下面的例子。

就直线斜率而言，截距是线性方程的一种特殊形式。

Y = mx + b

检查图像

图像

这里b是(0,2)

如果你想把它增加到(0,3)你怎么通过改变b的值来实现呢?

2017-04-24 16:55:24

如果您正在处理图像，实际上可能更喜欢完全不使用偏置。从理论上讲，这样你的网络将更独立于数据量，比如图片是暗的，还是亮的和生动的。网络将通过研究你的数据中的相对性来学习它的工作。很多现代神经网络都利用了这一点。

对于其他有偏差的数据可能是至关重要的。这取决于你要处理什么类型的数据。如果您的信息是大小不变的——如果输入[1,0,0.1]应该会导致与输入[100,0,10]相同的结果，那么没有偏差可能会更好。

2016-09-20 19:55:33

Two different kinds of parameters can be adjusted during the training of an ANN, the weights and the value in the activation functions. This is impractical and it would be easier if only one of the parameters should be adjusted. To cope with this problem a bias neuron is invented. The bias neuron lies in one layer, is connected to all the neurons in the next layer, but none in the previous layer and it always emits 1. Since the bias neuron emits 1 the weights, connected to the bias neuron, are added directly to the combined sum of the other weights (equation 2.1), just like the t value in the activation functions.1

它不实用的原因是，您同时调整权重和值，因此对权重的任何更改都会抵消对先前数据实例有用的值的更改……在不改变值的情况下添加偏置神经元可以让你控制层的行为。

此外，偏差允许您使用单个神经网络来表示类似的情况。考虑由以下神经网络表示的AND布尔函数:

(来源:aihorizon.com)

W0对应于b。 W1对应x1。 W2对应于x2。

A single perceptron can be used to represent many boolean functions. For example, if we assume boolean values of 1 (true) and -1 (false), then one way to use a two-input perceptron to implement the AND function is to set the weights w0 = -3, and w1 = w2 = .5. This perceptron can be made to represent the OR function instead by altering the threshold to w0 = -.3. In fact, AND and OR can be viewed as special cases of m-of-n functions: that is, functions where at least m of the n inputs to the perceptron must be true. The OR function corresponds to m = 1 and the AND function to m = n. Any m-of-n function is easily represented using a perceptron by setting all input weights to the same value (e.g., 0.5) and then setting the threshold w0 accordingly. Perceptrons can represent all of the primitive boolean functions AND, OR, NAND ( 1 AND), and NOR ( 1 OR). Machine Learning- Tom Mitchell)

阈值是偏置，w0是与偏置/阈值神经元相关的权重。

2010-03-19 21:38:55

偏差不是一个神经网络项。这是一个通用的代数术语。

Y = M*X + C(直线方程)

现在如果C(Bias) = 0，那么这条线将始终经过原点，即(0,0)，并且只依赖于一个参数，即M，这是斜率，所以我们有更少的东西可以处理。

C，也就是偏置取任意数，都能移动图形，因此能够表示更复杂的情况。

在逻辑回归中，目标的期望值通过链接函数进行转换，以限制其值为单位区间。这样，模型预测可以被视为主要结果概率，如下所示:

Wikipedia上的Sigmoid函数

这是神经网络映射中打开和关闭神经元的最后一个激活层。在这里，偏差也发挥了作用，它灵活地平移曲线，帮助我们绘制模型。

2017-03-13 01:08:14

单独修改神经元WEIGHTS只用于操纵传递函数的形状/曲率，而不是它的平衡/零交叉点。

引入偏置神经元允许您沿着输入轴水平(左/右)移动传递函数曲线，同时保持形状/曲率不变。这将允许网络产生不同于默认值的任意输出，因此您可以自定义/移动输入到输出映射以满足您的特定需求。