训练神经网络时的Epoch vs Iteration

训练多层感知器时，历元和迭代的区别是什么?

当前回答

时代对整个数据集进行完整的训练，使得每个例子已经见过一次了。因此，一个epoch表示N/batch 大小训练迭代，其中N是的总数的例子。迭代在训练过程中对模型权重的一次更新。迭代包括计算参数的梯度对于单批数据的损失。

奖金:

批处理在一次迭代中使用的示例集(即一个梯度) 更新)的模型训练。请参见批大小。

来源:https://developers.google.com/machine-learning/glossary/

2019-09-01 16:23:11

其他回答

我认为迭代相当于批SGD中的单批正向+反向。Epoch将遍历整个数据集一次(正如其他人提到的那样)。

2015-06-16 20:55:20

在神经网络术语中:

一个epoch =所有训练示例的一个向前传递和一个向后传递批大小=一次向前/向后传递中训练示例的数量。批处理大小越大，所需的内存空间就越大。迭代次数=通过次数，每次通过使用[批大小]示例的数量。需要明确的是，一次传球=一次向前传球+一次向后传球(我们不把向前传球和向后传球算作两次不同的传球)。

例如:如果你有1000个训练样本，你的批处理大小是500，那么将需要2次迭代来完成1个epoch。

供参考:权衡批大小和迭代次数来训练神经网络

术语“批处理”是模棱两可的:有些人用它来表示整个训练集，有些人用它来指代一次向前/向后传递中的训练示例的数量(就像我在这个回答中所做的那样)。为了避免这种歧义，并明确batch对应于一次正向/向后传递中训练示例的数量，可以使用术语mini-batch。

2015-08-05 21:14:23

要理解它们之间的区别，你必须理解梯度下降算法及其变体。

在我开始回答这个问题之前，我想先了解一下背景。

批处理是完整的数据集。它的大小是可用数据集中训练示例的总数。

小批量大小是学习算法在单次传递(向前和向后)中处理的示例数量。

迷你批是给定迷你批大小的数据集的一小部分。

迭代是算法已经看到的数据批次的数量(或者简单地说，算法已经在数据集上完成的次数)。

epoch是一个学习算法看到完整数据集的次数。现在，这可能不等于迭代的次数，因为数据集也可以小批量处理，本质上，一次传递可能只处理数据集的一部分。在这种情况下，迭代的数量不等于epoch的数量。

在批处理梯度下降的情况下，整个批处理在每个训练通过。因此，梯度下降优化器的收敛比Mini-batch梯度下降更平滑，但需要更多的时间。如果存在最优条件，分批梯度下降法保证能找到最优条件。

随机梯度下降是小批量梯度下降的一种特殊情况，其中小批量大小为1。

2019-04-09 12:52:02

根据我的理解，当你需要训练一个NN时，你需要一个包含许多数据项的大型数据集。在训练神经网络时，数据项一个一个地进入神经网络，这称为迭代;当整个数据集通过时，它被称为epoch。

2012-01-06 22:41:25

Epoch is 1 complete cycle where the Neural network has seen all the data. One might have said 100,000 images to train the model, however, memory space might not be sufficient to process all the images at once, hence we split training the model on smaller chunks of data called batches. e.g. batch size is 100. We need to cover all the images using multiple batches. So we will need 1000 iterations to cover all the 100,000 images. (100 batch size * 1000 iterations) Once Neural Network looks at the entire data it is called 1 Epoch (Point 1). One might need multiple epochs to train the model. (let us say 10 epochs).

2019-09-23 22:58:25

训练神经网络时的Epoch vs Iteration

推荐文章

最新文章

标签