分类 - Code

如果我想在Keras中使用BatchNormalization函数，那么我只需要在开始时调用它一次吗?我阅读了它的文档:http://keras.io/layers/normalization/我不知

2025-05-10 07:00:00

我正在训练CNN按主题对文本进行分类。当我使用二进制交叉熵时，我得到~80%的准确率，使用分类交叉熵时，我得到~50%的准确率。我不明白为什么会这样。这是一个多类问题，这是不是意味着我必须使用分类交叉

2025-04-07 07:00:00

在神经网络的输出层，典型的是使用softmax函数来近似一个概率分布:因为指数的缘故，计算起来很费钱。为什么不简单地执行Z变换，使所有输出都是正的，然后通过将所有输出除以所有输出的和来归一化?

2025-02-26 08:00:06

最初的问题是关于TensorFlow具体实现的。但是，这些答案一般适用于实现。这个一般答案也是TensorFlow的正确答案。当在TensorFlow中使用批处理归一化和dropout(特别是使用co

2025-01-26 08:00:02

我如何初始化网络的权重和偏差(通过例如He或Xavier初始化)?

2024-11-22 08:00:02

当我用Theano或Tensorflow训练我的神经网络时，它们会在每个纪元报告一个名为“损失”的变量。我该如何解释这个变量呢?更高的损失是好是坏，或者它对我的神经网络的最终性能(准确性)意味着什么?

2024-11-18 09:35:58

为什么在训练期间需要调用zero_grad() ?

2024-11-18 10:05:58

我试图在Haskell中实现一个神经网络架构，并在MNIST上使用它。我在线性代数中使用hmatrix包。我的训练框架是使用pipes包构建的。我的代码编译并没有崩溃。但问题是，某些层大小(比如100

2024-11-18 10:21:39

ANN(人工神经网络)和SVM(支持向量机)是监督机器学习和分类的两种流行策略。对于一个特定的项目，通常不清楚哪种方法更好，我确定答案总是“视情况而定”。通常，两者结合使用贝叶斯分类。这些关于Stac

2024-11-18 14:06:01

对于任何Keras层(层类)，有人能解释一下如何理解input_shape，单位，暗淡等之间的区别吗?例如，文档说单位指定一个层的输出形状。在神经网络的图像中，隐藏层1有4个单元。这是否直接转换为图层

2024-11-18 14:06:47

我在哪里调用Keras的BatchNormalization函数?