分类 - Code

什么时候应该使用.eval()?我知道它应该允许我“评估我的模型”。我如何在训练时关闭它?使用.eval()的示例训练代码。

2025-04-16 09:00:03

我正在训练CNN按主题对文本进行分类。当我使用二进制交叉熵时，我得到~80%的准确率，使用分类交叉熵时，我得到~50%的准确率。我不明白为什么会这样。这是一个多类问题，这是不是意味着我必须使用分类交叉

2025-04-07 07:00:00

我已经用CNN训练了一个二元分类模型，下面是我的代码这里，我想要得到每一层的输出就像TensorFlow一样，我该怎么做呢?

2025-02-11 05:00:12

我如何初始化网络的权重和偏差(通过例如He或Xavier初始化)?

2024-11-22 08:00:02

当我用Theano或Tensorflow训练我的神经网络时，它们会在每个纪元报告一个名为“损失”的变量。我该如何解释这个变量呢?更高的损失是好是坏，或者它对我的神经网络的最终性能(准确性)意味着什么?

2024-11-18 09:35:58

为什么在训练期间需要调用zero_grad() ?

2024-11-18 10:05:58

如何在PyTorch中保存训练好的模型?我读到过:Torch.save ()/torch.load()用于保存/加载可序列化对象。model.state_dict()/model.load_state

2024-11-18 10:35:22

对于任何Keras层(层类)，有人能解释一下如何理解input_shape，单位，暗淡等之间的区别吗?例如，文档说单位指定一个层的输出形状。在神经网络的图像中，隐藏层1有4个单元。这是否直接转换为图层

2024-11-18 14:06:47

我试图调和我对lstm的理解，并在Christopher Olah在Keras中实现的这篇文章中指出。我正在关注Jason Brownlee写的关于Keras教程的博客。我最困惑的是，将数据序列重塑为

2024-11-18 14:06:59

在接下来的TensorFlow函数中，我们必须在最后一层中输入人工神经元的激活。我能理解。但我不明白为什么叫logits?这不是一个数学函数吗?

2024-11-18 14:07:16

model.eval()在pytorch中做什么?