频繁的工人超时

我已经设置了gunicorn与3个工人，30个工人连接和使用eventlet工人类。它被设置在Nginx后面。每请求几次，我就会在日志里看到这个。

[ERROR] gunicorn.error: WORKER TIMEOUT (pid:23475)
None
[INFO] gunicorn.error: Booting worker with pid: 23514

为什么会这样?我怎样才能知道哪里出了问题呢?

当前回答

我们在使用Django+nginx+gunicorn时也遇到了同样的问题。从Gunicorn文档中，我们配置了优雅的超时，几乎没有什么不同。

经过一些测试，我们找到了解决方案，要配置的参数是:timeout(并且不是优雅超时)。它走得像时钟一样快。

所以,做:

1)打开gunicorn配置文件

2)将TIMEOUT设置为您需要的任何值-以秒为单位

NUM_WORKERS=3
TIMEOUT=120

exec gunicorn ${DJANGO_WSGI_MODULE}:application \
--name $NAME \
--workers $NUM_WORKERS \
--timeout $TIMEOUT \
--log-level=debug \
--bind=127.0.0.1:9000 \
--pid=$PIDFILE

2014-06-19 11:52:48

其他回答

关于在Azure应用服务(Linux应用)上运行Flask Apps的Microsoft Azure官方文档声明超时时间为600

gunicorn --bind=0.0.0.0 --timeout 600 application:app

https://learn.microsoft.com/en-us/azure/app-service/configure-language-python#flask-app

2021-01-21 11:22:36

检查你的工人没有被健康检查杀死。长请求可能会阻塞健康检查请求，worker会被平台杀死，因为平台认为worker没有响应。

例如，如果您有一个25秒长的请求，并且活动检查被配置为每10秒命中同一服务中的不同端点，1秒超时，并重试3次，这就给出了10+1*3 ~ 13秒，您可以看到它会触发一些时间，但并不总是如此。

如果是这种情况，解决方案是重新配置您的活动检查(或您的平台使用的任何健康检查机制)，以便它可以等待您的典型请求完成。或者允许更多的线程——这样可以确保健康检查不会阻塞足够长的时间来触发worker kill。

你可以看到，增加更多的工人可能有助于(或隐藏)这个问题。

2022-10-10 16:01:28

我有非常相似的问题，我也尝试使用“运行服务器”，看看我是否能找到任何东西，但我所拥有的只是一个消息杀死

所以我认为这可能是资源问题，我继续给实例更多的RAM，它工作了。

2015-09-18 11:06:56

对我来说，解决方案是在我的入口点上添加——timeout 90，但它不起作用，因为我定义了两个入口点，一个在app.yaml中，另一个在Dockerfile中。我删除了未使用的入口点，并在另一个入口点添加了——timeout 90。

2019-11-20 04:17:37

会是这样吗? http://docs.gunicorn.org/en/latest/settings.html#timeout

其他的可能是你的回复时间太长或者被困在等待中。

2013-08-06 03:34:43

频繁的工人超时

推荐文章

最新文章

标签