我的应用程序在Linux上作为后台进程运行。它目前在终端窗口的命令行中启动。
最近,一个用户正在执行应用程序一段时间,它神秘地死亡了。文本:
杀了
在终端机上。这样发生了两次。我问是否有人在不同的终端使用kill命令杀死进程?不。
在什么情况下Linux会决定终止我的进程?我相信shell显示“已杀”是因为进程在接收到kill(9)信号后死亡。如果Linux发送了终止信号,系统日志中是否应该有一条消息解释为什么它被终止?
我的应用程序在Linux上作为后台进程运行。它目前在终端窗口的命令行中启动。
最近,一个用户正在执行应用程序一段时间,它神秘地死亡了。文本:
杀了
在终端机上。这样发生了两次。我问是否有人在不同的终端使用kill命令杀死进程?不。
在什么情况下Linux会决定终止我的进程?我相信shell显示“已杀”是因为进程在接收到kill(9)信号后死亡。如果Linux发送了终止信号,系统日志中是否应该有一条消息解释为什么它被终止?
当前回答
在我的例子中,这发生在一个Laravel队列工作者身上。系统日志没有提到任何杀死,所以我进一步查看,结果发现工作人员基本上是在杀死自己,因为一个作业超出了内存限制(默认设置为128M)。
使用——timeout=600和——memory=1024运行队列工作器为我解决了这个问题。
其他回答
如果用户或系统管理员没有杀死内核可能已经杀死的程序。内核只会在特殊情况下终止进程,比如资源极度匮乏(比如mem+swap耗尽)。
在我的例子中,这发生在一个Laravel队列工作者身上。系统日志没有提到任何杀死,所以我进一步查看,结果发现工作人员基本上是在杀死自己,因为一个作业超出了内存限制(默认设置为128M)。
使用——timeout=600和——memory=1024运行队列工作器为我解决了这个问题。
在lsf环境中(交互式或其他),如果应用程序的内存利用率超过了队列上的管理员预先设定的阈值,或者提交给队列的资源请求,那么进程将被杀死,这样其他用户就不会成为潜在运行的受害者。当它这样做时,它并不总是发送电子邮件,这取决于它的设置方式。
在这种情况下,一种解决方案是找到具有更大资源的队列,或者在提交中定义更大的资源需求。
你可能还想复习man ulimit
虽然我不记得导致了死亡,但我需要它已经有一段时间了。
PAM模块限制资源导致了您所描述的结果:我的进程神秘地死亡,控制台窗口上的文本为Killed。没有日志输出,无论是syslog还是kern.log。顶部程序帮助我发现,在CPU使用一分钟后,我的进程就会被杀死。
正如dwc和Adam Jaskiewicz所说,罪魁祸首很可能是OOM杀手。然而,接下来的问题是:我如何预防这种情况?
有几种方法:
如果可以的话,给你的系统更多的内存(如果是虚拟机,这很简单) 确保OOM杀手选择不同的进程。 禁用OOM杀手 选择一个禁用OOM杀手的Linux发行版。
多亏了这篇文章,我发现(2)特别容易实现。