我有一个进程在Linux得到一个分割错误。当它失败时,我如何告诉它生成一个核心转储?


当前回答

如上所述,这里提出的真正问题是如何在未启用核心转储的系统上启用它们。这个问题在这里得到了解答。

如果您希望了解如何为挂起进程生成核心转储,那么答案是

gcore <pid>

如果gcore在您的系统上不可用,那么

kill -ABRT <pid>

不要使用kill -SEGV,因为它经常会调用信号处理程序,使诊断卡住进程更加困难

其他回答

要检查内核转储是在哪里生成的,运行:

sysctl kernel.core_pattern

or:

cat /proc/sys/kernel/core_pattern

其中%e为进程名,%t为系统时间。您可以在/etc/sysctl.conf中修改它,并通过sysctl -p重新加载。

如果没有生成核心文件(通过:sleep 10 &和killall -SIGSEGV sleep进行测试),则通过:ulimit -a检查限制。

如果你的核心文件大小有限,运行:

ulimit -c unlimited

让它无限。

然后再次测试,如果核心转储成功,你会看到“(核心转储)”分割故障指示如下:

分段故障:11(核心转储)

请参见:核心转储-但核心文件不在当前目录?


Ubuntu

在Ubuntu中,核心转储由Apport处理,可以位于/var/crash/。但是,在稳定版本中默认禁用它。

更多细节,请查看:我在哪里找到Ubuntu的核心转储?

操作系统

对于macOS,请参阅:如何在Mac OS X中生成核心转储?

这通常是足够的:

ulimit -c unlimited

注意,这不会在ssh部分之间持续存在!要添加持久性:

echo '* soft core unlimited' >> /etc/security/limits.conf

现在,如果你正在使用Ubuntu,“apport”可能正在运行。下面是检查方法:

sudo systemctl status apport.service

如果是,你可能会在以下位置之一找到核心转储:

/var/lib/apport/coredump 
/var/crash

如果您想更改核心转储的位置

确保您拥有创建文件的权限,并且该目录存在于您发送核心转储的目录中!

举个例子。注意,这将不会持续重启:

sysctl -w kernel.core_pattern=/coredumps/core-%e-%s-%u-%g-%p-%t
mkdir /coredumps

确保正在崩溃的进程有权写入该文件。最简单的方法是这样的例子:

chmod 777 /coredumps

测试内核转储是否工作

> crash.c
gcc -Wl,--defsym=main=0 crash.c
./a.out
==output== Segmentation fault (core dumped)

如果上面没有显示“核心转储”,说明有些东西不正常。

还有更多的事情可能会影响核心转储的生成。我遇到了这些问题:

转储目录必须是可写的。默认情况下,这是进程的当前目录,但是可以通过设置/proc/sys/kernel/core_pattern来改变。 在某些情况下,/proc/sys/fs/suid_dumpable中的内核值可能会阻止内核的生成。

还有更多的情况可能会阻止手册页中描述的生成- try man核心。

这取决于您使用的shell。如果使用bash,则ulimit命令控制与程序执行相关的几个设置,例如是否应该转储core。如果你输入

ulimit -c unlimited

然后这将告诉bash,它的程序可以转储任何大小的内核。如果你愿意,你可以指定一个大小,比如52M,而不是无限,但在实践中,这不应该是必要的,因为核心文件的大小可能永远不会成为你的问题。

在tcsh中,您需要输入

limit coredumpsize unlimited

Ubuntu 14.04

检查内核转储是否启用: ulimit - a 其中一行应该是: 核心文件大小(块,-c)不限 如果不是: 中~ /。在文件末尾添加ulimit -c unlimited并保存,重新运行终端。 使用调试信息构建应用程序: 在Makefile中-O0 -g 运行创建核心转储的应用程序(应该在application_name文件附近创建名为“core”的核心转储文件): 。/ application_name 在gdb下运行: GDB application_name core