RockyLinux内核崩溃分析（手把手教你排查系统宕机原因）

来源：这里教程网时间：2026-03-14 20:32:45 作者：

当你的 RockyLinux 服务器突然宕机、无响应或自动重启时，很可能遭遇了内核崩溃（Kernel Panic）。这种情况对系统管理员来说非常棘手，但别担心！本文将带你从零开始，详细讲解如何进行 RockyLinux内核崩溃分析，即使是 Linux 新手也能轻松上手。

什么是内核崩溃？

内核崩溃是指 Linux 内核在运行过程中遇到无法恢复的严重错误，导致系统停止响应。此时，系统通常会打印“Kernel panic - not syncing”等信息，并可能自动重启。

第一步：启用 kdump 服务

要分析内核崩溃，首先需要捕获崩溃时的内存快照，这依赖于

kdump

服务。它会在内核崩溃时生成一个名为

vmcore

的转储文件。

1. 安装 kexec-tools：

sudo dnf install -y kexec-tools

2. 启用并启动 kdump 服务：

sudo systemctl enable kdumpsudo systemctl start kdump

默认情况下，

vmcore

文件会保存在

/var/crash/

目录下。

第二步：安装 crash 和 debuginfo 工具

分析

vmcore

需要使用

crash

工具，同时还需要对应内核版本的调试符号（debuginfo）。

1. 安装 crash 工具：

sudo dnf install -y crash

2. 启用 debuginfo 仓库并安装内核调试包：

sudo dnf config-manager --set-enabled debuginfosudo dnf install -y kernel-debuginfo-$(uname -r)

注意：

$(uname -r)

会自动替换为你当前运行的内核版本。

第三步：使用 crash 分析 vmcore

假设你的崩溃文件位于

/var/crash/12345678/vmcore

，对应的内核镜像为

/boot/vmlinuz-$(uname -r)

。

运行以下命令启动 crash 分析环境：

crash /usr/lib/debug/lib/modules/$(uname -r)/vmlinux \ /var/crash/12345678/vmcore

进入 crash 命令行后，你可以使用多种命令查看崩溃信息：

bt

：查看崩溃时的堆栈回溯（backtrace）

log

：查看内核日志

ps

：列出所有进程状态

sys

：显示系统信息

例如，输入

bt

可以看到导致崩溃的函数调用链：

crash> btPID: 1234 TASK: ffff9f1234567890 CPU: 2 COMMAND: "kworker/u16:3" #0 [ffff9f1234567abc] __schedule at ffffffff98a12345 #1 [ffff9f1234567def] schedule at ffffffff98a123ab #2 [ffff9f1234567ghi] worker_thread at ffffffff98b234cd ...

常见问题与技巧

- 如果

kdump

无法启动，可能是预留内存不足。编辑

/etc/default/grub

，在

GRUB_CMDLINE_LINUX

中添加

crashkernel=auto

或指定值如

crashkernel=512M

，然后运行

grub2-mkconfig -o /boot/grub2/grub.cfg

并重启。

- 若找不到对应版本的

kernel-debuginfo

，请确认你已启用正确的 debuginfo 仓库，并确保系统已更新到最新内核。

总结

通过本文，你已经掌握了 RockyLinux内核崩溃分析 的完整流程：从启用 kdump、安装调试工具，到使用 crash工具使用 技术深入分析 内核转储文件分析。这些技能对于保障生产环境稳定性至关重要。记住，每一次崩溃都是系统在“说话”，学会倾听它，你就能成为更强大的 Linux 系统守护者！

关键词回顾：RockyLinux内核崩溃分析、Linux内核调试、crash工具使用、内核转储文件分析