在现代 IT 基础设施中,系统的高可用性(High Availability, HA)至关重要。本文将带你从零开始,在 RockyLinux 系统上搭建一套高可用监控系统,结合 Keepalived 实现 VIP 漂移,再配合 Prometheus 监控服务,确保即使一台服务器宕机,监控服务依然持续运行。无论你是运维新手还是有一定经验的工程师,都能轻松上手!

一、准备工作
你需要两台 RockyLinux 服务器(建议使用 RockyLinux 8 或 9),并确保以下条件:
两台服务器网络互通,能互相 ping 通 拥有 root 权限或 sudo 权限 关闭防火墙(或开放相应端口),本教程为简化操作,建议临时关闭:sudo systemctl stop firewalld && sudo systemctl disable firewalld 时间同步(建议配置 chrony 或 ntp)二、安装 Keepalived 实现 VIP 高可用
Keepalived 是实现 VRRP 协议的轻量级工具,常用于实现虚拟 IP(VIP)的自动漂移。
1. 在两台服务器上安装 Keepalived
sudo dnf install -y keepalived
2. 配置主节点(Master)
编辑配置文件
/etc/keepalived/keepalived.conf
:sudo cat > /etc/keepalived/keepalived.conf <
3. 配置备节点(Backup)
在第二台服务器上,创建类似的配置,但注意修改
state
和 priority
:sudo cat > /etc/keepalived/keepalived.conf <
4. 启动 Keepalived 服务
在两台服务器上执行:
sudo systemctl enable --now keepalived
此时,你应该能在主节点上看到 VIP(192.168.1.100)已绑定。可通过
ip addr show
查看。三、部署 Prometheus 监控服务
接下来,我们在两台服务器上都部署 Prometheus,但只通过 VIP 对外提供服务。
1. 下载并安装 Prometheus
cd /tmpwget https://github.com/prometheus/prometheus/releases/download/v2.45.0/prometheus-2.45.0.linux-amd64.tar.gztar xvfz prometheus-*.tar.gzsudo mv prometheus-* /opt/prometheus
2. 创建 systemd 服务
sudo tee /etc/systemd/system/prometheus.service <
3. 启动 Prometheus
sudo systemctl daemon-reloadsudo systemctl enable --now prometheus
现在,你可以通过浏览器访问
http://192.168.1.100:9090
(即 VIP 地址)来使用 Prometheus。当主节点宕机时,VIP 会自动漂移到备节点,监控服务不会中断。四、验证高可用性
你可以通过以下方式测试高可用是否生效:
在主节点执行 sudo systemctl stop keepalived
观察备节点是否接管 VIP(使用 ip addr show
) 刷新浏览器,确认 Prometheus 仍可访问五、总结
通过本教程,你已经成功在 RockyLinux 上搭建了一套高可用监控系统。这套方案结合了 Keepalived 的 VIP 漂移能力和 Prometheus 强大的监控功能,是构建企业级监控平台的基础。
记住,真正的高可用不仅在于技术实现,更在于日常的演练和监控。建议定期测试故障切换流程,确保关键时刻万无一失。
希望这篇关于 RockyLinux高可用监控 的教程对你有帮助!如果你有任何问题,欢迎在评论区留言交流。
