在现代IT基础设施中,RockyLinux运维监控是保障系统稳定、安全和高效运行的关键环节。无论你是刚入门的运维新手,还是希望优化现有监控体系的工程师,本文将手把手教你如何在RockyLinux上搭建一套完整、实用的服务器性能监控体系。

一、为什么需要监控?
监控可以帮助我们:
实时掌握CPU、内存、磁盘、网络等资源使用情况 提前发现潜在故障,避免服务中断 分析历史性能数据,优化系统配置 满足合规与审计要求二、RockyLinux基础环境准备
首先确保你的RockyLinux系统是最新的:
sudo dnf update -ysudo dnf install epel-release -y
三、选择合适的监控工具
对于初学者,推荐使用以下开源组合:
Prometheus:时序数据库,用于采集和存储指标 Node Exporter:采集主机系统指标(CPU、内存、磁盘等) Grafana:可视化仪表盘,展示监控数据这套组合构成了一个完整的Linux监控体系建设方案,灵活、可扩展且社区支持强大。
四、安装与配置 Node Exporter
Node Exporter 负责收集本机系统指标:
# 下载并解压 Node Exportercd /tmpwget https://github.com/prometheus/node_exporter/releases/download/v1.7.0/node_exporter-1.7.0.linux-amd64.tar.gztar xvfz node_exporter-1.7.0.linux-amd64.tar.gz# 移动到系统目录sudo mv node_exporter-1.7.0.linux-amd64/node_exporter /usr/local/bin/# 创建 systemd 服务sudo tee /etc/systemd/system/node_exporter.service <
验证是否成功:访问
http://你的服务器IP:9100/metrics,应看到大量系统指标输出。
五、安装 Prometheus
# 创建 prometheus 用户和目录sudo useradd --no-create-home --shell /bin/false prometheussudo mkdir /etc/prometheus /var/lib/prometheus# 下载 Prometheuscd /tmpwget https://github.com/prometheus/prometheus/releases/download/v2.47.1/prometheus-2.47.1.linux-amd64.tar.gztar xvfz prometheus-2.47.1.linux-amd64.tar.gz# 复制二进制文件sudo cp prometheus-2.47.1.linux-amd64/prometheus /usr/local/bin/sudo cp prometheus-2.47.1.linux-amd64/promtool /usr/local/bin/# 设置权限sudo chown prometheus:prometheus /var/lib/prometheus
创建配置文件
/etc/prometheus/prometheus.yml:
global: scrape_interval: 15sscrape_configs: - job_name: 'node' static_configs: - targets: ['localhost:9100']
创建 systemd 服务文件
/etc/systemd/system/prometheus.service:
[Unit]Description=PrometheusWants=network-online.targetAfter=network-online.target[Service]User=prometheusGroup=prometheusType=simpleExecStart=/usr/local/bin/prometheus \ --config.file /etc/prometheus/prometheus.yml \ --storage.tsdb.path /var/lib/prometheus/ \ --web.console.templates=/etc/prometheus/consoles \ --web.console.libraries=/etc/prometheus/console_libraries[Install]WantedBy=multi-user.target
启动 Prometheus:
sudo systemctl daemon-reloadsudo systemctl enable prometheussudo systemctl start prometheus
六、安装 Grafana 实现可视化
sudo dnf install grafana -ysudo systemctl enable grafana-serversudo systemctl start grafana-server
Grafana 默认监听 3000 端口。打开浏览器访问
http://你的服务器IP:3000,初始账号密码均为
admin。
七、在 Grafana 中添加 Prometheus 数据源
登录 Grafana 后,点击左侧齿轮图标(Configuration)→ Data Sources 点击 “Add data source” 选择 “Prometheus” URL 填写http://localhost:9090点击 “Save & Test”,看到绿色提示即成功
八、导入监控仪表盘
Grafana 社区提供了大量现成的仪表盘模板。推荐使用 ID
1860(Node Exporter Full): 点击左侧 “+” → Import 输入
1860选择刚才添加的 Prometheus 数据源 点击 Import
现在你就能看到 CPU、内存、磁盘 I/O、网络流量等关键指标的实时图表了!
九、后续优化建议
配置告警规则(Alertmanager) 监控多个服务器(在 Prometheus 配置中添加更多 targets) 启用 HTTPS 和身份认证保护 Grafana 定期备份 Prometheus 数据十、总结
通过本文,你已经成功搭建了一套基于 Prometheus + Node Exporter + Grafana 的 RockyLinux运维监控体系。这套方案不仅适用于单台服务器,也能轻松扩展到整个数据中心。掌握 系统监控工具 的使用,是每一位 Linux 运维工程师的必备技能。坚持实践,你的 服务器性能监控 能力将不断提升,为业务稳定保驾护航!
关键词回顾:RockyLinux运维监控、系统监控工具、服务器性能监控、Linux监控体系建设
