数据库管理-第291期 Exadata换磁盘(20250207)
作者:胖头鱼的鱼缸(尹海文) Oracle ACE Pro: Database PostgreSQL ACE Partner 10年数据库行业经验 拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证 墨天轮MVP,ITPUB认证专家 圈内拥有“总监”称号,非著 名社恐(社交恐怖分子) 公众号:胖头鱼的鱼缸 CSDN:胖头鱼的鱼缸(尹海文) 墨天轮:胖头鱼的鱼缸 ITPUB:yhw1809。 除授权转载并标明出处外,均为“非法”抄袭
春节前,巡检中发现我这边最早那台Exadata X8那台一体机存储节点,本期记录下磁盘更换过程。
1 巡检
首先是在EM中Exadata相关检查中发现了问题。
在Health,健康监控里面发现存储节点3的某个磁盘出现了异常(这里没有保留EM截图)。随即存储节点进行检查:
发现对应磁盘状态为failed。机房检查对应磁盘异常:
cellcli -e list physicaldisk

2 更换前准备
第一件事情肯定是报修,拿到新的磁盘,由于是节前,客户比较急,也催了下加急,结果第二天一大早连物流信息都还没刷出来新的磁盘就到了:
更换磁盘之前需要先检查并操作一些内容:
2.1 ASM检查
检查ASM磁盘组的磁盘修复时间配置,一般默认为12小时,足够更换操作。
select dg.name,a.value from v$asm_diskgroup dg, v$asm_attribute a where dg.group_number=a.group_number and a.name='disk_repair_time';

2.2 drop对应磁盘
cellcli -e alter physicaldisk 252:2 drop for replacement
如果是没有下线的磁盘更换,建议到ASM中检查等待rebalance完成后再进行磁盘更换操作。
3 更换磁盘
这里更换Exadata的磁盘和普通磁盘柜更换没有任何区别,更换后磁盘灯恢复正常:
(原谅我拍照的时候状态灯正好闪没了)
4 更换后检查
4.1 存储节点检查
磁盘状态已经恢复为normal。
4.2 ASM检查
select * from gv$asm_operation where state='RUNNING';
这里还是忘记保留截图了,过程中可以监控SOFAR, EST_WORK, EST_RATE, EST_MINUTES查看大概时间,无结果后去掉where条件也无结果则rebalance运行完成。

总结
本期简单介绍了Exadata更换磁盘的操作。 老规矩,知道写了些啥。
