一 说明
数据库环境为11gRAC 环境,操作系统为6L 目前需要更换核心心跳交换机及心跳网络对应的心跳网卡,初步设定如下两个方案: 方案一: 拆除原先的Etherchannel 利用新的网卡重新生成新的Etherchannel ,需要确保如下:
1. Etherchannel 绑定的网卡名字前后保持一致
2. 更换过程中,关闭数据库及集群 缺点:需要通过操作系统技术,确保Etherchannel 网卡名一致 优点:只需要正常关闭节点即可,DBA 不需要手工介入修改心跳 方案二: 利用新网卡,重新绑定一张Etherchannel 网卡,并保持原先网卡可用,需要确保如下:
1. 两节点集群环境需要关闭,业务需要停止 缺点:需要DBA 手动干预更换,时间相对久 优点:回退相对方便,只需重新替换即可。 目前将两种方案的整体过程步骤记录如下
环境说明
目前我们以CRM 数据库为例,更换CRM 数据库的心跳地址及网卡 目前IP 规划: :
|
IP |
Alias |
备注 |
|
130.36.23.8 |
一节点public IP | |
|
130.36.23.10 |
二节点public IP | |
|
130.36.23.7 |
一节点VIP | |
|
130.36.23.9 |
二节点VIP | |
|
3.3.31.4 |
一节点心跳 IP | |
|
3.3.31.5 |
二节点心跳 IP | |
|
130.36.23.6 |
SCAN-IP |
更换流程
整体更换流程:
|
步骤 |
流程计划 |
时间估算 |
|
1 |
新心跳交换机上架 |
1 个小时(不停机做) |
|
2 |
心跳网线接驳 |
30 分钟 (不停机做) |
方案一(拆除 Etherchannel )步骤
|
步骤 |
流程计划 |
时间估算 |
|
1 |
两节点关闭集群 |
20 分钟 (业务停止) |
|
2 |
拆除并重建Etherchannel |
30 分钟 (业务停止) |
|
3 |
绑定原先IP 地址 |
10 分钟 (业务停止) |
|
4 |
启动集群 |
10 分钟 (业务停止) |
|
5. |
回退,重建老的 Etherchannel |
20 分钟 |
总结时间: 业务停止时间1 小时(数据库层面) 方案二(新建 Etherchannel )步骤
|
步骤 |
流程计划 |
时间估算 |
|
1 |
新建Etherchannel |
20 分钟 (业务不停止) |
|
2 |
设定IP 地址 |
10 分钟 (业务不停止) |
|
3 |
修改OCR 中关于心跳信息 |
30 分钟 (业务停止) |
|
4 |
关闭集群及数据库 |
20 分钟 (业务停止) |
|
修改/etc/hosts 信息 |
10 分钟 (业务停止) | |
|
启动集群 |
10 分钟 (业务停止) | |
|
5. |
回退,回退到老的 Etherchannel |
20 分钟 |
总结时间: 业务停止时间80 分钟(数据库层面)
二 方案一操作过程
2.1 前期准备
新的心跳交换机上架,新的网线进行接驳
关闭双节点集群
单节点执行以下命令,关闭两节点数据库srvctl stop database
双节点执行一下命令,关闭双节点集群资源
#crsctl stop crs
2.3 Etherchannel 拆除重新绑定
Etherchannel 拆除过程由主机工程师完成,需要确保如下: 拆除后新建的channel网卡和原来的保持一致,IP设定原则上一致,如果不一致,需要确保在同一网段
重新启动集群
确保IP没有修改, 如果IP修改了,需要确保同步修改/etc/hosts文件夹
双节点执行一下命令:
#crsctl start crs 单节点执行一下命令: srvctl start database
回退过程
关闭双节点集群,或者因为集群无法在双节点正常启动,则完全关闭双节点集群 回退Etherchannel操作 回退/et/hosts操作 将节点正常启动
三 方案一操作过程
3.1 前期准备
新的心跳交换机上架, 新的网线进行接驳, 新的网卡进行Etherchannel 绑定,并设定网卡IP 为和 原来老心跳地址同网段的两个不同的 IP
修改OCR 中心跳配置信息
修改前确认设置$ oifcfg getifen40 130.36.23.0 global publicen41 3.3.31.0 global cluster_interconnect 假设CRM 现在新的Etherchannel 为en42 则进行修改: ./oifcfg setif -global en42/3.3.31.0:cluster_interconnect ./oifcfg delif -global en41 修改后确认设置应该如下./oifcfg getifen40 130.36.23.0 global publicen42 3.3.31.0 global cluster_interconnect
关闭双节点数据库及集群
单节点执行以下命令,关闭两节点数据库 srvctl stop database –d
双节点执行以下命令,关闭双节点集群资源
#crsctl stop crs
修改/etc/hosts 文件
重新修改/etc/hosts文件
重新启动集群
双节点执行以下命令:
#crsctl start crs 单节点执行以下命令: srvctl start database –d
回退过程
关闭双节点集群,在一号机单节点启动集群 重新修改OCR信息:./oifcfg setif -global en41/ 3.3.31.0:cluster_interconnect./oifcfg delif -global en42 修改后确认设置./oifcfg getif en40 130.36.23.0 global public en41 3.3.31.0 global cluster_interconnect
