一、背景
某客户有套11.2.0.4的RAC出现了问题,ocr文件损坏,再加上ASM磁盘创建不合理。现有业务没有在上面运行,综合考虑打算重新搭建RAC。然后就是各种填坑。
二、原先实施步骤
卸载原有的rac,再重装新的数据库
三、实际实施步骤
重装了操作系统,重新安装了多路径软件。
原因:从存储划过来的空间,在操作系统进行挂载,往里面写入数据时(80-90M/s),系统进行重启。其实就是数据经过了hba卡就会重启,使用本机就不会。
存储层面:
两台主机后面分别接了两块hba卡。但是发现两台主机其中一个hba线在存储中映射交叉了,这是问题一
主机硬件层面:
在存储层面调整后,发现系统重启问题还是没有解决。打电话给主机远程支持服务(dell r930)。收集信息(通过iron口192.168.0.120)也没有发现硬件报错信息
系统:
由于上面操作都没有解决问题,想着拿一台主机重做系统,在安装操作系统时,发现有报错缺少镜像文件,解决的办法为复制一个镜像文件到U盘。安装完成系统后,发现没有多路径软件 ps:原os:redhat:7.4 现:orl:6.8
多路径软件: ps:原:powerpath
只有linux7.0以上的powerpath软件。系统orl6.8,装不上去,只能安装multipath。注意不需要手动修改配置文件,可以自动聚合
rpm -e EMCpower.LINUX-6.2.0.00.00-051.el7.x86_64 --卸载原有的多路径软件
[root@racdb1 ~]# rpm -q device-mapper-multipath
device-mapper-multipath-0.4.9-111.el7.x86_64
[root@racdb1 ~]#
[root@racdb1 ~]# modprobe dm-multipath
[root@racdb1 ~]# modprobe dm-round-robin
[root@racdb1 ~]# /sbin/mpathconf --enable
[root@racdb1 ~]# systemctl enable multipathd.service
[root@racdb1 ~]# chkconfig multipathd on
Note: Forwarding request to 'systemctl enable multipathd.service'.
[root@racdb1 ~]# multipath -ll
安装多路径软件重新挂载磁盘,发现问题解决,而且复制速率能达到200M/s(猜测是多路径软件问题),时间问题没有做系统和多路径软件的测试。但是在这配置ip地址时发现了一个问题,原先万兆走的是业务网络,千兆走的是私有网络。而且私有网络是他内部网络的一个管理网络,也就是说私有网络不是完全隔离的。
以上为解决主机上往存储上写数据时重启的问题
安装grid时发现的问题如下:
在执行./root.sh时,报如下错误,haip建立失败。haip:用于心跳网络上的冗余,oracle会在心跳网卡上的子网卡虚拟生成一个169.254.*.*的保留地址
这是报错日志,注意mac地址:00-0d-48-2d-48-9b,这个mac地址在我主机网卡上没有找到,猜测是交换机上的地址,所以造成haip起不来。因为私有网络可以和外面进行通信。可以参考如下文档
root.sh Fails to Start HAIP as Default Gateway is Configured for Private Network VLAN (Doc ID 1366211.1)
经过调整网络,将原有的万兆改成私有网络,并且新建了vlan,与原来网络完全隔离。千兆改成业务地址,问题解决。