简介:
硬盘其实是服务器故障率最高的设备,没有之一。
只有它是机械的,有磨损,风扇还好,无尘机房可以一直用。
玩意硬盘坏一块怎么办?
一:查看ceph状态
root@pve4:~# ceph osd tree
ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF
-1 3.27478 root default
-3 0.81870 host pve1
0 hdd 0.81870 osd.0 up 1.00000 1.00000
-5 0.81870 host pve2
1 hdd 0.81870 osd.1 up 1.00000 1.00000
-7 0.81870 host pve3
2 hdd 0.81870 osd.2 up 1.00000 1.00000
-9 0.81870 host pve4
3 hdd 0.81870 osd.3 down 0 1.00000
osd.3 下线了
二:去除故障硬盘
ceph osd out osd.3 #下线osd盘
ceph auth del osd.3 #删除权限
ceph osd rm 3 #删除3号
ceph osd crush rm osd.3 #管理删除osd
ceph osd crush rm pve4 #管理删除节点
root@pve4:~# ceph osd rm 3 removed osd.3 root@pve4:~# ceph osd tree ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 3.27478 root default -3 0.81870 host pve1 0 hdd 0.81870 osd.0 up 1.00000 1.00000 -5 0.81870 host pve2 1 hdd 0.81870 osd.1 up 1.00000 1.00000 -7 0.81870 host pve3 2 hdd 0.81870 osd.2 up 1.00000 1.00000 -9 0.81870 host pve4 3 hdd 0.81870 osd.3 DNE 0 root@pve4:~# ceph osd crush rm osd.3 removed item id 3 name 'osd.3' from crush map root@pve4:~# ceph osd tree ID CLASS WEIGHT TYPE NAME STATUS REWEIGHT PRI-AFF -1 2.45609 root default -3 0.81870 host pve1 0 hdd 0.81870 osd.0 up 1.00000 1.00000 -5 0.81870 host pve2 1 hdd 0.81870 osd.1 up 1.00000 1.00000 -7 0.81870 host pve3 2 hdd 0.81870 osd.2 up 1.00000 1.00000 -9 0 host pve4
三:添加新磁盘
记得初始化
wipefs -af /dev/sdc #sdc为新更换的磁盘设备名称