LoveUnix » AIX -IBM UNIX » 请教7133硬盘更换硬盘问题,急!!!帮忙呀!在线等!!!
让LU留住您的每

一天 让LU博客留住您的每一天
2008-6-2 18:00 elementkk
请教7133硬盘更换硬盘问题,急!!!帮忙呀!在线等!!!

客户7133硬盘pdisk11报错,错误id为F7863CFE ,经查该错误是以下情况:
One of the following has occurred:
v The disk drive has had an unrecovered hardware error.
v The disk drive has had a hardware error that is now
recovered, but the disk drive is reporting that it might be going
to fail.
查看pdisk11的状态,还是good状态,并没有被阵列踢出来,但该盘处于临界状态,随时会坏。
遂带了块36g的硬盘过去客户那边更换,
客户的7133里头有两个raid组,都是raid5方式,并有一个hotspare池(pdisk9(35g),pdisk15(72g))
raid组1 都是36g磁盘,raid组2都是72g磁盘,
到达客户现场,先做swap操作,把pdisk11(36g)导入到pdisk9(36g)上面, 但是在状态里头看到
pdisk11是导入到pdisk15(72g),在做rebuilding操作,而pdisk9确被rejected,
查errpt日志,发现pdisk9也有报错,错误代码也为F7863CFE。
是否做swap操作的时候,pdisk9也有故障,只能swap到pdisk15上面???
这样显然是不行的,pdisk15是72g的盘是作为另外一个raid组的热备盘。
请教一下下一步如何操作?等到rebuliding完的时候,能否把pdisk11 set service模式,
然后拔盘,插入新盘,再把新盘设置为阵列候选盘,接着加入raid组1,然后做swap操作把
pdisk15的导入到新盘??  但是pdisk15是72g的盘,新盘是32g的盘,这样是否会有问题???

[[i] 本帖最后由 elementkk 于 2008-6-2 18:49 编辑 [/i]]

2008-6-2 18:52 elementkk
没人吗?自己顶一下:L

2008-6-2 19:08 elementkk
本来想正常的操作步骤如下:
先确定该盘所属的阵列是否有hotspare盘
1  在主机上面,做swap操作,把hotspare盘交换给故障盘,等待进度完成。
2  把故障盘做set sevice mode 操作,拨故障盘,插入新盘,取消set service mode操作,
3  在主机上面rmdev -dl pdisk11     cfgmgr -vl ssar
4  把新盘设置为hotspare盘,并加入hotspare池里头。
5  在备机上面,rmdev -dl pdisk11  cfgmgr -vl ssar  (注意先看看物理盘跟逻辑盘的对应)

现在做第一步操作的时候就出现新情况,蒙了现在。交换到72g容量的盘去了。:L

2008-6-2 21:10 elementkk
7133里头两个raid组,raid组1都是36g的硬盘做raid5,raid组2都是72g的硬盘做raid5,
hotspare池里头有两块盘一块是36g,一块是72g,那么加入raid组1出问题的时候,它是怎么去选择哪个盘来做替换操作的???

2008-6-2 22:18 elementkk
:mad   咋都没人帮忙呀  再顶!!!

2008-6-3 10:06 elementkk
再顶:lu3:

2008-6-3 10:15 benq011
呵呵,都是LZ一个人再顶啊,我也帮你顶一下;P

2008-6-3 10:23 shl1129
不是做了raid5么,踢盘直接换就可以了啊,何必先做swap

2008-6-3 10:56 elementkk
据说直接踢盘的话不太安全,所以想先将坏盘数据先交换到36.4G的hotspare盘,没想到36.4G的那块盘估计有问题,直接被交换到72G的那块hotspare盘去了。
对了  7133里头两个raid组,raid组1都是36g的硬盘做raid5,raid组2都是72g的硬盘做raid5,
hotspare池里头有两块盘一块是36g,一块是72g,那么加入raid组1出问题的时候,它是怎么去选择哪个盘来做替换操作的???

2008-6-3 10:59 elementkk
默认的hotspare池是pool_A0,两个hotspare都在这个池里头。

2008-6-3 11:03 hape1221
你看看ssa raid arrays里 List Status of Hot Spare Protection for an SSA RAID Array的信息。。。看看有没有一些相关的设置。。

2008-6-3 11:30 elementkk
List Status of Hot Spare Protection for an SSA RAID Array的里面的信息很正常,原来两个raid组的hotspare都是同一个池名,并且保护的那个选项都是yes状态,但就是不知道如果坏了的话,两个raid组怎么去选择热备盘来替换(是选72g,还是选36g,是随机选的么?还是有什么策略可以配置?)

2008-6-3 13:43 cgxwer
你先把数据迁移到另一块正常的盘上,然后把坏的盘从卷组中删除,再删除硬盘就好了啊。何必这么麻烦呢

2008-6-3 22:53 singlernbs
raid5 换盘的时候用先做swap操作吗?swap操作是相对于镜像的盘来做的。你的hotspare池是pool_A0,两个hotspare都在这个池里头。这样的话这连个盘36gb和72gb的盘对于raid1的组都起到了热备的作用。但对于raid2组来说只有72gb的热备盘起到作用。所以在你选择热备池时候需要指定是给了那个raid组的了。你上面说的:“而pdisk9确被rejected,”呵呵 那么就是你上面的描述的结果了。如果是生产的话 那么建议你不要实验了。直接再换个72的就可以了。现在36和72的一个价格了。

2008-6-4 15:55 elementkk
多谢楼上的,36g故障盘切换到72g热备盘之后操作完成了。拔故障盘,插入新盘,之后72g的盘再次swap到36g新盘。至此操作完成。
我的情况是故障盘还未被阵列踢出来,状态还是good的,所以我就做了swap操作,假如不做的话直接把故障盘set service mode应该也是可以,但是估计还是会用72g的那块hotspare盘,因为36g的hotspare也是故障的,顶不上。
我的两个raid组都在一个loopA里头,好像找不到地方选择让哪块盘指定热备哪个raid组,所以才有担心到底故障的时候热备盘是怎么选的,如果36g的那个raid组先把72g的热备盘选走的话,那72g的那个raid组就变成了没有保护了,因为只剩下了36g的那个热备盘。

2008-6-4 23:44 五“宅”一生
那就找两个72G的做hotspare吧。反正72G的热备36G的没有问题。

页: [1]


Powered by Discuz! Archiver 5.5.0  © 2001-2006 Comsenz Inc.