两台P570,AIX 5300-02,HA5.3,oracle 10gRAC
一台的内置盘坏,准备换盘hdisk1坏。两块盘均为73G
先停此机上的oracle,再停HA,另一台正常运行。
lsvg -l rootvg可以看到全部做了镜像,状态全部正常。
unmirrorvg rootvg,执行成功(使用smit lvm做的,没有选择硬盘。这是记下的实际使用命令)。
lspv -l hdisk0发现两个逻辑卷,hd6两个PP,dump用多个PP
lspv -l hdisk1其它的逻辑卷全到hdisk1上去了。
急,上面为啥不多输几个字符呀,以致出现这种情况。
重新镜像,mirrorvg rootvg hdisk0失败,报无充足的空间。删除不用的逻辑卷,空出多个空闲PP,hdisk0上只占用了少数,记不清了,hdisk1上也空出了100多个PP,hdisk0完全可以装下hdisk1 上的全部内容并空出很多,我当时用笔计算了。再mirrorvg rootvg hdisk0仍然失败,报空间不足。
lsvg -l rootvg可以看到全部逻辑卷均为syncd状态,errpt没有新错误。hd6有两个PP在hdisk0上。
migratevg -l hd6 rootvg hdisk0 hdisk1执行到最后
报错,系统没有完成removed操作。
lspv -l hdisk0可以看到hdisk0上的hd6使用了32个PP,状态为stale,而lspv -l hdisk1上使用了34个PP,状态为syncd
晕死了
mkps -a -n -s10 paging00 rootvg hdisk1
lsps -a可以看到已经激活了paging00,出现两个hd6一个用了256M,一个4346M与上面lspv所看到的
不一致。晕死了
决定删除hd6后重新建
swapoff hd6
rmps hd6
mkps -a -n -s34 hd6 rootvg hdisk1
lsps -a可以看到hd6及paging00已经激活。
感觉应可以完成了,删除多余的paging
swapoff paging00
rmps paging00
syncvg -v rootvg
mirrorvg rootvg hdisk0
unmirrorvg rootvg hdisk1
reduce rootvg hdisk1
使用diag->task来换硬盘
chdev -l hdisk1 pv=yes
extendvg rootvg hdisk1
mirrorvg rootvg hdisk1
syncvg -v rootvg
bosboot -ad /dev/hdisk0失败,报无法定位及不存在/dev/设备
bosboot -ad /dev/hdisk1失败,报无法定位及不存在/dev/设备
lsvg -l rootvg狂
晕,没有hd5
lspv -l hdisk0|grep hd5;lspv -l hdisk1|grep hd5均没有。
mklv -t boot -Lprimary_bootlv -c2 -yhd5 rootvg 1
bosboot -ad /dev/hdisk0
bosboot -ad /dev/hdisk1
bootlist -m normal hdisk0 hdisk1 cd0 rmt0
errpt
shutdown -Fr
成功重启,查看系统状态正常。
启HA及oracle正常。至此一身的大汗才没有继续流
因为HMC使用不正常,点个菜单很长时间没有反应,以上操作均为在客户办公室与机房间狂奔完成。
检查HMC版本为5.1.2,在主机工作正常后第二天将HMC reboot,哪知道,这一reboot后就找不到被管理的主机了,检查网线连接正常,灯都亮着,重新插拔,仍然无法找到,ping HMC口的IP地址可以正常通。
又晕了,于是再次reboot HMC,这下倒好,根本就起不来了,报大量的i/o错误,晕死了。找到HMC的recovery cd,扔进鸡驱动器,顺利开始安装,安装到98%,又报i/o错,自动重新启动了,我靠,问题还没有解决。。。。。。不会真是见鬼了吧。。。。。。
经过更换硬盘,再次安装recovery cd后HMC恢复正常。感觉这个HMC所使用的linux还是不太完善哈,问题全部解决。
[
本帖最后由 lj_cd 于 2007-3-20 14:14 编辑 ]