标题: [已解决] help me 英雄们 双机问题
fengyan
LU幼天使
Rank: 2


UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
 
发表于 2008-5-8 21:33  资料  个人空间  短消息  加为好友 
help me 英雄们 双机问题

小弟先拜谢了。
现在小弟这边有两台H85做的双机,备节点出现问题,业务不能正常切换
在备节点上运行
smitty ssaraid--》List All Defined SSA RAID Arrays
         COMMAND STATUS

Command: OK            stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

hdisk2          81BA000D6E934CO free    good        72.9GB raid_10
hdisk3          81BA000D6EC24CO free     good       145.8GB raid_10
手动挂载卷组出现这样的提示:
# varyonvg vgdata
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.

系统有两个ssa卡,ssa0和ssa1
我听说这是write fast cache打开引起的
于是就在备节点上执行一下步骤
1,        首先确定是由于cache_error操作引起的问题:
   ssaraid -l ssa0 -Iz –a state=wrong_cache;这个时候系统输出损坏的raid组信息,如下:
   81BA000D6E934CO 81BA000D6E934CO   wrong_cache 36.4GB Raid10 array
2,        强制禁止fastwrite属性关闭,如下命令:
   ssaraid -l ssa0 -H -n 81BA000D6E934CO -a fastwrite=off -a force=yes -u
3,        重新创建丢失的磁盘
   ssaraid -l ssa0 -H -n 81BA000D6E934CO -a use=syestem -k hdisk2 -d
   此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功。hdisk3也做同样的操作

这时在备机上运行
smitty ssaraid--》List All Defined SSA RAID Arrays
     COMMAND STATUS

Command: OK            stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

hdisk2          81BA000D6E934CO system    good        72.9GB raid_10
hdisk3          81BA000D6EC24CO system     good       145.8GB raid_10

但是主节点的业务也停了。
在主节点上运行
运行smitty ssaraid--》List All Defined SSA RAID Arrays
      COMMAND STATUS

Command: OK            stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

hdisk4          81BA000D6E934CO system    good        72.9GB raid_10
hdisk5          81BA000D6EC24CO system    good       145.8GB raid_10
在主节点上手动varyonvg 提示
# varyonvg vgdata
PV Status:      hdisk3  005f81ba347dfdb5        PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.

在主节点上起业务,不成功,浮动IP倒是切换过来了,业务不行。后来在备节点上卷组能够手动挂上,业务也能够起来
这是怎么回事啊,还请大家指导
听大家说解决方法:
(1)exportvg 然后importvg
(2)还有就是和ssa disk fence有关
这些我觉得好像是一回事,但是具体还不明白,研究中,希望各位高手能够给予指导,谢谢

[ 本帖最后由 fengyan 于 2008-5-30 17:01 编辑 ]

顶部
kettyalx
LU圣天使
Rank: 8Rank: 8


UID 76177
精华 3
积分 2726
帖子 4178
活跃指数 294
LU金币 4358 个
LU金条 0 个
阅读权限 90
注册 2007-2-5
 
发表于 2008-5-8 22:04  资料  个人空间  短消息  加为好友 
PV Status:      hdisk3  005f81ba347dfdb5        PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.
?

顶部
fengyan
LU幼天使
Rank: 2


UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
 
发表于 2008-5-8 22:11  资料  个人空间  短消息  加为好友 


QUOTE:
原帖由 kettyalx 于 2008-5-8 22:04 发表
PV Status:      hdisk3  005f81ba347dfdb5        PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.
?

就是手动挂卷组的时候有这样的提示,挂不上

顶部
fengyan
LU幼天使
Rank: 2


UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
 
发表于 2008-5-8 22:52  资料  个人空间  短消息  加为好友 
可能我说的不清楚,再来一遍。大虾救命啊
两台H85做的双机,备机出现问题,业务不能正常切换在备节点上运行
smitty ssaraid--》List All Defined SSA RAID Arrays
         COMMAND STATUS

Command: OK            stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

hdisk2          81BA000D6E934CO free    good        72.9GB raid_10
hdisk3          81BA000D6EC24CO free     good       145.8GB raid_10
手动挂载卷组# varyonvg vgdata
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.

系统有两个ssa卡,ssa0和ssa1
我听说这是write fast cache打开引起的
于事就在备节点上执行
1,        首先确定是由于cache_error操作引起的问题:
   ssaraid -l ssa0 -Iz –a state=wrong_cache;这个时候系统输出损坏的raid组信息,如下:
   2327340C228635K   2327340C228635K  wrong_cache 36.4GB Raid-5 array
2,        强制禁止fastwrite属性关闭,如下命令:
   ssaraid -l ssa0 -H -n 2327340C228635K -a fastwrite=off -a force=yes -u
3,        重新创建丢失的磁盘
   ssaraid -l ssa0 -H -n 2327340C228635K -a use=syestem -k hdisk2 -d
   此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功。
这时smitty ssaraid--》List All Defined SSA RAID Arrays
     COMMAND STATUS

Command: OK            stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

hdisk2          81BA000D6E934CO system    good        72.9GB raid_10
hdisk3          81BA000D6EC24CO system     good       145.8GB raid_10
但是主节点的业务也停了。
在主节点上运行
运行smitty ssaraid--》List All Defined SSA RAID Arrays
      COMMAND STATUS

Command: OK            stdout: yes           stderr: no

Before command completion, additional instructions may appear below.

hdisk4          81BA000D6E934CO system    good        72.9GB raid_10
hdisk5          81BA000D6EC24CO system    good       145.8GB raid_10
在主节点上手动varyonvg 提示
# varyonvg vgdata
PV Status:      hdisk3  005f81ba347dfdb5        PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
        there are no good copies of the descriptor area.

在主节点上起双机,不成功
这是怎么回事啊,还请大家指导

顶部
turbo
LU小天使
Rank: 3Rank: 3


UID 41378
精华 5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
 
发表于 2008-5-8 22:57  资料  个人空间  短消息  加为好友 
备机已经varyonvg了,主机当然没法varyonvg啦





三套指标横行股市
一代权侠笑傲江湖
赌运长久
顶部
turbo
LU小天使
Rank: 3Rank: 3


UID 41378
精华 5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
 
发表于 2008-5-8 22:58  资料  个人空间  短消息  加为好友 
备机上lsvg -o 看看,再varyoffvg





三套指标横行股市
一代权侠笑傲江湖
赌运长久
顶部
fengyan
LU幼天使
Rank: 2


UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
 
发表于 2008-5-8 23:01  资料  个人空间  短消息  加为好友 


QUOTE:
原帖由 turbo 于 2008-5-8 22:58 发表
备机上lsvg -o 看看,再varyoffvg

大哥,我要从主机上执行varyonvg vgdata的时候,备机已经把vgdata varyoffvg掉了,今天虽然很晕,但是没晕倒这个地步,还是谢谢大哥你了

顶部
turbo
LU小天使
Rank: 3Rank: 3


UID 41378
精华 5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
 
发表于 2008-5-8 23:08  资料  个人空间  短消息  加为好友 
再仔细检查一下,我以12年的经验判断这个错误提示,你的vgdata一定被另外一台机器varyon了





三套指标横行股市
一代权侠笑傲江湖
赌运长久
顶部
turbo
LU小天使
Rank: 3Rank: 3


UID 41378
精华 5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
 
发表于 2008-5-8 23:12  资料  个人空间  短消息  加为好友 
最简单的方法,如果可以停机,把和这个vgdata相关的机器重起一次,在主节点其ha





三套指标横行股市
一代权侠笑傲江湖
赌运长久
顶部
fengyan
LU幼天使
Rank: 2


UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
 
发表于 2008-5-8 23:19  资料  个人空间  短消息  加为好友 


QUOTE:
原帖由 turbo 于 2008-5-8 23:12 发表
最简单的方法,如果可以停机,把和这个vgdata相关的机器重起一次,在主节点其ha

一共两台H85,共用一个7133.共享卷组是vgdata。在备节点上看到两个逻辑卷:hdisk2和hdisk3;主节点上看到的是hdisk4和hdisk5
请问我在备节点上执行了这三步:
1,首先确定是由于cache_error操作引起的问题:
   ssaraid -l ssa0 -Iz –a state=wrong_cache;这个时候系统输出损坏的raid组信息,如下:
   2327340C228635K   2327340C228635K  wrong_cache 36.4GB Raid-5 array
2,强制禁止fastwrite属性关闭,如下命令:
   ssaraid -l ssa0 -H -n 2327340C228635K -a fastwrite=off -a force=yes -u
3,重新创建丢失的磁盘
   ssaraid -l ssa0 -H -n 2327340C228635K -a use=syestem -k hdisk2 -d
   此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功。

那在主节点上是不是要把hdisk2和hdisk3的设备名rmdev掉,然后再cfgmgr呢?
还是直接像大哥你说的那样两个节点都重启下?

顶部
[广告] 论坛新开 【DB2产品家族】 【投资理财】 【行业应用】 板块
turbo
LU小天使
Rank: 3Rank: 3


UID 41378
精华 5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
 
发表于 2008-5-8 23:25  资料  个人空间  短消息  加为好友 
1.主节点不动
2.备节点把hdisk  rmdev掉
3.两个节点都重起
4.ha同步
5起ha
6再测试一下ha切换





三套指标横行股市
一代权侠笑傲江湖
赌运长久
顶部
[广告] 论坛新开 【DB2产品家族】 【投资理财】 【行业应用】 板块
fengyan
LU幼天使
Rank: 2


UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
 
发表于 2008-5-8 23:29  资料  个人空间  短消息  加为好友 


QUOTE:
原帖由 turbo 于 2008-5-8 23:25 发表
1.主节点不动
2.备节点把hdisk  rmdev掉
3.两个节点都重起
4.ha同步
5起ha
6再测试一下ha切换

谢谢这位大哥,铭记五内。。。

顶部
[广告] 论坛新开 【DB2产品家族】 【投资理财】 【行业应用】 板块
 



当前时区 GMT+8, 现在时间是 2008-7-24 14:16
乐悠LoveUnix论坛-京ICP备05005823号

Thanks to Discuz!  © 2001-2007    Power by LoveUnix.net
Processed in 0.065805 second(s), 6 queries , Gzip enabled

清除 Cookies - 联系我们 - 乐悠LoveUnix - Archiver - WAP