网站首页
本站精华
免费下载
游客:
注册
|
登录
|
会员
|
搜索
|
帮助
LoveUnix
»
AIX -IBM UNIX
» help me 英雄们 双机问题
‹‹ 上一主题
|
下一主题 ››
31
1/3
1
2
3
››
投票
交易
悬赏
活动
打印
|
推荐
|
订阅
|
收藏
标题:
[已解决]
help me 英雄们 双机问题
fengyan
LU幼天使
UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
#1
大
中
小
使用道具
发表于 2008-5-8 21:33
资料
个人空间
短消息
加为好友
help me 英雄们 双机问题
小弟先拜谢了。
现在小弟这边有两台H85做的双机,备节点出现问题,业务不能正常切换
在备节点上运行
smitty ssaraid--》List All Defined SSA RAID Arrays
COMMAND STATUS
Command: OK stdout: yes stderr: no
Before command completion, additional instructions may appear below.
hdisk2 81BA000D6E934CO free good 72.9GB raid_10
hdisk3 81BA000D6EC24CO free good 145.8GB raid_10
手动挂载卷组出现这样的提示:
# varyonvg vgdata
0516-013 varyonvg: The volume group cannot be varied on because
there are no good copies of the descriptor area.
系统有两个ssa卡,ssa0和ssa1
我听说这是write fast cache打开引起的
于是就在备节点上执行一下步骤
1, 首先确定是由于cache_error操作引起的问题:
ssaraid -l ssa0 -Iz –a state=wrong_cache;这个时候系统输出损坏的raid组信息,如下:
81BA000D6E934CO 81BA000D6E934CO wrong_cache 36.4GB Raid10 array
2, 强制禁止fastwrite属性关闭,如下命令:
ssaraid -l ssa0 -H -n 81BA000D6E934CO -a fastwrite=off -a force=yes -u
3, 重新创建丢失的磁盘
ssaraid -l ssa0 -H -n 81BA000D6E934CO -a use=syestem -k hdisk2 -d
此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功。hdisk3也做同样的操作
这时在备机上运行
smitty ssaraid--》List All Defined SSA RAID Arrays
COMMAND STATUS
Command: OK stdout: yes stderr: no
Before command completion, additional instructions may appear below.
hdisk2 81BA000D6E934CO system good 72.9GB raid_10
hdisk3 81BA000D6EC24CO system good 145.8GB raid_10
但是主节点的业务也停了。
在主节点上运行
运行smitty ssaraid--》List All Defined SSA RAID Arrays
COMMAND STATUS
Command: OK stdout: yes stderr: no
Before command completion, additional instructions may appear below.
hdisk4 81BA000D6E934CO system good 72.9GB raid_10
hdisk5 81BA000D6EC24CO system good 145.8GB raid_10
在主节点上手动varyonvg 提示
# varyonvg vgdata
PV Status: hdisk3 005f81ba347dfdb5 PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
there are no good copies of the descriptor area.
在主节点上起业务,不成功,浮动IP倒是切换过来了,业务不行。后来在备节点上卷组能够手动挂上,业务也能够起来
这是怎么回事啊,还请大家指导
听大家说解决方法:
(1)exportvg 然后importvg
(2)还有就是和ssa disk fence有关
这些我觉得好像是一回事,但是具体还不明白,研究中,希望各位高手能够给予指导,谢谢
[
本帖最后由 fengyan 于 2008-5-30 17:01 编辑
]
kettyalx
LU圣天使
UID 76177
精华
3
积分 2726
帖子 4178
活跃指数 294
LU金币 4358 个
LU金条 0 个
阅读权限 90
注册 2007-2-5
#2
大
中
小
使用道具
发表于 2008-5-8 22:04
资料
个人空间
短消息
加为好友
PV Status: hdisk3 005f81ba347dfdb5 PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
there are no good copies of the descriptor area.
?
fengyan
LU幼天使
UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
#3
大
中
小
使用道具
发表于 2008-5-8 22:11
资料
个人空间
短消息
加为好友
QUOTE:
原帖由
kettyalx
于 2008-5-8 22:04 发表
PV Status: hdisk3 005f81ba347dfdb5 PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
there are no good copies of the descriptor area.
?
就是手动挂卷组的时候有这样的提示,挂不上
fengyan
LU幼天使
UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
#4
大
中
小
使用道具
发表于 2008-5-8 22:52
资料
个人空间
短消息
加为好友
可能我说的不清楚,再来一遍。大虾救命啊
两台H85做的双机,备机出现问题,业务不能正常切换在备节点上运行
smitty ssaraid--》List All Defined SSA RAID Arrays
COMMAND STATUS
Command: OK stdout: yes stderr: no
Before command completion, additional instructions may appear below.
hdisk2 81BA000D6E934CO free good 72.9GB raid_10
hdisk3 81BA000D6EC24CO free good 145.8GB raid_10
手动挂载卷组# varyonvg vgdata
0516-013 varyonvg: The volume group cannot be varied on because
there are no good copies of the descriptor area.
系统有两个ssa卡,ssa0和ssa1
我听说这是write fast cache打开引起的
于事就在备节点上执行
1, 首先确定是由于cache_error操作引起的问题:
ssaraid -l ssa0 -Iz –a state=wrong_cache;这个时候系统输出损坏的raid组信息,如下:
2327340C228635K 2327340C228635K wrong_cache 36.4GB Raid-5 array
2, 强制禁止fastwrite属性关闭,如下命令:
ssaraid -l ssa0 -H -n 2327340C228635K -a fastwrite=off -a force=yes -u
3, 重新创建丢失的磁盘
ssaraid -l ssa0 -H -n 2327340C228635K -a use=syestem -k hdisk2 -d
此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功。
这时smitty ssaraid--》List All Defined SSA RAID Arrays
COMMAND STATUS
Command: OK stdout: yes stderr: no
Before command completion, additional instructions may appear below.
hdisk2 81BA000D6E934CO system good 72.9GB raid_10
hdisk3 81BA000D6EC24CO system good 145.8GB raid_10
但是主节点的业务也停了。
在主节点上运行
运行smitty ssaraid--》List All Defined SSA RAID Arrays
COMMAND STATUS
Command: OK stdout: yes stderr: no
Before command completion, additional instructions may appear below.
hdisk4 81BA000D6E934CO system good 72.9GB raid_10
hdisk5 81BA000D6EC24CO system good 145.8GB raid_10
在主节点上手动varyonvg 提示
# varyonvg vgdata
PV Status: hdisk3 005f81ba347dfdb5 PVNOTFND
0516-013 varyonvg: The volume group cannot be varied on because
there are no good copies of the descriptor area.
在主节点上起双机,不成功
这是怎么回事啊,还请大家指导
turbo
LU小天使
UID 41378
精华
5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
#5
大
中
小
使用道具
发表于 2008-5-8 22:57
资料
个人空间
短消息
加为好友
备机已经varyonvg了,主机当然没法varyonvg啦
三套指标横行股市
一代权侠笑傲江湖
赌运长久
turbo
LU小天使
UID 41378
精华
5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
#6
大
中
小
使用道具
发表于 2008-5-8 22:58
资料
个人空间
短消息
加为好友
备机上lsvg -o 看看,再varyoffvg
三套指标横行股市
一代权侠笑傲江湖
赌运长久
fengyan
LU幼天使
UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
#7
大
中
小
使用道具
发表于 2008-5-8 23:01
资料
个人空间
短消息
加为好友
QUOTE:
原帖由
turbo
于 2008-5-8 22:58 发表
备机上lsvg -o 看看,再varyoffvg
大哥,我要从主机上执行varyonvg vgdata的时候,备机已经把vgdata varyoffvg掉了,今天虽然很晕,但是没晕倒这个地步,还是谢谢大哥你了
turbo
LU小天使
UID 41378
精华
5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
#8
大
中
小
使用道具
发表于 2008-5-8 23:08
资料
个人空间
短消息
加为好友
再仔细检查一下,我以12年的经验判断这个错误提示,你的vgdata一定被另外一台机器varyon了
三套指标横行股市
一代权侠笑傲江湖
赌运长久
turbo
LU小天使
UID 41378
精华
5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
#9
大
中
小
使用道具
发表于 2008-5-8 23:12
资料
个人空间
短消息
加为好友
最简单的方法,如果可以停机,把和这个vgdata相关的机器重起一次,在主节点其ha
三套指标横行股市
一代权侠笑傲江湖
赌运长久
fengyan
LU幼天使
UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
#10
大
中
小
使用道具
发表于 2008-5-8 23:19
资料
个人空间
短消息
加为好友
QUOTE:
原帖由
turbo
于 2008-5-8 23:12 发表
最简单的方法,如果可以停机,把和这个vgdata相关的机器重起一次,在主节点其ha
一共两台H85,共用一个7133.共享卷组是vgdata。在备节点上看到两个逻辑卷:hdisk2和hdisk3;主节点上看到的是hdisk4和hdisk5
请问我在备节点上执行了这三步:
1,首先确定是由于cache_error操作引起的问题:
ssaraid -l ssa0 -Iz –a state=wrong_cache;这个时候系统输出损坏的raid组信息,如下:
2327340C228635K 2327340C228635K wrong_cache 36.4GB Raid-5 array
2,强制禁止fastwrite属性关闭,如下命令:
ssaraid -l ssa0 -H -n 2327340C228635K -a fastwrite=off -a force=yes -u
3,重新创建丢失的磁盘
ssaraid -l ssa0 -H -n 2327340C228635K -a use=syestem -k hdisk2 -d
此时输出hdisk2 available的信息,表明hdisk2磁盘恢复成功。
那在主节点上是不是要把hdisk2和hdisk3的设备名rmdev掉,然后再cfgmgr呢?
还是直接像大哥你说的那样两个节点都重启下?
[广告]
论坛新开
【DB2产品家族】
【投资理财】
【行业应用】
板块
turbo
LU小天使
UID 41378
精华
5
积分 447
帖子 732
活跃指数 155
LU金币 1498 个
LU金条 0 个
阅读权限 20
注册 2006-2-24
#11
大
中
小
使用道具
发表于 2008-5-8 23:25
资料
个人空间
短消息
加为好友
1.主节点不动
2.备节点把hdisk rmdev掉
3.两个节点都重起
4.ha同步
5起ha
6再测试一下ha切换
三套指标横行股市
一代权侠笑傲江湖
赌运长久
[广告]
论坛新开
【DB2产品家族】
【投资理财】
【行业应用】
板块
fengyan
LU幼天使
UID 102895
精华 0
积分 57
帖子 94
活跃指数 11
LU金币 95 个
LU金条 0 个
阅读权限 20
注册 2008-2-27
#12
大
中
小
使用道具
发表于 2008-5-8 23:29
资料
个人空间
短消息
加为好友
QUOTE:
原帖由
turbo
于 2008-5-8 23:25 发表
1.主节点不动
2.备节点把hdisk rmdev掉
3.两个节点都重起
4.ha同步
5起ha
6再测试一下ha切换
谢谢这位大哥,铭记五内。。。
[广告]
论坛新开
【DB2产品家族】
【投资理财】
【行业应用】
板块
31
1/3
1
2
3
››
投票
交易
悬赏
活动
LoveUnix
专项技术区
> AIX -IBM UNIX
> 其他UNIX & Linux
> i5 (AS400) & IBM大机
> PC Server & HPC
> 存储设备
> 备份软件
> 网络 & 安全
> 编程开发 & Rational
> DB2 & Informix
> ORACLE等数据库
> 中间件技术
行业综合区
> 职业咨询 前程无忧
> 培训认证 行业入门
> 行业应用 项目实施
> 产品信息 商务交流
> Free download下载
交流灌水区
> 蓝色太平洋
> 墨香雅韵
> 共建家园
> 博客专区
当前时区 GMT+8, 现在时间是 2008-7-24 14:16
乐悠LoveUnix论坛-京ICP备05005823号
Thanks to
Discuz!
© 2001-2007 Power by
LoveUnix.net
Processed in 0.065805 second(s), 6 queries , Gzip enabled
TOP
清除 Cookies
-
联系我们
-
乐悠LoveUnix
-
Archiver
-
WAP
界面风格
----------
Discuz! 5 Default
新DISCUZ风格
控制面板首页
编辑个人资料
积分交易
公众用户组
好友列表
升级个人空间
基本概况
流量统计
客户软件
发帖量记录
论坛排行
主题排行
发帖排行
积分排行
在线时间
管理团队
管理统计