标题: AIX下怎么把CPU停掉几颗?
  本主题由 老农 于 2007-12-31 15:41 加入精华 
maliang
LU幼天使
Rank: 2



UID 96627
精华 0
积分 47
帖子 83
活跃指数 7
LU金币 72 个
LU金条 0 个
阅读权限 20
注册 2007-9-26
 
发表于 2008-3-25 08:42  资料  个人空间  短消息  加为好友 
参考大家的意见吧
关机,重新分配
配置DLPAR,在分出去两个即可

顶部
炸鸡
超级版主
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
传说中的大色狼


LU爱心使者  
UID 134
精华 32
积分 11322
帖子 21021
活跃指数 726
LU金币 15577 个
LU金条 16 个
阅读权限 251
注册 2003-9-26
来自 鸡窝
 
发表于 2008-3-25 08:45  资料  个人空间  主页 短消息  加为好友 
再做一个cfgmgr,然后连bindprocessor的结果也变了。看来我又猜错了。


root@rs41:/usr/sbin>cfgmgr
root@rs41:/usr/sbin>lsdev -Ccprocessor
proc0 Available 00-00 Processor
root@rs41:/usr/sbin>bindprocessor -q
The available processors are:  0 1


22楼里面有个解释,就是要reboot之后才能令deallocate的那个重新认回来使用。

顶部
炸鸡
超级版主
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
传说中的大色狼


LU爱心使者  
UID 134
精华 32
积分 11322
帖子 21021
活跃指数 726
LU金币 15577 个
LU金条 16 个
阅读权限 251
注册 2003-9-26
来自 鸡窝
 
发表于 2008-3-25 08:48  资料  个人空间  主页 短消息  加为好友 
我明白了,那是时间问题。

我们打bindprocessor命令太快了,原来在里面的processor还没放出来。

22楼的兄弟,估计你多等一会,或者做个cfgmgr就看到效果了。

顶部
炸鸡
超级版主
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
传说中的大色狼


LU爱心使者  
UID 134
精华 32
积分 11322
帖子 21021
活跃指数 726
LU金币 15577 个
LU金条 16 个
阅读权限 251
注册 2003-9-26
来自 鸡窝
 
发表于 2008-3-25 09:08  资料  个人空间  主页 短消息  加为好友 
好,重起后,刚才deallocate的cpu重新认回来,我们重做一次试验。


先检查现在的状态:
netwms@rs41:/home/netwms>bindprocessor -q
The available processors are:  0 1 2 3


netwms@rs41:/home/netwms>lsdev -Ccprocessor
proc0 Available 00-00 Processor
proc2 Available 00-02 Processor

netwms@rs41:/home/netwms>vmstat 1

System configuration: lcpu=4 mem=2048MB

kthr    memory              page              faults        cpu
----- ----------- ------------------------ ------------ -----------
r  b   avm   fre  re  pi  po  fr   sr  cy  in   sy  cs us sy id wa
0  0 149849 349718   0   0   0   0    0   0  77  359 480  0  0 97  2


开始deallocate,请看输出:

root@rs41:/>cd /usr/sbin
root@rs41:/usr/sbin>./cpu_deallocate 2
root@rs41:/usr/sbin>lsdev -Ccprocessor
proc0 Available 00-00 Processor
root@rs41:/usr/sbin>bindprocessor -q
The available processors are:  0 1


root@rs41:/usr/sbin>vmstat 1

System configuration: lcpu=2 mem=2048MB

kthr    memory              page              faults        cpu
----- ----------- ------------------------ ------------ -----------
r  b   avm   fre  re  pi  po  fr   sr  cy  in   sy  cs us sy id wa
0  0 150121 349224   0   0   0   0    0   0  20  406 376  0  0 99  0


好,状态正常得不得了。因为刚启动机器,进程还很少,所以处理器里的进程可以马上都放出来,跟上次的效果有点不同,那么可以说,那真的是时间的问题了。

22楼如果能再做个测试,等一等它,应该也好了。

顶部
lianyw
LU小天使
Rank: 3Rank: 3



UID 12322
精华 1
积分 361
帖子 621
活跃指数 53
LU金币 2745 个
LU金条 0 个
阅读权限 40
注册 2004-2-19
 
发表于 2008-3-25 09:17  资料  个人空间  短消息  加为好友 
鸡哥的测试真好。。。。。

顶部
炸鸡
超级版主
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
传说中的大色狼


LU爱心使者  
UID 134
精华 32
积分 11322
帖子 21021
活跃指数 726
LU金币 15577 个
LU金条 16 个
阅读权限 251
注册 2003-9-26
来自 鸡窝
 
发表于 2008-3-25 09:19  资料  个人空间  主页 短消息  加为好友 
不过,有后遗症:

在lpar上做了deallocate后,在hmc上的资料不能更新,这跟我之前说的一样(因为权限的问题)。
现在hmc上看到这个分区还是占用了两个cpu,我尝试用dlpar去remove一个cpu,也是失败的。那就是说,在hmc里面,他还是记住了两个cpu,但在lpar上已经屏蔽了一个,大家的记录不匹配,导致失败。我现在只能shutdown -F了。

顶部
[广告] 记录自己的思想火花,留住每日的技术积累,尽在拥有属于自己独立域名的博客。
炸鸡
超级版主
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
传说中的大色狼


LU爱心使者  
UID 134
精华 32
积分 11322
帖子 21021
活跃指数 726
LU金币 15577 个
LU金条 16 个
阅读权限 251
注册 2003-9-26
来自 鸡窝
 
发表于 2008-3-25 09:24  资料  个人空间  主页 短消息  加为好友 
总结:
没做分区的情况下,用cpu_deallocate还是有效的,留意要重新用那些deallocate的cpu,得重起。

在分区的情况下,建议用chhwres,这样可以保证hmc与lpar之间的数据同步,并且再用cpu的话,不需要重起。这种情况的操作前提是dlpar正常。

顶部
[广告] 记录自己的思想火花,留住每日的技术积累,尽在拥有属于自己独立域名的博客。
炸鸡
超级版主
Rank: 17Rank: 17Rank: 17Rank: 17Rank: 17
传说中的大色狼


LU爱心使者  
UID 134
精华 32
积分 11322
帖子 21021
活跃指数 726
LU金币 15577 个
LU金条 16 个
阅读权限 251
注册 2003-9-26
来自 鸡窝
 
发表于 2008-3-25 09:30  资料  个人空间  主页 短消息  加为好友 
补充:

在做完deallocate之后,在errpt会出现一个信息,一个硬件报错。估计是aix认为cpu有故障了,呵呵。


804E987A   0325092508 I O proc2          CPU DEALLOCATED
1B963892   0325092508 P H proc2          CPU FAILURE PREDICTED


************************************************************
详细信息:
LABEL:          CPU_DEALLOC_SUCCESS
IDENTIFIER:     804E987A

Date/Time:       Tue Mar 25 08:53:02 TAIST 2008
Sequence Number: 86971
Machine Id:      00CA77FF4C00
Node Id:         rs41
Class:           O
Type:            INFO
Resource Name:   proc2

Description
CPU DEALLOCATED

        Recommended Actions
        MAINTENANCE IS REQUIRED BECAUSE OF CPU FAILURE

Detail Data
LOGICAL DEALLOCATED CPU NUMBER
           2

*******************************************************

再贴硬件报错那个详细信息:


---------------------------------------------------------------------------
LABEL:          CPU_FAIL_PREDICTED
IDENTIFIER:     1B963892

Date/Time:       Tue Mar 25 08:53:01 TAIST 2008
Sequence Number: 86970
Machine Id:      00CA77FF4C00
Node Id:         rs41
Class:           H
Type:            PEND
Resource Name:   proc2
Resource Class:  processor
Resource Type:   proc_rspc
Location:

Description
CPU FAILURE PREDICTED

Probable Causes
CPU FAILURE

Failure Causes
CPU FAILURE

        Recommended Actions
        ENSURE CPU GUARD MODE IS ENABLED
        LOOK FOR A LATER CPU DEALLOCATION EVENT IN THIS LOG
        RUN SYSTEM DIAGNOSTICS.

Detail Data
PROBLEM DATA
0644 00E3 0000 0088 AE00 8E00 0000 0000 0000 0000 4942 4D00 5048 0030 0100 A227
2008 0325 0053 0000 0000 0000 0000 0000 4C00 0004 0000 0000 0000 0000 0000 0000
0000 0083 0000 0000 5548 0018 0100 A227 8303 2080 0000 0000 0000 0000 0000 0000
4D54 001C 0100 A227 3931 3139 2D35 3935 3833 4137 3746 4600 0000 0000 4C52 0014
0100 A227 1000 0000 0000 0002 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

(以下省略10000个0)

[ 本帖最后由 炸鸡 于 2008-3-25 09:32 编辑 ]

顶部
[广告] 记录自己的思想火花,留住每日的技术积累,尽在拥有属于自己独立域名的博客。
blackcat
LU小天使
Rank: 3Rank: 3



UID 36013
精华 0
积分 227
帖子 417
活跃指数 11
LU金币 2414 个
LU金条 0 个
阅读权限 40
注册 2005-11-1
 
发表于 2008-3-25 09:38  资料  个人空间  短消息  加为好友 
学习了学习

顶部
[广告] 记录自己的思想火花,留住每日的技术积累,尽在拥有属于自己独立域名的博客。
哞哞牛
LU小天使
Rank: 3Rank: 3


UID 102028
精华 3
积分 273
帖子 504
活跃指数 55
LU金币 801 个
LU金条 0 个
阅读权限 40
注册 2008-1-29
来自 火焰山-燃烧军团
 
发表于 2008-3-25 10:01  资料  个人空间  短消息  加为好友  添加 哞哞牛 为MSN好友 通过MSN和 哞哞牛 交谈 QQ
cpu_deallocate 2是针对CPU线程的对吧
那么屏蔽之后如何恢复呢?





科技以人为本。LoveAIX群13530530,技术交流、共同发展。
顶部
哞哞牛
LU小天使
Rank: 3Rank: 3


UID 102028
精华 3
积分 273
帖子 504
活跃指数 55
LU金币 801 个
LU金条 0 个
阅读权限 40
注册 2008-1-29
来自 火焰山-燃烧军团
 
发表于 2008-3-25 10:02  资料  个人空间  短消息  加为好友  添加 哞哞牛 为MSN好友 通过MSN和 哞哞牛 交谈 QQ
刷的好快啊,知道了,呵呵,鸡哥就是厉害





科技以人为本。LoveAIX群13530530,技术交流、共同发展。
顶部
sd127
技术专家
Rank: 14Rank: 14Rank: 14Rank: 14



UID 99055
精华 1
积分 91
帖子 158
活跃指数 12
LU金币 439 个
LU金条 0 个
阅读权限 200
注册 2007-11-21
 
发表于 2008-3-25 12:38  资料  个人空间  短消息  加为好友 
鸡哥真认真呀,赞一个。
cpu_deallocation命令是有延迟的,需要此CPU上的线程被调度的别的CPU上,对于较繁忙的系统可能需要几分钟,才能从bindprocessor -q的命令看到变化

顶部
 



当前时区 GMT+8, 现在时间是 2008-12-5 14:25
乐悠LoveUnix论坛-京ICP备05005823号

Thanks to Discuz!  © 2001-2007    Power by LoveUnix.net
Processed in 0.103164 second(s), 7 queries , Gzip enabled

清除 Cookies - 联系我们 - 乐悠LoveUnix - Archiver