標(biāo)題: HA備機(jī)宕機(jī) [打印本頁(yè)] 作者: ruyi_jixiang 時(shí)間: 2012-03-05 11:23 標(biāo)題: HA備機(jī)宕機(jī) 兩臺(tái)AIX機(jī)器雙機(jī),A機(jī)OS為5300-03,B機(jī)OS為5300-05,HA為5.2,串口心跳。
目前在B機(jī)上發(fā)現(xiàn)從1-12號(hào)發(fā)現(xiàn)大量Late in sending heartbeat,NIM thread blocked,Possible malfunction on local adapter錯(cuò)誤,12號(hào)在HMC上看到系統(tǒng)狀態(tài)為no active,B機(jī)宕機(jī),B機(jī)沒有任何應(yīng)用在跑,重啟后半個(gè)月內(nèi)沒有任何報(bào)錯(cuò)。這大概是什么原因造成的? 作者: leikai 時(shí)間: 2012-03-05 12:00
資源不足引起的啊作者: ruyi_jixiang 時(shí)間: 2012-03-05 12:39
備機(jī)沒有跑任何應(yīng)用,正常情況肯定不會(huì)資源不足的作者: hello_unix 時(shí)間: 2012-03-05 13:52
有沒有errpt的報(bào)錯(cuò),5.2版本的HA非常少用,一般這種故障,給HA打補(bǔ)丁,最好升級(jí)HA版本到目前成熟版本,比如5.4.1,或者將HA5.2的補(bǔ)丁打到最新,一般都可以解決問題作者: ruyi_jixiang 時(shí)間: 2012-03-05 14:30
errpt錯(cuò)誤如下,我在懷疑是否是由于5.2的ha的心跳bug引起的備機(jī)宕機(jī)。
# errpt
IDENTIFIER T C RESOURCE_NAME DESCRIPTION
864D2CE3 P S topsvcs NIM thread blocked
173C787F I S topsvcs Possible malfunction on local adapter
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
864D2CE3 P S topsvcs NIM thread blocked
3C81E43F P U topsvcs Late in sending heartbeat
173C787F I S topsvcs Possible malfunction on local adapter
3C81E43F P U topsvcs Late in sending heartbeat
3C81E43F P U topsvcs Late in sending heartbeat作者: AIX深入敵后 時(shí)間: 2012-03-05 15:26
沒錯(cuò);另外,做HA盡量將操作系統(tǒng)統(tǒng)一,你現(xiàn)在升級(jí)下試試(A、B機(jī)要一直)作者: ruyi_jixiang 時(shí)間: 2012-03-05 15:38 回復(fù) 6# AIX深入敵后