亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: HA備機(jī)宕機(jī) [打印本頁(yè)]

作者: ruyi_jixiang    時(shí)間: 2012-03-05 11:23
標(biāo)題: HA備機(jī)宕機(jī)
兩臺(tái)AIX機(jī)器雙機(jī),A機(jī)OS為5300-03,B機(jī)OS為5300-05,HA為5.2,串口心跳。
目前在B機(jī)上發(fā)現(xiàn)從1-12號(hào)發(fā)現(xiàn)大量Late in sending heartbeat,NIM thread blocked,Possible malfunction on local adapter錯(cuò)誤,12號(hào)在HMC上看到系統(tǒng)狀態(tài)為no active,B機(jī)宕機(jī),B機(jī)沒有任何應(yīng)用在跑,重啟后半個(gè)月內(nèi)沒有任何報(bào)錯(cuò)。這大概是什么原因造成的?

作者: leikai    時(shí)間: 2012-03-05 12:00
資源不足引起的啊
作者: ruyi_jixiang    時(shí)間: 2012-03-05 12:39
備機(jī)沒有跑任何應(yīng)用,正常情況肯定不會(huì)資源不足的
作者: hello_unix    時(shí)間: 2012-03-05 13:52
有沒有errpt的報(bào)錯(cuò),5.2版本的HA非常少用,一般這種故障,給HA打補(bǔ)丁,最好升級(jí)HA版本到目前成熟版本,比如5.4.1,或者將HA5.2的補(bǔ)丁打到最新,一般都可以解決問題
作者: ruyi_jixiang    時(shí)間: 2012-03-05 14:30
errpt錯(cuò)誤如下,我在懷疑是否是由于5.2的ha的心跳bug引起的備機(jī)宕機(jī)。
# errpt
IDENTIFIER  T C RESOURCE_NAME  DESCRIPTION
864D2CE3     P S topsvcs        NIM thread blocked
173C787F     I S topsvcs        Possible malfunction on local adapter
864D2CE3     P S topsvcs        NIM thread blocked
864D2CE3     P S topsvcs        NIM thread blocked
864D2CE3     P S topsvcs        NIM thread blocked
864D2CE3     P S topsvcs        NIM thread blocked
864D2CE3     P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
864D2CE3    P S topsvcs        NIM thread blocked
3C81E43F    P U topsvcs        Late in sending heartbeat
173C787F    I S topsvcs        Possible malfunction on local adapter
3C81E43F    P U topsvcs        Late in sending heartbeat
3C81E43F    P U topsvcs        Late in sending heartbeat
作者: AIX深入敵后    時(shí)間: 2012-03-05 15:26
沒錯(cuò);另外,做HA盡量將操作系統(tǒng)統(tǒng)一,你現(xiàn)在升級(jí)下試試(A、B機(jī)要一直)
作者: ruyi_jixiang    時(shí)間: 2012-03-05 15:38
回復(fù) 6# AIX深入敵后


    您是說的什么沒錯(cuò)啊,呵呵。
    操作系統(tǒng)版本不一致,那時(shí)候我都不在現(xiàn)場(chǎng),現(xiàn)在要升級(jí)估計(jì)有困難。。
作者: leikai    時(shí)間: 2012-03-05 16:45
串口心跳,這樣的報(bào)錯(cuò)很經(jīng)常
作者: ruyi_jixiang    時(shí)間: 2012-03-05 16:57
回復(fù) 8# leikai


    CPU內(nèi)存資源不足,導(dǎo)致串口發(fā)送心跳失敗,但是這是備機(jī),沒有任何壓力的啊。。
作者: hello_unix    時(shí)間: 2012-03-05 19:59
主機(jī)太忙,沒空給備機(jī)交流心跳信息
作者: leikai    時(shí)間: 2012-03-06 08:39
本帖最后由 leikai 于 2012-03-06 08:40 編輯

資源不足,IO大,為避免腦裂,HA把備機(jī)down掉

都說了,你還不信,唉!
作者: hoootong    時(shí)間: 2012-03-06 09:53
將您的HA5.2升級(jí)到最新的補(bǔ)丁,應(yīng)該可以解決問題
作者: ruyi_jixiang    時(shí)間: 2012-03-06 10:02
明白了,謝謝各位,呵呵!
作者: hinatayang    時(shí)間: 2012-03-06 15:28
這個(gè)是我懷疑是串口心跳速率的問題 修改一下串口心跳速率就可以避免這個(gè)報(bào)錯(cuò) 停雙機(jī)后 同步 再觀察幾天
作者: ruyi_jixiang    時(shí)間: 2012-03-06 15:29
回復(fù) 12# hoootong


    知道原因了,如何解決呢?升級(jí)HA的補(bǔ)丁到最新就可以了嗎?
作者: ruyi_jixiang    時(shí)間: 2012-03-12 16:29
查明原因?yàn)椋盒奶有問題;
若這時(shí)網(wǎng)絡(luò)線使用壓力過大,無法正常發(fā)送接收信息,會(huì)導(dǎo)致備機(jī)認(rèn)為主機(jī)已宕機(jī),這時(shí)備機(jī)將起來,其實(shí)主機(jī)還是正常的,會(huì)發(fā)生腦裂,因此,HA機(jī)制將備機(jī)宕機(jī)。
謝謝各位幫忙。




歡迎光臨 Chinaunix (http://www.72891.cn/) Powered by Discuz! X3.2