- 論壇徽章:
- 0
|
近期,單位里的Datastage服務(wù)器突然down機(jī)了。經(jīng)過恢復(fù)操作系統(tǒng)之后,Datastage服務(wù)就工作不正常了。
具體癥狀是:
1.恢復(fù)操作系統(tǒng)后,發(fā)現(xiàn)/home/dsadm下的Datastage版本被恢復(fù)到老版本了;很多以前部署的任務(wù),沒法用了。
2.通過查找,發(fā)現(xiàn)Down機(jī)前Datastage軟件還在,位于存儲(chǔ)上的一塊盤上。真是謝天謝地。
3.經(jīng)過重新掛接,把那塊盤接到了其他目錄/mac下
4.直接運(yùn)行/mac下的 Ascential/DataStage/DSEngine/bin/uv -admin -start,服務(wù)起不來。想拿/mac下的內(nèi)容去覆蓋/home/dsadm,報(bào)deveice busy.估計(jì)有什么庫(kù)被加載到內(nèi)存中了。
5.通過修改/mac下的dsenv文件,使得/mac下的Datastage Server能起來了。部分Datastage任務(wù)也能跑了。問題似乎排除了。
6.嘗試使用Informix Native方式連接的job時(shí),報(bào)錯(cuò),說是Informix driver 初始化失敗。
7.再調(diào)試dsenv,發(fā)現(xiàn)Datastage服務(wù)也起不來了。
8.問題變復(fù)雜了,Datastage服務(wù)起不來了,而且informix數(shù)據(jù)庫(kù)也連不上了。
9.Datastage 服務(wù)起不來的癥狀是 :
uv -admin -start 命令拍好,馬上回到提示符,沒有任何響應(yīng)。正常情況應(yīng)該是,列出很多l(xiāng)ocale被加載的信息。
10.請(qǐng)IBM澳洲遠(yuǎn)程支持,給出了2條命令:
ipcs -m
ipcrm 2504
但是問題沒有解決
11.請(qǐng)IBM本地工程師協(xié)查,決定從系統(tǒng)啟動(dòng)時(shí)調(diào)用的啟動(dòng)Datastage服務(wù)腳本入手,進(jìn)行調(diào)試。
uv是個(gè)二進(jìn)制的文件,沒法跟蹤;但是實(shí)際啟動(dòng)的服務(wù)的,還有另外的腳本,存放在/sbin/init下
名字為ds.rc
12.通過單步調(diào)試,終于發(fā)現(xiàn),只要共享內(nèi)存中存在了datastage服務(wù)的標(biāo)志,就不會(huì)再起datastage服務(wù)。原來之所以前面沒有起來,是因?yàn)楣蚕韮?nèi)存步干凈。也難怪IBM澳洲要我們傳完整的清單給他們。
13.根據(jù)腳本里的代碼,手工檢查共享內(nèi)存(ipcs -m),果然發(fā)現(xiàn)了殘留的進(jìn)程。通過ipcrm,刪除進(jìn)程。再起服務(wù),一次性成功。
14.Datastage服務(wù)正常,但是informix數(shù)據(jù)庫(kù)仍然連接失敗,雖然通過Dbaccess可以正常連接。
15.IBM informix專家到場(chǎng),再次檢查informix CSDK版本,發(fā)現(xiàn)異常。當(dāng)前使用的 CSDK是64 bit version,但是Datastage要求使用32 bit Version.再向之前配合恢復(fù)系統(tǒng)的 IBM Informix工程師求證,果然是他因?yàn)椴涣私馇闆r,誤裝64 bit version CSDK for informix 10.
16.更換版本之后,全部恢復(fù)正常。
本文來自ChinaUnix博客,如果查看原文請(qǐng)點(diǎn):http://blog.chinaunix.net/u/4353/showart_1883572.html |
|