亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
樓主: send_linux
打印 上一主題 下一主題

[使用幫助] 自動化運維技術(shù)討論之----運維監(jiān)控如何幫你提前發(fā)現(xiàn)故障(獲獎名單已公布-2013-7-31) [復制鏈接]

論壇徽章:
22
CU大;照
日期:2013-09-18 15:22:06白羊座
日期:2014-04-14 22:56:32午馬
日期:2014-05-16 17:18:08巳蛇
日期:2014-05-30 20:53:19寅虎
日期:2014-06-03 10:53:34未羊
日期:2014-08-12 22:15:31神斗士
日期:2015-11-20 17:26:2515-16賽季CBA聯(lián)賽之浙江
日期:2016-03-15 18:27:4215-16賽季CBA聯(lián)賽之同曦
日期:2016-03-22 09:21:0115-16賽季CBA聯(lián)賽之北控
日期:2017-03-26 21:47:12技術(shù)圖書徽章
日期:2014-04-03 16:47:26摩羯座
日期:2014-03-25 23:51:36
11 [報告]
發(fā)表于 2013-07-08 11:37 |只看該作者
1,分享您在日常運維過程中是通過什么方式發(fā)現(xiàn)故障的?
開源cacti、zabbix、zenoss等開源軟件,還有用snmp做的一個破系統(tǒng),一些比較簡單的腳本。
交換機用netflow做流量分析。另外機房里面還用了IBM的tivoli。通常都是每天巡檢時看看有沒有警告之類的,
另外就是被監(jiān)控系統(tǒng)發(fā)告警短信了(悲劇)。

2,針對目前使用的故障的預警和監(jiān)控機制,您有哪些優(yōu)化心得或建議,請分享一二?
有些東西軟件沒有的話就得自己寫腳本,但是預警和監(jiān)控肯定是要設置好規(guī)則,不然每天收到一大堆的監(jiān)控信息郵件就是個問題,會讓
人看都看不過來的。另外就是每天做好規(guī)劃的巡檢事務,有序的逐項檢查,不能忽視每一項,因為會出現(xiàn)一些以前完全沒有發(fā)生過問題
的系統(tǒng)出問題。最后就是寫好故障處理歷史,形成良好的故障處理記錄,以后一查就大概能直到是什么回事了。

論壇徽章:
2
CU大牛徽章
日期:2013-04-17 11:46:28CU大;照
日期:2013-04-17 11:46:39
12 [報告]
發(fā)表于 2013-07-08 13:44 |只看該作者
主題好像是說如何提前發(fā)現(xiàn)問題,感覺變成了監(jiān)控工具的討論了

論壇徽章:
0
13 [報告]
發(fā)表于 2013-07-08 15:55 |只看該作者
回復 12# gavindev

監(jiān)控工具是提前發(fā)現(xiàn)故障的一種途徑,討論的會比較多,也歡迎提供其他方面的思路和經(jīng)驗分享:wink:


   

論壇徽章:
2
CU大牛徽章
日期:2013-04-17 11:46:28CU大;照
日期:2013-04-17 11:46:39
14 [報告]
發(fā)表于 2013-07-08 16:03 |只看該作者
本帖最后由 gavindev 于 2013-07-08 16:05 編輯

個人感覺可以細分點討論的幾個方面,
信息的采集:采集哪些數(shù)據(jù),采集方法
信息的記錄:是臨時報警用還是持久記錄在案
信息的后續(xù)處理:是展示成圖還是文本保存,是僅僅記錄,有需要去查看一下,還是能夠監(jiān)控閾值,超過則報警
告警方式:手機短信,QQ,還是郵件等,或者是人工
告警的實時性:是實時還是監(jiān)控10分鐘,5分鐘,1分鐘
也可以包括如何記錄處理記錄,
如何做到比用戶先發(fā)現(xiàn)問題,比業(yè)務方先發(fā)現(xiàn)問題



論壇徽章:
0
15 [報告]
發(fā)表于 2013-07-08 21:33 |只看該作者
用過cacti
上次下載過osa 看了一下大概是用python+php+shell腳本實現(xiàn)的吧?
既然用了python  為何前臺不直接用django之類框架的呢
我不懂php....只好舍棄了

論壇徽章:
49
15-16賽季CBA聯(lián)賽之福建
日期:2016-06-22 16:22:002015年亞洲杯之中國
日期:2015-01-23 16:25:12丑牛
日期:2015-01-20 09:39:23未羊
日期:2015-01-14 23:55:57巳蛇
日期:2015-01-06 18:21:36雙魚座
日期:2015-01-02 22:04:33午馬
日期:2014-11-25 09:58:35辰龍
日期:2014-11-18 10:40:07寅虎
日期:2014-11-13 22:47:15申猴
日期:2014-10-22 15:29:50摩羯座
日期:2014-08-27 10:49:43辰龍
日期:2014-08-21 10:47:58
16 [報告]
發(fā)表于 2013-07-08 22:41 |只看該作者
perpyy 發(fā)表于 2013-07-08 21:33
用過cacti
上次下載過osa 看了一下大概是用python+php+shell腳本實現(xiàn)的吧?
既然用了python  為何前臺不直 ...


@osapub  幫忙看看呢?

論壇徽章:
0
17 [報告]
發(fā)表于 2013-07-09 00:15 |只看該作者
本帖最后由 litao941 于 2013-07-09 00:17 編輯

我也來湊湊熱鬧

分享您在日常運維過程中是通過什么方式發(fā)現(xiàn)故障的?
第一個問題說3點:

1. 監(jiān)控平臺(最能第一時間反映問題出在哪里,某個服務掛了,空間滿了……)

2. 日志及相關(guān)服務進程是否正常(通過錯誤日志、系統(tǒng)進程是否正常來著手,也是1的進化版,90%問題在這步能搞定)

3. 例如性能瓶頸引發(fā)的故障問題,從監(jiān)控和日志都可能無法獲取,業(yè)務邏輯復雜性,可能需要開發(fā)協(xié)同查問題,這是最麻煩的,處理時間 30min +

附一個處理故障流程圖:



針對目前使用的故障的預警和監(jiān)控機制,您有哪些優(yōu)化心得或建議,請分享一二?
第二個問題也說3點:

1. OSA 部署過,監(jiān)控配置的復雜性沒有做到更好的智能化(或者說自動化不夠),一般服務器上跑應用是必須的,模塊化的嵌入到
這些服務器上如純 web(nginx/apache+php) 的監(jiān)控, 數(shù)據(jù)庫緩存(redis/mongo/mysql……)監(jiān)控,目前這些監(jiān)控需要有一
個通用web api,用戶直接通過平臺來輸入一些信息即可添加成功,而不是手動的去增加文件之類,另外這些“插件”也不是很齊全。

2. 監(jiān)控的關(guān)聯(lián)性需要完善, 例如有三個站點要在監(jiān)控平臺上,涉及到的監(jiān)控服務多了,可能無法直接關(guān)聯(lián),比如其中一個502,我們
需要更快的速度去發(fā)現(xiàn)是這個站點是 php 有問題,還是緩存有問題,又或者是數(shù)據(jù)庫問題。將同一個域名關(guān)聯(lián)到一個組,可以一眼望
盡。同樣,可以按不同服務來 group by。

3. 說一點建議,前面發(fā)現(xiàn)故障第二點有提到,90% 問題能在日志和進程中服務體現(xiàn),如何集中快捷提取這些日志,針對出現(xiàn)過如
“error”、“warnning”關(guān)鍵字報警機制,希望能在OSA 中實現(xiàn)。

論壇徽章:
0
18 [報告]
發(fā)表于 2013-07-09 00:24 |只看該作者
再補一下:監(jiān)控的方式不管是使用的agent 還是snmp,監(jiān)控工具不管是nagios、cacti、zabbix、還是osa,都是為了達到同樣的目的--->便于我們快速發(fā)現(xiàn)和定位故障。

osa 雖有不足,但只要去做,才有能做出好樣工具的希望,支持osa 開發(fā)者們!

論壇徽章:
18
卯兔
日期:2013-09-27 17:41:0615-16賽季CBA聯(lián)賽之佛山
日期:2016-07-09 17:34:45操作系統(tǒng)版塊每周發(fā)帖之星
日期:2015-12-02 15:01:04IT運維版塊每日發(fā)帖之星
日期:2015-12-02 06:20:00IT運維版塊每日發(fā)帖之星
日期:2015-10-07 06:20:00IT運維版塊每日發(fā)帖之星
日期:2015-10-03 06:20:00IT運維版塊每日發(fā)帖之星
日期:2015-10-01 06:20:00羊年新春福章
日期:2015-04-01 17:56:06拜羊年徽章
日期:2015-04-01 17:56:062015年迎新春徽章
日期:2015-03-04 09:49:452015年辭舊歲徽章
日期:2015-03-03 16:54:15天秤座
日期:2015-01-14 06:39:28
19 [報告]
發(fā)表于 2013-07-09 08:02 |只看該作者
本帖最后由 qingduo04 于 2013-07-09 08:03 編輯

1,分享您在日常運維過程中是通過什么方式發(fā)現(xiàn)故障的?
   主要原理是根部不同的監(jiān)控內(nèi)容采取不同的監(jiān)控方式進行監(jiān)控,主要有:
   1.數(shù)據(jù)庫級別的監(jiān)控,包含表空間、事務日志、數(shù)據(jù)庫連接正常與否,分區(qū)數(shù)據(jù)庫各分區(qū)連接正常與否,通過perl程序和java 進行監(jiān)控,出現(xiàn)異常或者達到閥值進行報警。
   2.針對windows主機、小型機、linux主機等進行python監(jiān)控,主要是監(jiān)控主機PING是否正常?小型機硬件報警?文件系統(tǒng)空間是否正常?相關(guān)的關(guān)鍵程序(核心程序)是否正常? 通過配置進行閥值報警。
   3. 針對服務器等監(jiān)控,一般采用機房巡檢的方式,涉及到設備繁多、hp、ibm小型機、刀片、存儲等監(jiān)控。 。

2,針對目前使用的故障的預警和監(jiān)控機制,您有哪些優(yōu)化心得或建議,請分享一二?
   當前我們監(jiān)控系統(tǒng)對于前兩種比較好,但是機房巡檢這個有時候很耗費人力和物力,尤其是機房離辦公場所很遠的時候,耗費的更多了!
綜述現(xiàn)場監(jiān)控沒有采用開源的監(jiān)控軟件,比如osa等監(jiān)控,純屬是自己根據(jù)現(xiàn)場情況進行報警,當然需要報警的內(nèi)容應該還遠遠不夠,比如存儲鏈路等,還請各位大俠互享一下監(jiān)控方式,讓我們能學習一下。謝謝

論壇徽章:
18
卯兔
日期:2013-09-27 17:41:0615-16賽季CBA聯(lián)賽之佛山
日期:2016-07-09 17:34:45操作系統(tǒng)版塊每周發(fā)帖之星
日期:2015-12-02 15:01:04IT運維版塊每日發(fā)帖之星
日期:2015-12-02 06:20:00IT運維版塊每日發(fā)帖之星
日期:2015-10-07 06:20:00IT運維版塊每日發(fā)帖之星
日期:2015-10-03 06:20:00IT運維版塊每日發(fā)帖之星
日期:2015-10-01 06:20:00羊年新春福章
日期:2015-04-01 17:56:06拜羊年徽章
日期:2015-04-01 17:56:062015年迎新春徽章
日期:2015-03-04 09:49:452015年辭舊歲徽章
日期:2015-03-03 16:54:15天秤座
日期:2015-01-14 06:39:28
20 [報告]
發(fā)表于 2013-07-09 08:08 |只看該作者
回復 19# qingduo04


    再補充一下,前兩種有短信報警和平臺報警,后一種純屬人工報警。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區(qū)
中國互聯(lián)網(wǎng)協(xié)會會員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP