- 論壇徽章:
- 0
|
首先監(jiān)控系統(tǒng)最應該關(guān)注故障處理和數(shù)據(jù)展現(xiàn),先說說數(shù)據(jù)展現(xiàn),看過太多的監(jiān)控軟件,從2008年奧運會用的新加坡網(wǎng)利,到國內(nèi)的游龍等,大家都在追求好的監(jiān)控數(shù)據(jù)的展現(xiàn)方式,這里討論的展現(xiàn)方式不是說多么好看的報表,那些還上不了臺面。這里討論的數(shù)據(jù)展現(xiàn)關(guān)注的是如何讓用戶怎么使用這些監(jiān)控數(shù)據(jù)。大家可能看到過這樣的系統(tǒng),一上來左邊就看到一堆IT資源的樹列表,點擊哪個就看哪個;或者好一點的是把這些IT資源在左邊樹里面,按照設(shè)備類型分了一下類;其實一直以來運維監(jiān)控領(lǐng)域就一直在關(guān)注數(shù)據(jù)展現(xiàn)這個問題,像什么BSM等這些概念,那到底什么才是好的數(shù)據(jù)展現(xiàn)方式呢?BSM指出了一個方向,那就是把IT資源和業(yè)務關(guān)聯(lián)在一起,方向是沒錯的,但到底如何做呢?我們看到國內(nèi)很多軟件公司跟風BSM,但開發(fā)出來的東西確實不敢說好用。我們認為一個理想的BSM監(jiān)控數(shù)據(jù)展現(xiàn)方式應該是這樣的,IT資源在監(jiān)控系統(tǒng)內(nèi)部是按照一個統(tǒng)一的方式來看待的,不管你是一臺服務器、還是一個服務器上的CPU利用率;當我們想建立BSM視圖的時候,可以非常方便的把這些IT資源任意的拖動到我們的視圖里來,如下圖所示:
主視圖監(jiān)控orig.gif (46.95 KB, 下載次數(shù): 158)
下載附件
2010-07-24 06:57 上傳
現(xiàn)在再來說說故障處理,一個好的故障處理方式應該是靈活的,現(xiàn)在看到好多開源監(jiān)控軟件提供的閥值設(shè)置都很簡單,就一個值,一個比較方式,一個故障級別;其實閥值設(shè)置這一塊應該比這個更靈活,如有這樣一個場景,有臺服務器如果在10分鐘內(nèi),有兩次ping在150ms-200ms之間的,就應該向操作人員告警;這里只是以閥值這個最常用的故障判斷方式為例來說明故障處理,下圖是我們的一個閥值設(shè)置截圖:
監(jiān)控_閥值設(shè)置.gif (6.89 KB, 下載次數(shù): 189)
下載附件
閥值設(shè)置
2010-07-24 07:04 上傳
有機會到討論,好的監(jiān)控系統(tǒng)更多的是細節(jié),歡迎使用我們提供的永久免費IT監(jiān)控軟件,我們的聯(lián)系方式mail:yunweitec@yahoo.cn; qq: 1054618780;
from yunweitec |
|