- 論壇徽章:
- 28
|
看到子萌在群里的鏈接,正好前一陣子在做監(jiān)控系統(tǒng)的轉(zhuǎn)換,就來(lái)參與下~
1、你所用過(guò)的監(jiān)控軟件有哪些?感覺(jué)有什么優(yōu)缺點(diǎn)?
Zabbix:
優(yōu)點(diǎn):
應(yīng)用比較成熟,不需要做太多的二次開(kāi)發(fā)
server-proxy-agent部署結(jié)構(gòu)比較清晰
支持插件
自動(dòng)注冊(cè)的判斷規(guī)則和后續(xù)動(dòng)作的組合很多進(jìn)而可以支持基于主機(jī)名或其他的各種主機(jī)管理減少人工干預(yù)
逆天的discovery支持在各個(gè)地方使用變量,除了各種name標(biāo)識(shí)外,甚至還包括trigger判斷的閾值,報(bào)警信息等.
監(jiān)控種類(lèi)比較齊全,如windows,交換機(jī),虛機(jī)等...
缺點(diǎn):
不友好的視圖組合支持.screen太難用.
存儲(chǔ)不支持水平擴(kuò)展.
性能有瓶頸,主要出現(xiàn)在server的數(shù)據(jù)庫(kù)上.機(jī)器數(shù)量3000+,nvps在4000左右出現(xiàn)瓶頸,這個(gè)數(shù)值貌似是不包含zabbix_sender通過(guò)文件方式傳回的value的,在規(guī)劃監(jiān)控項(xiàng)的interval的時(shí)候往往要遷就性能,不能支持更細(xì)時(shí)間粒度的監(jiān)控,就是省著使用
監(jiān)控配置復(fù)雜度太高.簡(jiǎn)單的監(jiān)控還好,配一個(gè)變量比較多的discovery往往要調(diào)試很久,要更新腳本,conf,調(diào)試sender文件內(nèi)容
主機(jī)名修改后要重啟agent才能生效...不然一直往老的host上吐數(shù)據(jù)...
不支持主機(jī)組和模板之間的綁定,只能用自動(dòng)注冊(cè)的動(dòng)作來(lái)山寨的綁定.
所有監(jiān)控項(xiàng)的收集都需要提前配置
Falcon:
優(yōu)點(diǎn):
部署模塊拆分的更細(xì),結(jié)構(gòu)更清晰.portal,dashboard,transfer,agent,judge,sender,alert,graph等等.
各個(gè)模塊均支持水平擴(kuò)展.擴(kuò)容相當(dāng)容易.
支持多種監(jiān)控?cái)?shù)據(jù)的展示方式,比zabbix的graph,screen好用1W倍.
監(jiān)控策略配置簡(jiǎn)單,更容易面向用戶(hù).
支持插件,類(lèi)似zabbix的腳本,這里值得一提的是這個(gè)插件自帶時(shí)間調(diào)度,命名類(lèi)似10_scriptname.sh的腳本名的時(shí)候,會(huì)每10秒執(zhí)行一次.一些簡(jiǎn)單的模塊監(jiān)控可以放到這里面.
judge和graph分離,報(bào)警判斷和繪圖是2個(gè)模塊,互不影響.
http協(xié)議的自定義監(jiān)控項(xiàng)數(shù)據(jù)收集.并且收集的監(jiān)控項(xiàng)不需要提前配置.大大減小了自定義監(jiān)控項(xiàng)收集的復(fù)雜程度.
缺點(diǎn):
需要大量的二次開(kāi)發(fā),最好能對(duì)接一套內(nèi)部的管理平臺(tái)來(lái)進(jìn)行主機(jī)管理.
插件生效需要配置,這個(gè)配置只能和主機(jī)組綁定,而不是主機(jī)組配置的模板綁定.
報(bào)警內(nèi)容不支持自定義變量
監(jiān)控項(xiàng)的interval從小改大的時(shí)候,圖像會(huì)有斷點(diǎn),還沒(méi)看過(guò)源碼,估計(jì)是只有在第一次注冊(cè)監(jiān)控項(xiàng)的時(shí)候才寫(xiě)interval的值,后面判斷有這個(gè)監(jiān)控項(xiàng)的時(shí)候interval就不再判斷了.但是不敢肯定哈,求大神指正.
2、你認(rèn)為在監(jiān)控軟件的使用過(guò)程中,有哪些難點(diǎn)?
我認(rèn)為在使用監(jiān)控軟件的使用過(guò)程中,并沒(méi)有難點(diǎn)…各種功能的實(shí)現(xiàn)總是最簡(jiǎn)單的.
關(guān)鍵是怎么用好工具.
最難的其實(shí)還是掌控業(yè)務(wù).
域名監(jiān)控,語(yǔ)義監(jiān)控,模塊監(jiān)控,結(jié)構(gòu)體監(jiān)控,日志監(jiān)控,這些的規(guī)劃和實(shí)現(xiàn)都有方法可循,可怎么通過(guò)這些監(jiān)控100%覆蓋自己的業(yè)務(wù),并且精確定位到故障,這個(gè)才是最難的.其中還涉及一個(gè)在后端分析報(bào)警內(nèi)容的事情…也是我后面主要的精力投入點(diǎn).
說(shuō)一個(gè)不算難點(diǎn)的地方,就是其實(shí)這兩套監(jiān)控系統(tǒng)都要上額外的配置管理,其他的就沒(méi)了.
3、在監(jiān)控軟件使用過(guò)程中,有哪些收獲?
收獲還是比較多,一開(kāi)始參與的時(shí)候可能只是底層腳本的編寫(xiě),然后提升到部署級(jí)別,更好的了解ha,容災(zāi),在架構(gòu)思想上有進(jìn)益,然后監(jiān)控軟件選型,知道不同監(jiān)控的優(yōu)劣所在,學(xué)會(huì)思考,培養(yǎng)大局觀.
然后在這個(gè)過(guò)程中,對(duì)自己的服務(wù)的掌控能力也會(huì)越來(lái)越強(qiáng). |
|