亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標題: 【有獎討論】數據中心運維,主要看氣質,還要看品質,分享監(jiān)控軟件的點點滴滴。 [打印本頁]

作者: jackson198574    時間: 2015-12-09 20:57
標題: 【有獎討論】數據中心運維,主要看氣質,還要看品質,分享監(jiān)控軟件的點點滴滴。
獲獎詳情:http://72891.cn/thread-4235300-1-1.html

話題背景

隨著行業(yè)的發(fā)展,業(yè)務系統(tǒng)越來越龐大,涉及的軟硬件維護點越來越多,運維的復雜度和難度會越來越大;隨著去IOE的潮流和后IOE時代的架構特色,PC服務器、虛擬機和開源數據庫等軟硬件產品的比重上升,運維的內容和節(jié)點數量都有比較明顯的變化。

工欲善其事必先利其器,相信很多朋友都有使用運維監(jiān)控軟件的體驗,本次我們就來討論一下運維監(jiān)控的那些事。



  

討論話題
1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
3、在監(jiān)控軟件使用過程中,有哪些收獲?
歡迎大家對上述問題進行討論



討論時間
2015-12-10至2016-01-10


活動獎勵
活動結束后將選取4名討論精彩的童鞋,每人贈送一本《Zabbix監(jiān)控系統(tǒng)》圖書一本作為獎勵。



獎品簡介

作者: 王余應   
出版社:電子工業(yè)出版社
出版日期:2015 年5月
開本:16開
頁碼:343
版次:1-1
購買鏈接:http://product.dangdang.com/23684420.html


內容簡介

《Zabbix監(jiān)控系統(tǒng)》共分為9章,介紹了Zabbix系統(tǒng)的體系結構、安裝配置方法、數據采集方法、各個模塊的應用和配置方法,以及Zabbix系統(tǒng)的基本原理和規(guī)則等,并從操作系統(tǒng)層面、數據庫層面和Zabbix系統(tǒng)組件層面介紹了Zabbix系統(tǒng)的優(yōu)化方法。最后,作者結合多年的運維實踐經驗,總結出維護和管理Zabbix系統(tǒng)過程中所遇到的常見問題和技巧。





試讀樣章
Zabbix監(jiān)控系統(tǒng)試讀樣章.pdf (1.22 MB, 下載次數: 64)
作者: 刺客阿地    時間: 2015-12-10 12:08
本帖最后由 刺客阿地 于 2015-12-10 14:52 編輯

居然沒人出現(xiàn)?我先占個板凳。

目前公司用的是nagios ,cacti,其他監(jiān)控工具暫時沒用。

對于這兩種監(jiān)控工具,我工作當中暫時還沒怎么接觸,談不出優(yōu)缺點。。。樓下各位朋友走起......
作者: zongg    時間: 2015-12-10 12:10
1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?

答:從工作以來,我用過的監(jiān)控系統(tǒng)有cacti,nagios,zabbix.下面我就說說他們。
cacti是用snmp協(xié)議來取數據,通過rrdtool來儲存和更新數據(侟在rra下的文件里),并生成圖。由此可見snmp和rrdtool是cacti的關鍵。
但是我們并不需要深入的了解rrdtool,和snmp ,我們是需要通過簡單的配置就可以生成圖像,我對于我們來說很方便(優(yōu)點)。
rrdtool來處理數據效率高,多樣性繪圖,但是cacti監(jiān)控的內容不多(缺點)。有一些插件還是不錯的。我現(xiàn)在用的是monitor,mactrack,weathermap.
我們現(xiàn)在主要是用cacti來監(jiān)控交換機上的流量。

nagios是一款很專業(yè)的監(jiān)控軟件,監(jiān)控服務器狀態(tài)很強大。但是配置起來復雜一些。能監(jiān)控的應用層面(網絡服務監(jiān)控)的內容比cacti較多(優(yōu)點),插件也非常多。這個贊一個。
nagios會調用插件去檢測服務器狀態(tài),并把插件返回來的狀態(tài)信息并進行處理后,把狀態(tài)結果通過web顯示出來。并根據狀態(tài)實現(xiàn)告警。感覺報警機制要比cacti強。
圖像看著沒cacti好。(缺點) nagios客戶端得安裝NRPE. 說是支持400-500臺機器的監(jiān)控。我沒試過,沒有那么多的機器。- -

zabbix 分為zabbix server 和zabbix agent.也就是說客戶端得安裝agent.
優(yōu)點點是支持多平臺的監(jiān)控軟件,功能強大,監(jiān)控靈活,報警靈活。
支持分布式。支持snmp,jmx,ipmi類型。自帶畫圖功能,得到的數據可以繪成圖形。全web管理。自帶key,同時支持調用腳本。很方便。
缺點是批量修改不方便,中文資料少。畫圖沒cacti好。官網說zabbix 支持5000臺機器的監(jiān)控。

2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?

答:難點的話可能是配置方面,監(jiān)控項設置方面吧。
我們現(xiàn)在用的是cacti+zabbix,感覺夠用了,zabbix用起來比較靈活。
zabbix 可以根據自己的需求設置一些觸發(fā)器,達到觸發(fā)器的數值就會報警。
比如說,系統(tǒng)的平均負載,進程數,流量,tomcat jmx,dns 之類的都可以實現(xiàn)。

3、在監(jiān)控軟件使用過程中,有哪些收獲?

答:在使用過程中會熟悉哪些指標需要監(jiān)控,哪些是非必要的。會系統(tǒng)的全局有大致的宏觀了解。
故障一般的都是軟件層面的,及時登陸到機器上看看是什么情況,大多數都可以解決。
將來的規(guī)劃是現(xiàn)深入的學習zabbix,說實話,zabbix 真不錯,真心推薦給大家。很靈活。
如果有機會再試試分布式。如果有運維研發(fā),zabbix是一個好的選擇進行二次開發(fā)。

其實不管哪個監(jiān)控軟件,只要是自己了解,順自己的手,能夠滿足需要都OK的。
作者: o楓葉o飄零    時間: 2015-12-10 12:13
本帖最后由 o楓葉o飄零 于 2015-12-10 16:17 編輯

1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?nagios  
缺點:部署太麻煩,  默認的web首頁看得很粗糙。   還要結合別的軟件才能繪圖
優(yōu)點:資料多,用的人也多,所以有什么問題能及時baidu、谷歌。


cacti    結合nagios用的   所以沒有多大感覺。。。


ganglia   
缺點:web上手起來有點麻煩,而且中文插件還得單獨去下
優(yōu)點:圖形顯示還是比較方便
而且我們這邊用ganglia主要是為了專門去監(jiān)控hadoop、hbase的....
zabbix
缺點:看圖不方便。舉個例子:我想看同一批集群的網卡流量,就必須要在screen里先定義,不然只能一臺一臺的看。。。  這一點就沒有nagios和ganglia方便...
還有一點   就是  默認模板的cpu load    比較坑....
優(yōu)點:上手比較容易,單獨添加主機什么也方便
server+proxy+agent
這種架構適合監(jiān)控多機房的機房   一個集群  最多只占用一個外網端口,信息傳遞直接由proxy到server,agent只需要提交數據給同網段的proxy就行



2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
難點應該是報警的準確性和擴展性吧,報警的及時性(免費的郵箱經常被攔截。

我這邊目前的架構就是這種
server+proxy+agent
不知道是因為proxy的主被動模式沒有弄好還是怎么樣。
當server網絡有問題時...       所有機器都報警了 。。   報警郵件頓時瘋狂的接收。。。
當server網絡恢復時。。       所有機器又都恢復了。。   又開始瘋狂的接收恢復郵件

zabbix_server不知道有沒有雙機熱備的功能    就怕server掛了    那所有的都得重做。。。



3、在監(jiān)控軟件使用過程中,有哪些收獲?

收獲了愛情(開個玩笑)

收獲了BOSS對運維的一些認識。。。   覺得運維還是必不可缺的

也收獲了一些坑。。。
上監(jiān)控時,BOSS叫我監(jiān)控起開發(fā)寫的一些接口。。
然而   現(xiàn)在BOSS似乎覺得我監(jiān)控的蠻好   就打算把100多個接口也監(jiān)控上去。。
我艸        接口返回的東西不一樣      要寫無數個腳本......  工作量有點痛苦。。。





作者: cryboy2001    時間: 2015-12-10 12:14
用過nagios與zabbix
作者: ruochen    時間: 2015-12-10 12:23
1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
使用過mrtg、cacti、nagios、zabbix、cat等,目前基本以nagios、zabbix、cat這3個組合為主
mrtg作為很早期的網絡帶寬監(jiān)控,目前在不少的核心交換端還在使用
cacti的圖很漂亮,搭配rrdtool非常不錯,如果是做千臺以上的服務器節(jié)點監(jiān)控,還是比較吃力的
nagios和zabbix在大規(guī)模監(jiān)控上面做的很不錯,不過到很多節(jié)點的時候,在數據層和管理上還是要下很多功夫的

2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
最重要的還是以業(yè)務的提前預警和故障告警為主吧,依托自己的業(yè)務來展開,不斷的細化和優(yōu)化

3、在監(jiān)控軟件使用過程中,有哪些收獲?
監(jiān)控大致分為以下幾個層次,分別為主機層、服務進程和端口、應用層
主機層:所有的硬件設備監(jiān)控,比如網絡設備的端口帶寬和服務器的硬件等
服務進程和端口:業(yè)務服務的進程和端口是不是存在,業(yè)務進程是不是有響應(url)
應用層:業(yè)務的調用關系和響應時間等
作者: cgweb    時間: 2015-12-10 12:51
運維工程師們在大數據時代,下面對大量網絡安全事件,若沒有有效工具是無法完成分析工作,他們往往面對如下挑戰(zhàn):
1)  每天出現(xiàn)巨大數量的安全報警,管理員很難對這些報警做出響應。
2)  誤報嚴重,管理員無法準確判斷故障。
3)  大量重復、零散而沒有規(guī)律的報警,黑客的一次攻擊行動,會在不同階段觸發(fā)不同安全設備的告警,這樣導致報警數據之間在時間和空間上存在大量重復數據,如果不實現(xiàn)安全事件的關聯(lián)處理,就無法有效的提高告警質量。

當出現(xiàn)這些問題的部分原因是企業(yè)缺乏事件監(jiān)控和診斷等運維工具,因為如果沒有高效的管理工具支持,就很難讓故障事件得到主動、快速處理。市面上有很多運維監(jiān)控工具,例如商業(yè)版的Cisco Works 2000、Solarwinds、ManageEngine以及專注故障監(jiān)控的WhatsUp,在開源領域有MRTG、Nagios、Cacti、Zabbix、Zenoss、OpenNMS、Ganglia等。
這些開源工具做了一個簡單的比較:

由于它們彼此之間沒有聯(lián)系,即便是你部署了這些工具,很多運維人員并沒有從中真正解脫出來,原因在于目前的技術雖然能夠獲取計算機設備、服務器、網絡流量,甚至數據庫的警告信息,但成千上萬條警告信息堆積在一起,讓人根本沒辦法判斷問題的根源在哪里,缺乏對信息進行篩選、數據挖掘的能力,其實我們并不缺少工具,商業(yè)的也好,開源的也吧,一抓一大把,為什么還是用不好?真正缺少的是分析數據的智能化。
另外我們的查看各種監(jiān)控系統(tǒng)需要多次登錄,查看繁多的界面,更新管理絕大多數工作都是手工操作,即使一個簡單的系統(tǒng)變更或更新,往往需要運維人員逐一登錄系統(tǒng),當設備數量達到成百上千時,其工作量之大可想而知。而這樣的變更和檢查操作在IT 運維中往往每天都在進行,這無疑會占用大量的運維資源。因此,運維工作人員需要統(tǒng)一的集成安全管理平臺已迫在眉睫。

作者: 我是一隻羊    時間: 2015-12-10 13:18
看到子萌在群里的鏈接,正好前一陣子在做監(jiān)控系統(tǒng)的轉換,就來參與下~
1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
     Zabbix:
          優(yōu)點:
               應用比較成熟,不需要做太多的二次開發(fā)
               server-proxy-agent部署結構比較清晰
               支持插件
               自動注冊的判斷規(guī)則和后續(xù)動作的組合很多進而可以支持基于主機名或其他的各種主機管理減少人工干預
               逆天的discovery支持在各個地方使用變量,除了各種name標識外,甚至還包括trigger判斷的閾值,報警信息等.
               監(jiān)控種類比較齊全,如windows,交換機,虛機等...
          缺點:
               不友好的視圖組合支持.screen太難用.
               存儲不支持水平擴展.
               性能有瓶頸,主要出現(xiàn)在server的數據庫上.機器數量3000+,nvps在4000左右出現(xiàn)瓶頸,這個數值貌似是不包含zabbix_sender通過文件方式傳回的value的,在規(guī)劃監(jiān)控項的interval的時候往往要遷就性能,不能支持更細時間粒度的監(jiān)控,就是省著使用
               監(jiān)控配置復雜度太高.簡單的監(jiān)控還好,配一個變量比較多的discovery往往要調試很久,要更新腳本,conf,調試sender文件內容
               主機名修改后要重啟agent才能生效...不然一直往老的host上吐數據...
               不支持主機組和模板之間的綁定,只能用自動注冊的動作來山寨的綁定.
               所有監(jiān)控項的收集都需要提前配置
     Falcon:
          優(yōu)點:
               部署模塊拆分的更細,結構更清晰.portal,dashboard,transfer,agent,judge,sender,alert,graph等等.
               各個模塊均支持水平擴展.擴容相當容易.
               支持多種監(jiān)控數據的展示方式,比zabbix的graph,screen好用1W倍.
               監(jiān)控策略配置簡單,更容易面向用戶.
               支持插件,類似zabbix的腳本,這里值得一提的是這個插件自帶時間調度,命名類似10_scriptname.sh的腳本名的時候,會每10秒執(zhí)行一次.一些簡單的模塊監(jiān)控可以放到這里面.
               judge和graph分離,報警判斷和繪圖是2個模塊,互不影響.
               http協(xié)議的自定義監(jiān)控項數據收集.并且收集的監(jiān)控項不需要提前配置.大大減小了自定義監(jiān)控項收集的復雜程度.
         缺點:
               需要大量的二次開發(fā),最好能對接一套內部的管理平臺來進行主機管理.
               插件生效需要配置,這個配置只能和主機組綁定,而不是主機組配置的模板綁定.
               報警內容不支持自定義變量
               監(jiān)控項的interval從小改大的時候,圖像會有斷點,還沒看過源碼,估計是只有在第一次注冊監(jiān)控項的時候才寫interval的值,后面判斷有這個監(jiān)控項的時候interval就不再判斷了.但是不敢肯定哈,求大神指正.

2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
          我認為在使用監(jiān)控軟件的使用過程中,并沒有難點…各種功能的實現(xiàn)總是最簡單的.
          關鍵是怎么用好工具.
          最難的其實還是掌控業(yè)務.
          域名監(jiān)控,語義監(jiān)控,模塊監(jiān)控,結構體監(jiān)控,日志監(jiān)控,這些的規(guī)劃和實現(xiàn)都有方法可循,可怎么通過這些監(jiān)控100%覆蓋自己的業(yè)務,并且精確定位到故障,這個才是最難的.其中還涉及一個在后端分析報警內容的事情…也是我后面主要的精力投入點.
          說一個不算難點的地方,就是其實這兩套監(jiān)控系統(tǒng)都要上額外的配置管理,其他的就沒了.
         
3、在監(jiān)控軟件使用過程中,有哪些收獲?
          收獲還是比較多,一開始參與的時候可能只是底層腳本的編寫,然后提升到部署級別,更好的了解ha,容災,在架構思想上有進益,然后監(jiān)控軟件選型,知道不同監(jiān)控的優(yōu)劣所在,學會思考,培養(yǎng)大局觀.
          然后在這個過程中,對自己的服務的掌控能力也會越來越強.
作者: expert1    時間: 2015-12-10 13:22
Nagios /cacti
基本上 優(yōu)缺點大家都說了。還有個很重要的缺點就是配置,zabbix據說能自動發(fā)現(xiàn)和配置,有機會試試看。
作者: stay_sun    時間: 2015-12-10 13:38
回復 1# jackson198574


    1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
zabbix cacti nagios  感覺zabbix 的監(jiān)控真的很強大功能齊全,但是使用的話  不是很便捷。但是能使用全面
2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
zabbix 的監(jiān)控很簡單   但是你想建空單數據夠細致的話 你需要自己寫腳本  完善使用  
每個  主機都需要安裝agent  性能方面有一定的損耗
3、在監(jiān)控軟件使用過程中,有哪些收獲?
完善自己的監(jiān)控系統(tǒng),讓你在排查問題的時候  方便你的使用

作者: jelephant    時間: 2015-12-10 13:47
用過zabbix
作者: jackson198574    時間: 2015-12-10 13:48
回復 3# zongg


    贊!豐富又寶貴的實戰(zhàn)經驗!看出朋友在這方面下的功夫、花的心思真的很多。
作者: jackson198574    時間: 2015-12-10 13:48
回復 4# o楓葉o飄零


    吃好喝好,細嚼慢咽有助消化。
作者: jackson198574    時間: 2015-12-10 13:49
回復 5# cryboy2001


    可否分享一下在使用過程中的深刻體驗?
作者: zongg    時間: 2015-12-10 13:50
回復 12# jackson198574


    做運維的嘛,做好備份,做好監(jiān)控。
作者: Linux_manne    時間: 2015-12-10 13:51
基本很多的監(jiān)控軟件都用過. 用的最多的就是nagios 和 zabbix, nagios 的配置 包扣業(yè)務的自定義腳本需要自己折騰下, zabbix比較大,有很多觸發(fā)的條件可以跟自己的業(yè)務相結合 以及 適應復雜的網絡環(huán)境(隔離的)
作者: jackson198574    時間: 2015-12-10 13:55
回復 6# ruochen


    精煉~
作者: jackson198574    時間: 2015-12-10 13:58
回復 7# cgweb


    能否結合自身的情況和體驗談一下? 兄弟的文字網上能搜到。
作者: jackson198574    時間: 2015-12-10 14:02
回復 8# 我是一隻羊


    贊!謝謝支持!滿滿的文字透露出了對咱們ChinaUnix論壇的真愛!   請問在數據采樣的時間間隔上有什么比較好的經驗?
作者: cgweb    時間: 2015-12-10 14:02
OK,寫的不好,多指教。
作者: jackson198574    時間: 2015-12-10 14:03
回復 20# cgweb


    沒關系,就是大家隨便聊聊,關鍵是真實就好,可以回答問題,也可以就別人的回答進行交流和學習就OK,自由討論,各抒己見~
作者: jackson198574    時間: 2015-12-10 14:05
回復 10# stay_sun


    最近在研究Zabbix,感覺內容很多,這也說明了這款軟件的可玩兒性和可塑性挺高。
作者: jackson198574    時間: 2015-12-10 14:06
回復 11# jelephant


    葛總,你省略了3萬多字的說明和感悟,請盡快補上。
作者: shenhua19891109    時間: 2015-12-10 14:16
1、工作中用到的是公司自己開發(fā)的監(jiān)控系統(tǒng),還是有一些不便之處的,比如說展示的時候,不能做到在同一個頁面實現(xiàn)不同機器的監(jiān)控狀態(tài);沒有提供接口實現(xiàn)監(jiān)控項的批量啟停,監(jiān)控系統(tǒng)一定要給用戶一定的接口,否則只靠頁面來操作,很費力的。
2、監(jiān)控不單單是要過往的數據及趨勢,還要有報警的功能,報警又分幾種,(1)可以報出錯誤,(2)可以報出具體錯誤(這樣可以更快定位問題),其中第2個問題是一個難點,根據業(yè)務的不同,定位的問題也不同,監(jiān)控系統(tǒng)不可能面面俱到,所以說監(jiān)控系統(tǒng)需要給使用者一定的定制化。另外監(jiān)控系統(tǒng)也應該能夠適應要監(jiān)控對象的變化,比如說,數據庫的集群中添加了一個實例,監(jiān)控系統(tǒng)能夠提供響應,或者提供接口調用,或者有模板,減少使用者的操作時間
3、監(jiān)控系統(tǒng)可以看出過去某一個指標的變化趨勢及取值,可以為容量規(guī)劃提供建議,分析潛在的問題,另外通過報警確實能夠報出一些問題(雖然有時不是及時的,或者誤報),減少了人力成本。

另外只有一種監(jiān)控有時也是不夠的,可以實現(xiàn)對當前主監(jiān)控系統(tǒng)補充級別的監(jiān)控,要充分發(fā)揮各種監(jiān)控系統(tǒng)的優(yōu)點,如果有能力的話,也可以做對監(jiān)控系統(tǒng)的監(jiān)控。
此僅為個人之見,若有錯誤,請指出交流,謝謝!

作者: stay_sun    時間: 2015-12-10 14:23
回復 22# jackson198574


    恩  我們公司的zabbix  服務器歸我管  現(xiàn)在用著感覺不錯  但是想用好的話  還是需要研究下  有時間得話  可以交流啊
作者: jackson198574    時間: 2015-12-10 14:30
回復 25# stay_sun


    好啊,太好了。
作者: jackson198574    時間: 2015-12-10 14:33
回復 24# shenhua19891109


    “對監(jiān)控系統(tǒng)的監(jiān)控”,有道理!
作者: cryboy2001    時間: 2015-12-10 14:34
回復 14# jackson198574


    現(xiàn)在在用的是nagios,以前裝好了,就沒怎樣動過,現(xiàn)在也分享不了什么。
作者: stay_sun    時間: 2015-12-10 15:40
回復 26# jackson198574


    求書
作者: jieforest    時間: 2015-12-10 16:30
1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
我用過的監(jiān)控工具還挺多的。
小工具有:
1)htop:可以查看服務器進程的實時情況。
2)iotop:可以查看服務器讀寫方面的實時情況。
3)pidstat:可以監(jiān)控全部或指定進程占用系統(tǒng)資源的情況,如CPU,內存、設備IO、任務切換、線程等。
4)glances:對服務器整體情況進行查看,包括CPU核、負載、內存、數據交換、網絡、磁盤I/O、數據加載、進程等。
5)vmstat:查看給定時間間隔的服務器的狀態(tài)值,包括服務器的CPU使用率、內存使用情況、虛擬內存交換情況、IO讀寫情況等。
6)iostat:查看服務器的CPU時間片分配情況統(tǒng)計或硬盤IO統(tǒng)計。
7)其它:如free、top之類的
功能大而全的監(jiān)控軟件:
1)Ganglia:可用來監(jiān)控系統(tǒng)性能,如CPU、內存、硬盤利用率、I/O負載、網絡流量情況等,通過曲線很容易見到每個節(jié)點的工作狀態(tài),對合理調整、分配系統(tǒng)資源,提高系統(tǒng)整體性能起到重要作用。
2)Nagios:能有效監(jiān)控Windows、Linux和Unix的主機狀態(tài)以及交換機路由器等網絡設置,打印機等,能在系統(tǒng)或服務狀態(tài)異常時發(fā)出郵件或短信報警。
3)Zabbix:監(jiān)控服務器的方方面面,功能大而全。
4)監(jiān)控寶:商業(yè)云監(jiān)控軟件,可監(jiān)控應用、網站、API、網頁性能、服務器、服務、數據庫等。
小工具是我們最常用的,基本上經常會用到。功能大而全的監(jiān)控軟件我們相對更喜歡Zabbix。

2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
把監(jiān)控軟件用好并不容易,最早用過Cacti,這個軟件就沒用好。
精通監(jiān)控軟件跟運維團隊的建設也密切相關,我們這邊運維團隊比較薄弱,監(jiān)控工作做得不是很好。
由于很多現(xiàn)實因素和環(huán)境因素,我們的監(jiān)控目前主要是購買監(jiān)控寶的監(jiān)控服務來做的,它涵蓋了大部分服務器。

3、在監(jiān)控軟件使用過程中,有哪些收獲?
我傾向于采用開源監(jiān)控軟件(比如Zabbix),自己實施監(jiān)控方案。
監(jiān)控工作很苦悶,在搞定問題時也能獲得很多樂趣。
最大的收獲還是在于知識和經驗方面的收獲,干久了積累自然就多了。

作者: lyhabc    時間: 2015-12-10 16:38
主機層:所有的硬件設備監(jiān)控,比如網絡設備的端口帶寬和服務器的硬件等
服務進程和端口:業(yè)務服務的進程和端口是不是存在,業(yè)務進程是不是有響應(url)
應用層:業(yè)務的調用關系和響應時間等

講得很好,我們經常都要監(jiān)控api調用時間 ,用zabbix

1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
zabbix  非常好用,特別Windows和Linux都支持
2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
主要劃分應用層次
3、在監(jiān)控軟件使用過程中,有哪些收獲?
關鍵還是要分析監(jiān)控報警
作者: jackson198574    時間: 2015-12-10 21:15
回復 30# jieforest


    贊!強哥總結的好細致呀~
作者: jieforest    時間: 2015-12-11 13:31
回復 32# jackson198574


    呵呵,客氣客氣
作者: csoho2000    時間: 2015-12-11 16:43
正在使用tivoli,功能蠻強大,配置好煩
作者: shyjmayue    時間: 2015-12-11 17:18
送我一本吧  看后可以轉送其他人。。。
作者: laputa73    時間: 2015-12-12 09:24
我們公司自己就是做監(jiān)控軟件的,也曾經集成過一些開源方案,比如mrtg
也經常會被用戶和開源的破解的一些軟件來比較。
真的沒有最好的,只有適合的。
從采集效率來說。
無agent的,zenoss很好,基于tornado事件框架實現(xiàn)ssh/snmp異步采集,性能甩cacti的命令行snmpwalk一條街。
有agent的。zabbix的用的很多。ganglia沒接觸過。不知道那個更強。
從二次開發(fā)來說
  肯定是越簡單的越好開發(fā)。模塊劃分細,明確插件接口協(xié)議的也便于擴展。
從上手容易來說
  有web的絕對容易很多。
  還有就是要選資料多的。zenoss功能豐富,但是資料少。zabbix,nagios就多很多。

這些軟件的大小從幾M到幾百M不等。簡單比較功能是不公平的。
少量主機監(jiān)控用nagios就好,多些就zabbix
以網絡設備端口流量為主的,少量就cacti,多的可以考慮solarwinds系列或者zenoss。

作者: hiyachen    時間: 2015-12-14 13:05
1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
我們用ganglia, zabbix, nagios
2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
3、在監(jiān)控軟件使用過程中,有哪些收獲?
作者: jackson198574    時間: 2015-12-17 10:03
回復 36# laputa73


    贊~~~
作者: Fl_wolf    時間: 2015-12-21 15:06
本帖最后由 Fl_wolf 于 2015-12-21 15:58 編輯

1、你所用過的監(jiān)控軟件有哪些?感覺有什么優(yōu)缺點?
Zabbix  優(yōu)點:機動性比較大,可以自己編寫腳本進行監(jiān)控,可以采用自動smtp自動發(fā)現(xiàn)。開源
            缺點:升級比較麻煩,要服務端與所有被監(jiān)控的機器都升級。

nagios  優(yōu)點:報警機制非常強大,故障抖動檢測,,很多的插件使用
            缺點:看不到歷史數據,只能看到報警事件,基于文件的配置方式,不方便擴展,易讀性差,管理耗時,監(jiān)控多少服務就可能需要多少文件。缺乏集成的圖形盡管和cacti結合的話,也不是最佳的解決辦法,接口只是獨立的方式存在


cacti    優(yōu)點:圖形化非常完善,可以很方便看到歷史數據
           缺點:是報警機制不完善




2、你認為在監(jiān)控軟件的使用過程中,有哪些難點?
如何去監(jiān)控到自己想要的信息,以及獲取到默認獲取數值外的更多數值。

3、在監(jiān)控軟件使用過程中,有哪些收獲?
可以知道 系統(tǒng)里的程序跑起來后系統(tǒng)的瓶頸,以及去了解更多的優(yōu)化措施。
作者: jackson198574    時間: 2015-12-22 14:06
回復 39# Fl_wolf


    贊!請問朋友在日常運維中,可有多種工具結合使用的?
作者: Fl_wolf    時間: 2016-01-05 14:55
回復 40# jackson198574


    有的,主要是使用 zabbix與Cacti,不過主題都是ZAbbix居多。因為zabbix的機動性比較大。




歡迎光臨 Chinaunix (http://72891.cn/) Powered by Discuz! X3.2