亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: [原創(chuàng)]從IDC到站點(diǎn)--運(yùn)維經(jīng)驗(yàn)交流[1205更新] [打印本頁]

作者: theanswer    時(shí)間: 2008-10-10 17:26
標(biāo)題: [原創(chuàng)]從IDC到站點(diǎn)--運(yùn)維經(jīng)驗(yàn)交流[1205更新]
從hilinux.com架設(shè)談網(wǎng)站或其他服務(wù)器運(yùn)維
原帖:http://hilinux.com/bbs/thread-600-1-1.html 如要轉(zhuǎn)載,請(qǐng)注明出處
看到chinaunix最近出的門戶網(wǎng)站運(yùn)維板塊veyron大俠寫的文章《門戶網(wǎng)站運(yùn)維abc》深有感觸,特寫以下文章:
《談網(wǎng)站或其他服務(wù)器運(yùn)維》,這里只談運(yùn)維工程師所要做的細(xì)節(jié)工作,讓人們知道運(yùn)維工程師到底都在做些什么,至于上級(jí)所要做的,只是提一下,不做參考。

以下是個(gè)人觀點(diǎn),我說的只是我自己的想法,也是我發(fā)展的目標(biāo)。你可以有異議,我們是來交流的。你對(duì)的我肯定會(huì)向你學(xué)習(xí)。因?yàn)槲乙苍诿。運(yùn)維工程師至少要能做以下的工作
1,網(wǎng)絡(luò)工程師的工作    你至少要能配置CISCO 6509以下的設(shè)備,熟悉各種網(wǎng)絡(luò)協(xié)議,否則網(wǎng)絡(luò)出問題的時(shí)候你會(huì)傻掉。
2,系統(tǒng)工程師的工作    你至少要理解各種系統(tǒng)服務(wù),在出問題的情況下要迅速解決問題,而不是等系統(tǒng)工程師來解決。
3,安全工程師的工作    我不要求你一定要會(huì)各種網(wǎng)絡(luò)編程,但是在服務(wù)器收攻擊的情況下,沒有防火墻的情況下,做一些簡單的處理工作。
4,存儲(chǔ)工程師的工作    至少要熟悉各個(gè)廠商的設(shè)備,各種備份和還原的辦法
5,測試工程師的工作    在新版本上線之前,你至少要協(xié)同測試工程師做測試工作,因?yàn)槟闶沁\(yùn)維人員,不了解程序架構(gòu)導(dǎo)致無法解決故障,你也有一份責(zé)任。
6,研發(fā)人員的工作      運(yùn)維工具都需要自已開發(fā),熟悉開發(fā)語言,需要有過實(shí)際開發(fā)經(jīng)驗(yàn),否則工作會(huì)非常痛苦,我深有體會(huì)。
7,英語               不想說了,我的最大痛苦就在這里
8,好的溝通者         不出問題時(shí)候你可以打游戲睡覺,出問題的時(shí)候要能和項(xiàng)目人員溝通,快速解決問題,而不是推;我知道有很多人能推責(zé)任,你可以做替死鬼,但是離開這個(gè)工作你還能找到更好的;把責(zé)任推到別人身上的人,下次出問題的時(shí)候,絕對(duì)沒人幫你。你要能和各個(gè)兄弟部門關(guān)系非常的密切,出了問題有兄弟幫你擔(dān)責(zé)任;也要能非常扯皮,沒事在會(huì)議上把別人都搞定。
9,庫房管理員         數(shù)萬臺(tái)服務(wù)器讓你來管理,任何丟失或者損壞都是不負(fù)責(zé)任和失職的表現(xiàn)。
10,運(yùn)動(dòng)員            不要回家就睡覺,有空還是運(yùn)動(dòng)下吧;在服務(wù)器down機(jī)的時(shí)候,機(jī)房恰巧就你一個(gè)人,機(jī)柜沒有空間,你需要更換一臺(tái)HP 585 4U的服務(wù)器,滿配約80公斤的服務(wù)器,你怎么做?
11,責(zé)任心            這個(gè)我不想說什么,這是你的職業(yè)精神。
12,組織者            給你2個(gè)啥都不會(huì)的民工,再給你2000臺(tái)服務(wù)器,要求你2天把服務(wù)器裝完,你咋辦?
13,1-7條中,你必須有一條非常精通,是這個(gè)行業(yè)的專家。否則過了32歲,沒有公司要你。

大家看了肯定覺得這個(gè)人是神仙,但是這必須是你慢慢能做到的,至少是我6年來運(yùn)營經(jīng)驗(yàn)的一點(diǎn)總結(jié)。
因?yàn)楝F(xiàn)在的公司都在用招聘民工的錢招聘神仙,其次我也是想讓各位看看,運(yùn)維工程師要擔(dān)負(fù)多少責(zé)任。
我去面試過的一些公司都說,你什么都會(huì),什么都不精。我說對(duì),正是需要我們這些什么都會(huì)的人領(lǐng)導(dǎo)什么都精的人。
我這句話沒有貶低大牛的任何意思,只是當(dāng)時(shí)一個(gè)臨場的發(fā)揮。雖然說完就知道這個(gè)面試白來了,但是我還是想為廣大的運(yùn)維工程師出口氣。
不怕千招會(huì),就怕一招精。這仍舊是我給大家的建議。

風(fēng)吹云動(dòng)兄http://bbs.gehoo.cn/ 說的好,不要抱怨,每個(gè)行業(yè)都有自己的苦處,沒有什么值得抱怨的,所以我刪除了運(yùn)維中的這一小節(jié),重新發(fā)帖。
只是想讓那些身居高崗的老大們看看我們的員工都是多么的辛苦。雖說抱怨的始終是做不好的,那么我只能用風(fēng)吹云動(dòng)兄的話說:“做啥都行,千萬別做超人”,做超人要有超人的能力。能力有多大,責(zé)任就有多大。身在這個(gè)職位就要對(duì)這個(gè)職位負(fù)責(zé)。

一句話令我茅塞頓開

不抱怨了~


以下是一些實(shí)際經(jīng)驗(yàn),發(fā)給大家做參考,有任何問題可以mail我,answer3ai@gmail.com
有的東西是企業(yè)機(jī)密,我不能透露也不能給你相關(guān)文檔。
一,架構(gòu)設(shè)計(jì)
現(xiàn)在你要做的,就是設(shè)計(jì)你的服務(wù)器架構(gòu)和網(wǎng)絡(luò)架構(gòu)。這要先看你的網(wǎng)站是做什么的,每日有多少的人數(shù)訪問,
例如,我打算站點(diǎn)初期每日有20000左右的訪問量,和1000人所有的并發(fā)量。我可以用我的人數(shù)并發(fā)量1000×站點(diǎn)中每個(gè)頁面的平均大小200k×每個(gè)訪問用戶可能要打開4個(gè)網(wǎng)頁=800 000k=800M的網(wǎng)絡(luò)流量(當(dāng)然這個(gè)數(shù)字肯定是非常的過分,至于為啥,自己可以想下)
然后可以用測試環(huán)境用軟件檢測在你的真實(shí)環(huán)境下的服務(wù)器壓力,比如在2000人在線的情況下,服務(wù)器的cpu占用多少,內(nèi)存占用多少。
那么你可以得到你大致配置,其實(shí)市面上的標(biāo)準(zhǔn)服務(wù)器配置都足夠你用了,比如現(xiàn)在的DELL 1950,HP DL360G5,IBM X???(忘記了)
等服務(wù)器,足夠我跑一個(gè)這樣簡單的網(wǎng)站。其實(shí)說白了,雙奔3都?jí),真的。?dāng)然你網(wǎng)站的流量比我要大的多,那你可以買的更好一點(diǎn)的服務(wù)器。或者負(fù)載均衡器。

網(wǎng)絡(luò)架構(gòu)
站點(diǎn)現(xiàn)在是一臺(tái)獨(dú)立服務(wù)器,未來采用的是分布式架構(gòu),比如bbs.hilinux.com是一臺(tái)服務(wù)器,man.hilinux.com是一臺(tái)服務(wù)器...
mysql是一臺(tái)服務(wù)器。這樣你要算服務(wù)器要多少臺(tái),交換機(jī)要多少口,防火墻要買什么級(jí)別的。
那些服務(wù)器可以放在一個(gè)防火墻下,哪些服務(wù)器不用防火墻保護(hù),哪些服務(wù)器是內(nèi)網(wǎng)服務(wù)器,
需要什么樣的網(wǎng)絡(luò)連接,最好是畫出大致拓?fù),方便你預(yù)算設(shè)備花費(fèi)。

服務(wù)器交換機(jī)等設(shè)備選型和購買
說的簡單點(diǎn)就是買什么機(jī)器,你可以和google一樣開始,買幾臺(tái)pc作為你的網(wǎng)站服務(wù)器,也可以自己組裝一臺(tái)服務(wù)器
或者也可以和我一樣,去挑選品牌服務(wù)器當(dāng)然,現(xiàn)在你要看你服務(wù)器做什么的,
你可以親自去電腦城看組裝服務(wù)器,也可以打電話到IBM,HP,DELL的各地銷售商讓他們送服務(wù)器來測試,
當(dāng)然你不要告訴他們你只買一臺(tái),那你就別指望測試了。我告訴供貨商hilinux.com需要200臺(tái)服務(wù)器,一個(gè)F5,10臺(tái)CISCO 2960交換機(jī),3個(gè)NETSREEN206防火墻,一個(gè)EMC CX500+滿硬盤
那么不到3天,hilinux.com所需要的4臺(tái)測試服務(wù)器,就送來了。。。當(dāng)然,不要牛了這么多最后只買1臺(tái),那么你晚上走夜路會(huì)被人打的。
最后就是價(jià)錢問題了,這個(gè)你自己看著辦吧。讓你公司的財(cái)務(wù)或者采購出馬砍價(jià)付錢就是了。當(dāng)然,除了服務(wù)器的服務(wù),你最好還是想想有利于自己的服務(wù),比如人家公司可以幫你拆箱子了什么的。我做的最弱智的一件事情就是,來了400臺(tái)服務(wù)器,50個(gè)交換機(jī),8臺(tái)EMC,我一個(gè)人花了一星期把箱子才全部拆完。。。

機(jī)器選型的時(shí)候你也要為自己考慮,比如HP的ILO功能,可以讓你遠(yuǎn)程BIOS級(jí)操作服務(wù)器,比如浪潮的自動(dòng)資產(chǎn)管理等等,為自己管理服務(wù)器提供便利,否則機(jī)器10來臺(tái)還好,100臺(tái)還一般,我這里3萬來臺(tái),我不死幾百遍了。丟失一臺(tái)服務(wù)器,幾個(gè)月工錢就沒了。。。

二,IDC選擇
首先要看你服務(wù)的地區(qū)是哪里,然后再去找當(dāng)?shù)氐碾娦艡C(jī)房。畢竟,雖說全國已經(jīng)互聯(lián)了,但是各地的網(wǎng)速還是有差異的。
或者說有的idc機(jī)房利用率高,雖然出口帶寬大,但是利用率高的結(jié)果是導(dǎo)致你網(wǎng)速慢的原因之一。
我的做法是在全國各個(gè)機(jī)房的服務(wù)器用pingplus這個(gè)軟件進(jìn)行一周的的流量測試?梢钥吹狡骄鶃G包,最大延時(shí)等等。
當(dāng)然,你也可以到你目標(biāo)服務(wù)的地方,找個(gè)可以上網(wǎng)的地方進(jìn)行網(wǎng)絡(luò)測試,比如說網(wǎng)吧包個(gè)機(jī)器。。。

好了,網(wǎng)絡(luò)測試完了。那么你已經(jīng)決定去哪個(gè)idc了吧。

然后你就可以電話或者自己提著禮品登門拜訪一下IDC服務(wù)商的老大了
當(dāng)然,你也可以找代理服務(wù)商,因?yàn)樗麄兡玫降膬r(jià)錢有時(shí)候比電信或者網(wǎng)通給你的價(jià)錢低,但是,關(guān)鍵還是一個(gè)服務(wù),因?yàn)槟惝吘狗⻊?wù)器放在那,晚上關(guān)鍵著急沒人給你重啟,機(jī)器出了問題其實(shí)按個(gè)F1就可以解決的問題,服務(wù)商的值班人員不懂。你就只能打晚上的打飛機(jī)去機(jī)房維護(hù)吧。
提著東西拜訪一下服務(wù)商老大是禮節(jié)性的東西,東西不在多而在精,這樣你未來談事情人家也給你綠色通道,做事情要好做很多。當(dāng)然,我也不反對(duì)你空手去,你一次租個(gè)100個(gè)機(jī)柜+10G帶寬,人家還是很優(yōu)惠的。哈哈。大家都是混口飯吃,也不至于難為你什么。
最后你要知道現(xiàn)在的中國還是賣方市場,你給人家牛,那你買的產(chǎn)品只能是。。。蒙牛

然后是開始去參觀機(jī)房
細(xì)心的檢查一下空調(diào)數(shù)量,空調(diào)出廠和最后維護(hù)日期,網(wǎng)絡(luò)布線類型和架構(gòu),是否可擴(kuò)展,主備從電力等。
基本都是非常關(guān)鍵的東西,出問題了,人家可以給你更換一個(gè)新的,服務(wù)很好,但是你服務(wù)器掛一天的損失是多少,你可以自己掂量。
還有機(jī)柜電力,現(xiàn)在的機(jī)柜放置16臺(tái)1U的服務(wù)器是正好,多了過于熱,少了資源浪費(fèi);但是你發(fā)現(xiàn)人家只讓你用10安培電力,過了要交錢買電;
或者不限制你用電,但是插線板只有10個(gè),你還真買個(gè)托線板去轉(zhuǎn)接?你要想想你一個(gè)托線板掛了,你服務(wù)器要掛幾個(gè)?

最后,我的一個(gè)機(jī)房包間里140個(gè)機(jī)柜,2個(gè)空調(diào),結(jié)果某天掛了一個(gè)空調(diào),雖然6小時(shí)人家IDC商就給更換了一個(gè)空調(diào)機(jī)(這速度已經(jīng)非?炝耍,
結(jié)果我機(jī)器至少被熱死了100臺(tái)以上,機(jī)器是HP的,機(jī)器過熱,HP會(huì)自動(dòng)關(guān)機(jī),而且會(huì)不讓你啟動(dòng)。你崩潰不?注:不是給hp做廣告哈。

三,服務(wù)器上架
好了,要是你買的服務(wù)器到了,你會(huì)發(fā)現(xiàn)你接到電話后,樓下一個(gè)N大的“擎天柱”集裝箱車給你送服務(wù)器來。。。(某次我收2000臺(tái)服務(wù)器就是這樣的陣勢);在這里有個(gè)重大的提示,你們財(cái)務(wù)給廠商下單的時(shí)候,收貨地址一定要寫對(duì)。比如 XX路XX號(hào)XX大廈XX樓XX室,你寫到xx號(hào),送快遞的會(huì)給你堆到院子里,你寫到xx樓,送快遞的會(huì)給你送到電梯口,你寫到xx室,他們才會(huì)給你搬到室內(nèi)。因?yàn)樗拓浀亩际欠⻊?wù)器廠商找的,你因?yàn)檫@個(gè)事情去聯(lián)系廠商修改送貨地址,至少要多等N小時(shí)。而且他們視你的單子的數(shù)量和樓層,判斷來多少搬運(yùn)人員。而且,一定要把服務(wù)器搬到你指定的地方再簽字收貨,否則...嘿嘿...
我最霉氣的是:來了20臺(tái)機(jī)器(還好不多),下著大雨人家給我往院子里一丟,讓我自己搬上19樓,我沒推車沒啥的...
你可以說,找電信的幫忙撒,廢話,這個(gè)我還不知道。那我告訴你,我在某電信大樓工作時(shí),從CCIE到機(jī)房主管到機(jī)房工作人員,全部是美女...
雖然我在這個(gè)地方只干了5天活,我的同事們口水都有3尺長...你還叫人家給你搬機(jī)器不?
你可以說,顧民工撒,我又不是沒顧過,錢得你自己支付,公司不給你報(bào)銷的話,爽不?

下面是拆箱子,面對(duì)著堆積如山的2000臺(tái)服務(wù)器,我是連抬手的力氣都拿不出來。。。當(dāng)時(shí)機(jī)房只有我們公司3個(gè)人+電信值班2個(gè)人。。。
這時(shí)候,我的辦法是。。。我打電話找來了2隊(duì)收廢品的:
這么多箱子,除了機(jī)器和電源線留下,里頭的導(dǎo)軌光盤等等你全部拿走,誰拆的多誰拿的多。。。
最后按照我的要求幫忙搬到機(jī)柜上。。。于是我們5個(gè)人是監(jiān)工。。。看人家拆箱子搬機(jī)器。
于是人家2隊(duì)人找來了30多號(hào)人,一早上把2000臺(tái)機(jī)器全部拆箱子完畢放到機(jī)柜上。
要是我們幾個(gè)人拆,估計(jì)......

最后再說個(gè)行價(jià),服務(wù)器箱子一個(gè)價(jià)值5塊錢甚至更多。你服務(wù)器到了,賣賣箱子請(qǐng)大家吃飯吧。別讓掃地的阿姨拿走,,,幾個(gè)無所謂,10來個(gè)箱子,,,夠大伙兒吃頓烤肉了。。。還有EMC的木箱子。。。拿去養(yǎng)個(gè)小雞小鴨的。。。

42U機(jī)柜1U的服務(wù)器最好是16臺(tái)。你就看著上吧。呵呵

四,安裝系統(tǒng)和布線

好了,面對(duì)幾千臺(tái)服務(wù)器開始裝系統(tǒng),我不知道你會(huì)怎么想。。。
全部是1U服務(wù)器有什么辦法安裝系統(tǒng)?(我們公司窮,買不起刀片;而且電信不配合,要是上刀片,電路你們自己拉線,價(jià)錢還是原來的價(jià)錢;最重要的...我們公司以人為本,寧愿多養(yǎng)個(gè)人也不愿意買個(gè)好服務(wù)器讓人失業(yè)),而且不允許GHOST,因?yàn)槟氵@是服務(wù)器,不是網(wǎng)吧...GHOST出來的系統(tǒng),我不知道誰用過,爽不。我自己是郁悶郁悶到了,莫名問題的時(shí)候,你就知道GHOST還是靠不住的。
其次,我們公司安全部要求:必須得一臺(tái)一臺(tái)安裝,先安裝光板的系統(tǒng)(比如沒有SP的WIn2000),然后手工打SP4補(bǔ)丁,不能網(wǎng)絡(luò)打補(bǔ)丁。于是我們就光盤堆成山。最扯淡的,為了快,我做了一個(gè)補(bǔ)丁共享的服務(wù)器,所有的補(bǔ)丁CP的本地來打。結(jié)果忘記拔網(wǎng)線,導(dǎo)致人家說我們是插了網(wǎng)線打補(bǔ)丁,有中毒的危險(xiǎn),需要重裝。我直接崩潰。。。

辦法1,你可以1臺(tái)1臺(tái)慢慢裝,反正這么多機(jī)器,你可以管公司要更多的時(shí)間。但是我們公司一般是機(jī)器到了,最多2-3天就要要,一向是那種計(jì)劃不如變化快的沒有計(jì)劃沒有進(jìn)度管理的“小”公司,項(xiàng)目組拿著雞毛當(dāng)令箭,牛x哄哄的公司。郁悶!
這個(gè)時(shí)候前期的準(zhǔn)備就比較重要了(我公司多用windows2003),因?yàn)槭紫任乙b一個(gè)光系統(tǒng),再打驅(qū)動(dòng),再打補(bǔ)丁,再安裝遠(yuǎn)程控制軟件。一臺(tái)機(jī)器裝完大約要1小時(shí)多點(diǎn)。那么機(jī)器多了怎么辦?光盤不夠怎么辦?等等問題就來了。
我的辦法是,我一看TMD全部是DVD,IBM的機(jī)器直接佩combo,公司給我們發(fā)的全部是CD,娘的,典型的沒有最慢只有更慢,除了問題閑你慢的領(lǐng)導(dǎo)班子。于是只好自己出錢買了DVD,用軟件把RAID,網(wǎng)卡,顯卡其他驅(qū)動(dòng)做到光盤里,需要安裝的軟件也直接做成自動(dòng)安裝的方式,補(bǔ)丁也刻錄到光盤里(我們要求補(bǔ)丁必須單打,不能安裝集成補(bǔ)丁的ISO,shit),這樣弄,你只用把光盤往光驅(qū)里一丟,分區(qū)一分,就可以下一臺(tái)機(jī)器了。然后等你在去關(guān)注這個(gè)機(jī)器的時(shí)候,已經(jīng)可以設(shè)置IP插網(wǎng)線了。靈感來自番茄花園。吼吼。
當(dāng)然這時(shí)候你最好是買個(gè)KVM,16口的KVM,一次準(zhǔn)備16張光盤就可以用一套鍵盤鼠標(biāo)操作16臺(tái)機(jī)器。當(dāng)然啦,KVM是可以級(jí)聯(lián)的,我最牛一次一次一套鍵盤安裝166臺(tái)機(jī)器。郁悶的是,塞光盤塞死,插KVM線插死,配置IP配死,有時(shí)候還會(huì)弄錯(cuò)。。。

辦法2,你可以用NETKVM去遠(yuǎn)程安裝,但是你插那些NETKVM的線路,2000個(gè)插下來,爽不?然后你繼續(xù)扎KVM和網(wǎng)線的時(shí)候,看著和瀑布一樣的網(wǎng)線和KVM線交錯(cuò)在一起。估計(jì)直接崩潰。遠(yuǎn)程KVM有的牛x的是可以分發(fā)ISO的,就是傳說中的遠(yuǎn)程分發(fā)安裝?梢宰约嘿I一個(gè)研究研究了,我們公司以人為本,從來不買這類高科技。

辦法3,我犯賤時(shí)候發(fā)明的:我們的機(jī)器全部是RAID1,于是我安裝一臺(tái)raid1的機(jī)器,系統(tǒng)全部安裝好,然后拔掉一個(gè)硬盤,插上一個(gè)新硬盤自動(dòng)恢復(fù)鏡像,基本10來分鐘恢復(fù)好一個(gè)硬盤,插到機(jī)器上去。這樣,還是比裝系統(tǒng)來的快。當(dāng)然啦,型號(hào)是一模一樣的。。。

辦法4,HP的ILO2功能,實(shí)現(xiàn)遠(yuǎn)程分發(fā)。前提你得一臺(tái)一臺(tái)配置好BIOS里的ILO2。也是蠻痛苦的。IBM和DELL現(xiàn)在也都有這個(gè)功能,但是你在分發(fā)以前,還是得一臺(tái)一臺(tái)機(jī)器插上網(wǎng)線,配置好BIOS的IP,痛苦。然后把操作系統(tǒng)和機(jī)器的驅(qū)動(dòng)程序和后續(xù)的軟件全部做到一張DVD里,讓他自動(dòng)運(yùn)行。然后所有的服務(wù)器遠(yuǎn)程運(yùn)營這一個(gè)ISO,最好多弄幾臺(tái),否則一臺(tái)機(jī)器弄的慢死。

辦法5,絕對(duì)最簡單的辦法!!!就是買機(jī)器前,讓廠家給你在硬盤里灌好系統(tǒng),和你買筆記本一樣,打開是個(gè)安裝完成需要你輸入序列號(hào)的系統(tǒng)。但是弱點(diǎn)是后續(xù)的軟件需要自己裝。因?yàn)榉⻊?wù)器廠商是不會(huì)幫你安裝別的軟件的。

還有更多的辦法,只是暫時(shí)沒想到,大家也可以談?wù)撟约旱霓k法;ハ嘟涣髀铩
所以我喜歡linux...可以用N種辦法安裝系統(tǒng)...

windows就是個(gè)讓IT人當(dāng)裝機(jī)男,挨踢人當(dāng)民工。

好了系統(tǒng)裝好了,電源線和網(wǎng)線連接完,和瀑布一樣的。這時(shí)候還是盡量把他扎一下吧。
否則機(jī)器通風(fēng)不暢,會(huì)導(dǎo)致熱死。


簡單辦法就是電源線扎一邊,網(wǎng)線扎一邊。有錢的公司可以買個(gè)網(wǎng)線序號(hào)標(biāo),沒錢就自己拿膠布標(biāo)。
你可以隨便扎,或者和給你老婆梳頭一樣,好好扎。哈哈
插交換機(jī)的時(shí)候,從上往下,從1-24往后,這樣網(wǎng)絡(luò)異常,數(shù)一下就知道了。
想來想去這里也沒啥值得關(guān)注的地方。所以就幾行帶過。
有問題可以直接發(fā)郵件我或者回帖問。

五,資產(chǎn)統(tǒng)計(jì)
假如你的機(jī)器只有2000臺(tái)反而好容易管理了,但是現(xiàn)在我要管理的全國IDC有31個(gè),平均每個(gè)機(jī)房有不同品牌服務(wù)器1500臺(tái)。
一共大約有45000臺(tái)的樣子(我的資產(chǎn)管理系統(tǒng)里的數(shù)字,不包含交換機(jī),防火墻等)
這時(shí)候怎么辦?
每季度和財(cái)務(wù)小MM一起出去旅游盤點(diǎn)IDC資產(chǎn),幸福啊...(我們財(cái)務(wù)小mm很PL的哦)
到了機(jī)房就是我一個(gè)人干活點(diǎn)資產(chǎn),小mm帶著大口罩,披著雙層的放輻射服...
可憐我們這些干活的,短褲背心,IDC里一呆就是好幾個(gè)月(IDC辦公室就在機(jī)房邊上...),不知道精子被輻射殺死多少...

1,必須有資產(chǎn)管理系統(tǒng),雖然這個(gè)其實(shí)是個(gè)很簡單的數(shù)據(jù)庫,但是你可以把每一臺(tái)機(jī)器的品牌,硬件信息,操作系統(tǒng)信息,購買年限,質(zhì)保年限等,你非常關(guān)注的東西做一個(gè)詳細(xì)記錄,并配發(fā)同一的資產(chǎn)編號(hào)。
比如我們的資產(chǎn)號(hào),F(xiàn)WQ-123456
服務(wù)器-123456,這是一個(gè)總的資產(chǎn)號(hào),這個(gè)服務(wù)器哪怕搬到美國,也是這1個(gè)資產(chǎn),直到丟失,或者拋棄,都是這一個(gè)資產(chǎn),永遠(yuǎn)不會(huì)變。
比如我現(xiàn)在的板凳就是一個(gè)資產(chǎn)號(hào)是:服務(wù)器-000010的一個(gè)4U服務(wù)器,配置是P2 300*2  256M內(nèi)存 16G硬盤×4
購買時(shí)間是1999年10月,從中維修過1次,升級(jí)過1次,在哈爾濱機(jī)房-廣州機(jī)房-河南機(jī)房-北京網(wǎng)通機(jī)房-上海公司內(nèi)部測試機(jī)房-上海庫房服役過。
有歷史吧....

2,看過我這個(gè)服務(wù)器去過的地方,羨慕不?見證我們公司的發(fā)展史。9年過去了,終于成了我的板凳...
服務(wù)器在購買合同確定以后,就應(yīng)該按照配置記錄資產(chǎn),并且在財(cái)務(wù)備案,資產(chǎn)編號(hào)一定和財(cái)務(wù)記錄相同。這樣這個(gè)服務(wù)器走到哪里,都有備案和記錄。現(xiàn)在要把這個(gè)服務(wù)器送到某個(gè)機(jī)房去,搬著走吧...汗
送到機(jī)房,我們要給服務(wù)器按照財(cái)務(wù)給的表格粘貼資產(chǎn)編號(hào),選個(gè)順眼的地方,不會(huì)磨損的地方。
一般是機(jī)器正面某個(gè)地方,然后是機(jī)器屁股后面某個(gè)地方,然后機(jī)器側(cè)面把手的地方,粘貼3個(gè),以防掉了就煩了。
然后在粘貼這個(gè)機(jī)器的應(yīng)用資產(chǎn)號(hào)和IP標(biāo)簽:
應(yīng)用資產(chǎn)號(hào)舉例:FWQ-SH-XX-B31-WEBSERVER  意思是:服務(wù)器-上海-xx機(jī)房-B列31號(hào)機(jī)柜-web服務(wù)器
IP標(biāo)簽舉例:外123.234.123.234內(nèi)10.0.0.1。這2個(gè)標(biāo)簽?zāi)憧梢苑珠_也可以在一張標(biāo)簽上寫清楚。

并且在安裝服務(wù)器的時(shí)候。把FWQ-SH-XX-B31-WEBSERVER-123-234  把這個(gè)作為你的HOSTS信息,windows里叫做計(jì)算機(jī)名
這樣遠(yuǎn)程上來都非常清晰自己在哪個(gè)服務(wù)器上,出問題時(shí)候也非常容易找到這個(gè)機(jī)器,不要閑麻煩,一切的麻煩都是為了以后快速的解決down機(jī)問題而做的。
當(dāng)然啦,甚至在密碼管理上你也可以用這個(gè)規(guī)則來設(shè)置密碼,但是最好規(guī)則別讓別人知道了...

3,把這些信息全部錄入你的資產(chǎn)管理系統(tǒng)
系統(tǒng)無非服務(wù)器名,IP信息,用途,機(jī)架位置,或者是否在使用一類的,我就不多講了

4,資產(chǎn)系統(tǒng)軟件交互,也可以說是監(jiān)控系統(tǒng)。
企業(yè)可以開發(fā)一個(gè)軟件,在裝機(jī)的時(shí)候安裝到服務(wù)器上。然后資產(chǎn)管理系統(tǒng)定時(shí)去取服務(wù)器上的信息,比如網(wǎng)絡(luò)流量,CPU內(nèi)存硬盤負(fù)載一類的東西,這樣你的資產(chǎn)管理系統(tǒng)又變成了一個(gè)監(jiān)控系統(tǒng);
當(dāng)然啦,你也可以在資產(chǎn)系統(tǒng)里集成一個(gè)遠(yuǎn)程桌面管理系統(tǒng),自動(dòng)載入用戶名和密碼,還有隨機(jī)碼,就可以登錄系統(tǒng)。省的還得管理服務(wù)器密碼。

然后用戶的訪問權(quán)限不同,看到的節(jié)面權(quán)限就不同。
比如說,監(jiān)控人員沒有登錄權(quán)限,或者IDC人員沒有登錄權(quán)限一類。權(quán)限分配你自己研究好了。

5,還是IDC的工作。
話題繼續(xù)回到我和財(cái)務(wù)小mm去盤點(diǎn)(你公司比較大的話,你可以多派幾個(gè)人分開去各個(gè)地方...)
小mm一看我們機(jī)房服務(wù)器黑壓壓的一片,鋪天蓋地的,直接無語。為啥,因?yàn)橐弥Y產(chǎn)表一個(gè)一個(gè)核對(duì),面對(duì)幾千個(gè)機(jī)器,直接暈倒。
雖然按照資產(chǎn)管理系統(tǒng)里導(dǎo)出的信息,機(jī)柜號(hào),IP號(hào),機(jī)器從上到下的順序都非常精確,但是你一個(gè)一個(gè)核對(duì),還是慢。
怎么辦?
庫房管理的工作用上了,哈哈。你買服務(wù)器或者買筆記本電腦的時(shí)候有沒有注意到箱子上的條碼?
那個(gè)條碼非常清楚的記錄了這個(gè)機(jī)器的詳細(xì)信息。所以黑莓手機(jī)或者NOKIA手機(jī)(別的我沒用過)都有掃描條碼的功能...好像與主題無關(guān)...

那么剩下的就簡單了。
去買個(gè)這種條碼標(biāo)簽的打印機(jī),編輯成自己需要的條碼,一個(gè)一個(gè)貼好,上面有你所有需要盤點(diǎn)的信息...
比如我們是從資產(chǎn)到機(jī)柜號(hào)到服務(wù)器名字到內(nèi)外網(wǎng)IP都要盤點(diǎn)...小崩潰

打印出來貼上去。然后買個(gè)掃描槍,和超市那種一樣,不過你要買有存儲(chǔ)功能的,否則你要端著筆記本去掃描,SB了。
然后我和財(cái)務(wù)mm本來需要一個(gè)人念號(hào)碼一個(gè)人核對(duì)(你要直到在機(jī)房里大喊資產(chǎn)號(hào),喊一天的結(jié)果是啥,自己想),現(xiàn)在一個(gè)人拿一個(gè)掃描槍,按照規(guī)則一個(gè)一個(gè)掃描。完成后把數(shù)據(jù)導(dǎo)出后重新整理分析。直接和數(shù)據(jù)庫核對(duì)(當(dāng)然這個(gè)也需要你自己開發(fā)),核對(duì)完成生成一張表。
表上寫的非常清楚你哪個(gè)機(jī)架沒有哪個(gè)機(jī)器,哪個(gè)機(jī)器不在特定的位置上,哪個(gè)機(jī)器缺少..........等等
這樣比如說,機(jī)器位置不對(duì)扣5塊錢工資,機(jī)器IP不對(duì)扣2塊錢工資,或者...反正扣到最后...這月不給發(fā)工資了,還得倒貼點(diǎn)...哈哈哈

還有啥呢?反正想到了就來更新了。或者大家也可以提問,我會(huì)及時(shí)回復(fù)。

剩下的帖子在7樓,不知不覺2萬字了,這里滿了....

未完待續(xù)
(最近比較忙(半個(gè)月不到,全國跑了一半,TMD),一直沒來得及維護(hù)這里,請(qǐng)大家見諒。IDC方面告一段落,有問題可以在后面回帖問你想問的,不涉及公司隱私的我會(huì)寫在這里和大家共享。下面我會(huì)籌劃寫系統(tǒng)運(yùn)維方面的經(jīng)驗(yàn)。大家也可以把想知道的回帖在后面,我回盡力幫大家解決(veyron大俠的文章看完就知道他是老大級(jí)別的,我是民工級(jí)別的,自嘲一下,希望veyron大俠的架構(gòu)經(jīng)驗(yàn)和我的不值一提的實(shí)地經(jīng)驗(yàn)?zāi)芙o大家?guī)硖岣吆蛯W(xué)習(xí)的樂趣))
能想到的會(huì)繼續(xù)寫。


10月27日晚上23點(diǎn)41,我看到我的帖子成為精華帖了,感謝版主,感謝觀眾,也感謝veyron兄的帖子讓我有寫完這個(gè)帖子的動(dòng)力。我會(huì)用更加平實(shí)純樸,更加幽默詼諧,更多找抽的詞句完成下來的帖子的...

[ 本帖最后由 theanswer 于 2008-12-5 16:16 編輯 ]
作者: jiang2798    時(shí)間: 2008-10-10 17:35
學(xué)習(xí)了
作者: xi2008wang    時(shí)間: 2008-10-10 17:46
>>10,運(yùn)動(dòng)員            不要回家就睡覺,有空還是運(yùn)動(dòng)下吧;在服務(wù)器down機(jī)的時(shí)候,機(jī)房恰巧就你一個(gè)人,機(jī)柜沒有空間,你需要更換一臺(tái)HP 585 4U的服務(wù)器,滿配約80公斤的服務(wù)器,你怎么做?

應(yīng)該加上保潔員, 而且是專業(yè)的
大概一年前吧, 前公司調(diào)換服務(wù)器( 新購的給總部, 舊的給分公司)
丫丫的,那那HP機(jī), 重地要死, 兩個(gè)人抬, 還上下樓梯, 手都快斷了.
更郁悶的, 這舊機(jī)器還要打掃衛(wèi)生, 要將機(jī)器化整為零, 一片片擦洗,
有些主機(jī)灰塵那個(gè)厚啊:em11:
還有更氣人的, 老大過來巡檢了, 就用刷子掃了一塊鐵片就跑路了.
作者: jiang2798    時(shí)間: 2008-10-13 19:31
LZ 趕緊寫 越看越爽!!
作者: 蟲蟲貓    時(shí)間: 2008-10-13 22:04
學(xué)習(xí)了!樓主是牛人,期待你的更多經(jīng)驗(yàn)~
作者: 蟲蟲貓    時(shí)間: 2008-10-13 22:06
我在某電信大樓工作時(shí),從CCIE到機(jī)房主管到機(jī)房工作人員,全部是美女...

什么大廈啊
這個(gè)能否透漏下
作者: theanswer    時(shí)間: 2008-10-14 09:50
六,監(jiān)控架構(gòu)
監(jiān)控架構(gòu)其實(shí)每個(gè)地方都有自己的做法,我也知道我的辦法不是很先進(jìn),但是仍然拿出來和大家一起討論
首先談?wù)劚O(jiān)控軟件,一說起這個(gè)常用的東西MRTG,cacti一類的就都可以用了。只要稍微歸類一下,流量展示看的還是很清楚的。
要是要監(jiān)控服務(wù)一類的,那就只好啟用大名鼎鼎的nagios,和一些牛x人基于這個(gè)做的一些別的商業(yè)軟件。
或者就是自己做個(gè)腳本去定時(shí)探一下,不通了給你發(fā)郵件了啥的,你vim一下nagios的chack_xxx ,學(xué)習(xí)一下里頭人家探測的辦法,自己也能搞出來個(gè)啥東西,都還是很不錯(cuò)的了。

作為IDC工程師,我們所要關(guān)注的東西就是個(gè)流量了,我們要很清楚某臺(tái)65下的某臺(tái)35上每個(gè)口的應(yīng)用,當(dāng)遭受攻擊或者流量異常的時(shí)候,一眼就能知道是怎么回事。我不相信你天天看著10M的流量,某天突然一下給你來個(gè)80M,你說這是正常事件吧。哪怕正常,你也找相關(guān)的人確認(rèn)一下吧,一個(gè)100m口跑 80M,估計(jì)電信的人都來找你了。

每天看著這些流量圖是很枯燥的事情,那么我們沒事只能想辦法讓他自動(dòng)報(bào)警給我們了,于是EMAIL報(bào)警,然后把他發(fā)送到一個(gè)有手機(jī)提示新郵件的郵箱,你手機(jī)就有了。MSN報(bào)警,還是不錯(cuò)的吧,手機(jī)報(bào)警一類的辦法都是不錯(cuò)的。這樣你你可以和我一樣放心的去打網(wǎng)游了。
這里只談經(jīng)驗(yàn),不談詳細(xì)的技術(shù),因?yàn)槲乙徽f我的系統(tǒng)架構(gòu)地球人都知道我是哪個(gè)公司的了,雖然已經(jīng)離職,但是咱也有個(gè)職業(yè)道德,謝謝。

當(dāng)然了,有些公司是有網(wǎng)絡(luò)監(jiān)控部門的。但是我就一直在想這個(gè)問題,所有的數(shù)值都可以用短信報(bào)警,你隨時(shí)都可以收到信息。用這個(gè)部門干啥,讓一群可憐的家伙 8小時(shí)一動(dòng)不動(dòng)盯著屏幕,公司又在他們電腦上安裝了抓屏軟件,上班事件聊天上網(wǎng)就扣錢...我估計(jì)他們每天最期望的事情也莫過于服務(wù)器掛了,可以給我們打個(gè)電話重啟個(gè)服務(wù)器或者連到服務(wù)器上檢查一下啥問題,重啟個(gè)服務(wù)了啥的。當(dāng)然了,這些兄弟最后的職業(yè)方向也只能是進(jìn)入運(yùn)維部門了,至少公司服務(wù)器down 機(jī)維護(hù)的流程性東西掌握的非常熟練了。但是這是用好幾年時(shí)間換來的經(jīng)驗(yàn),太...所以我是奉勸兄弟們有發(fā)現(xiàn)監(jiān)控部門招聘人,就別去了吧。面前8臺(tái)顯示器,猛一看還以為是黑客帝國吶,結(jié)果仔細(xì)一看全tmd是流量圖。常年對(duì)著8個(gè)顯示器,那個(gè)輻射...
我就不清楚設(shè)置個(gè)節(jié)點(diǎn),出現(xiàn)問題告訴人,人去操作會(huì)死啊,非要讓人和機(jī)器一樣一動(dòng)不動(dòng)的盯著顯示器,TMD,官僚。雖然我沒經(jīng)歷過,但是想也能想到。做SA,最大的要點(diǎn)是懶,把一些需要人做的事情都自動(dòng)化...但是話說回來,我公司以人為本,人海戰(zhàn)術(shù)嘛,可以理解。


上面的帖子位子已經(jīng)滿了,下來的帖子在這里寫。打算寫的東西的列表,大家也可以問任何問題在回帖,我會(huì)回復(fù)的。
我大概通讀了veyron 大俠的文章,認(rèn)為系統(tǒng)架構(gòu)方面的我絕對(duì)不如他。我就不在這里賣藝了,那么我賣企業(yè)都會(huì)實(shí)際面對(duì)的一些問題。

1,自動(dòng)化,流程化你的信息管理
(剛被一起2年的mm一腳踹了的郁悶中恢復(fù)過來,繼續(xù)寫)
為什么要自動(dòng)化,這年頭流行辦公自動(dòng)化,你丫沒事還拿著工單四處簽字,老土了吧。
為什么要流程化,這念頭流行流程管理,假如你公司沒有一個(gè)固定的流程管理,出了事情,大家都不知道怎么做,各個(gè)部門的電話亂打,大家都一鍋粥沒有效率。所以,未雨綢繆,在沒有出問題的時(shí)候,模擬出問題,多多準(zhǔn)備,建立規(guī)范的流程,公司的每個(gè)人都要遵守,這樣,流程化的管理+辦公自動(dòng)化,大家只用在電腦上翹翹鍵盤,點(diǎn)擊確定,流程就發(fā)出去,一路審批,OK,流程發(fā)送到做事的人地方,也許這個(gè)做事的人在美國,也一樣方便。

上面說的是一個(gè)原理和意思,用這樣的理念去管理你的服務(wù)器應(yīng)該如何去做?當(dāng)然了,你假如只有10來臺(tái)服務(wù)器,就不用考慮這個(gè)了....
首先服務(wù)器采購錄入資產(chǎn)管理系統(tǒng)(詳細(xì)見上面有寫),服務(wù)器的去向和調(diào)度都在管理系統(tǒng)里有提現(xiàn)。

這里說的是:如何去上架,維修,下架等流程控制
先說上架下架:服務(wù)器到機(jī)房以后,別人要用服務(wù)器怎么辦?先可以到你的資產(chǎn)管理系統(tǒng)里,看你機(jī)房還有什么配置的機(jī)器多少臺(tái),然后讓他們選擇自己項(xiàng)目服務(wù)器的配置,數(shù)量。在流程管理系統(tǒng)中,把這些機(jī)器選中,生成一個(gè)表單,表單名字為xx項(xiàng)目上架需求,寫清楚誰用,做什么,數(shù)量,哪個(gè)機(jī)房等。然后提交給他們部門領(lǐng)導(dǎo),他們部門領(lǐng)導(dǎo)同意后,轉(zhuǎn)給需要審批的領(lǐng)導(dǎo),一層層下來,流轉(zhuǎn)到我們部門領(lǐng)導(dǎo),我們部門領(lǐng)導(dǎo)流轉(zhuǎn)給部門機(jī)房員工,員工收到流程,檢查上架下架服務(wù)器;如要上架,安裝完系統(tǒng)后填寫IP,機(jī)器名,機(jī)架等相關(guān)信息。如要下架,刪除相關(guān)信息,提交給流程控制的人員,流程控制人員確認(rèn)后,這個(gè)流程完成。屆時(shí),所有的人審批過的數(shù)據(jù),經(jīng)手人,數(shù)據(jù)庫里都有,出現(xiàn)什么問題找相關(guān)責(zé)任人,一下就找到了,省的和某些XX部門JJYY。
維修也一樣了,機(jī)器壞了,或者需要重裝系統(tǒng),按照上面的流程,一步步走一遍,就可以了。年底統(tǒng)計(jì)機(jī)房一天要干多少活,省的某些領(lǐng)導(dǎo)認(rèn)為機(jī)房人TMD都在閑著。機(jī)房的人呢?沒有流程不干活,否則白干。

在流程系統(tǒng)里重啟服務(wù)器,重啟服務(wù)器要是要流程,就太慢了,那么你可以做一個(gè)綠色通道,寫清楚原因,重啟哪個(gè)機(jī)器,直接提交給相關(guān)機(jī)房人員,在你的流程系統(tǒng)里綁定一個(gè)短信網(wǎng)關(guān),機(jī)房人員可以收到需要重啟服務(wù)器的短信。準(zhǔn)確無誤。

這樣代替了無紙化辦公,既有自己做的事情的每一個(gè)記錄,又有相關(guān)人員管理,可以量化自己的工作,免得年終獎(jiǎng)的時(shí)候xx人有說你干的少,發(fā)的少。你把記錄拉出來對(duì)比對(duì)比就知道誰多誰少了。

期待大家回帖討論

2,如何升級(jí)你的服務(wù)器
服務(wù)器老了,或者需要加內(nèi)存加硬盤,怎么升級(jí)。
雖然說是很簡單換個(gè)CPU,加個(gè)內(nèi)存,加個(gè)硬盤很簡單。
但是,如何控制你的配件不丟失,確定的安裝到機(jī)器上利用了呢?
簡單,在服務(wù)器上做一個(gè)探測服務(wù)器配置的客戶端,每天探測一次硬件配置發(fā)送到資產(chǎn)管理服務(wù)器上。
與資產(chǎn)管理系統(tǒng)的硬件配置做對(duì)比,出了問題就報(bào)錯(cuò)發(fā)一封郵件到機(jī)房工作人員,抄送流程控制人員一封就可以了。

至于的加內(nèi)存的時(shí)候注意型號(hào)啥的問題就不說了,大家應(yīng)該都沒問題了
要說的是,假如你一個(gè)機(jī)柜上放的機(jī)器比較多,比如4個(gè)6個(gè)機(jī)器一摞,恰巧壞了,恰巧一個(gè)人在機(jī)房,非得解決,怎么辦?
簡單,一個(gè)辦法,但是還是需要你有力氣,雖然有力學(xué)原理
比如有4臺(tái)服務(wù)器,最下面的壞了,
你可以拽住最下面的把4臺(tái)一起往出拉,拉出來一點(diǎn),把上面3臺(tái)往后推,這樣一點(diǎn)一點(diǎn)的拉出來,
下面最關(guān)鍵:
拉到最后,前面要留出來一點(diǎn),輕輕的把上面3臺(tái)的尾巴著地,然后一只手抬住上面3臺(tái)機(jī)器,一只手拉出下面一臺(tái)機(jī)器。
上面3臺(tái)一定要留出來一點(diǎn),否則放下的時(shí)候,機(jī)器和機(jī)柜托板會(huì)壓住你的手,你一松手,機(jī)器震一下,硬盤就掛了。。。
所以在推進(jìn)去的最后仍舊要留一點(diǎn)在外面,最后放下來了再推進(jìn)去這最后一點(diǎn)。
然后就可以換或者加內(nèi)存了。相對(duì)比較省勁,不危險(xiǎn),不會(huì)壓倒自己,不會(huì)砸壞服務(wù)器的辦法就是這樣了。

期待大家有更多更好的辦法交流。

3,硬件故障保修技巧交流

4,廢舊服務(wù)器庫房管理交流

5,淘汰服務(wù)器處理交流




6,運(yùn)維工作人員飲食結(jié)構(gòu)交流(囧)

7,還沒想到,大家繼續(xù)建議



雖然現(xiàn)在已經(jīng)不做那個(gè)事情了,但是沒事在研究用u盤安裝windows,速度比光盤快,還節(jié)省光盤。
因?yàn)楝F(xiàn)在用的筆記本是X200S,沒有光驅(qū),u盤安裝debian lenny時(shí)候的一些心的和想法。

[ 本帖最后由 theanswer 于 2008-12-5 16:34 編輯 ]
作者: zbxy110    時(shí)間: 2008-10-14 13:50
實(shí)在阿 ,給你頂一下
作者: zbxy110    時(shí)間: 2008-10-14 14:02
一下子裝那么多系統(tǒng)確實(shí)要命,有沒有好的實(shí)在的解決方法,尤其windows,比較順暢的安裝,不要ghost
作者: tinybiz    時(shí)間: 2008-10-14 15:39
這篇文章好啊 。期待去機(jī)房鍛煉一下
作者: xxlmmf    時(shí)間: 2008-10-14 16:52
累殘廢了你。。。還好。。。你是沒經(jīng)過。。。
作者: jiang2798    時(shí)間: 2008-10-14 17:13
很好的經(jīng)驗(yàn) 學(xué)習(xí)了
作者: jiang2798    時(shí)間: 2008-10-18 21:38
  趕緊更新啊
作者: cnleon    時(shí)間: 2008-10-18 22:16
2,系統(tǒng)工程師的工作    你至少要理解各種系統(tǒng)服務(wù),在出問題的情況下要迅速解決問題,而不是等系統(tǒng)工程師來解決。


到底誰來做?
作者: 我為人民服務(wù)    時(shí)間: 2008-10-19 00:42
確實(shí)是牛人
作者: huzi1986    時(shí)間: 2008-10-19 12:39
辦法3,我犯賤時(shí)候發(fā)明的:我們的機(jī)器全部是RAID1,于是我安裝一臺(tái)raid1的機(jī)器,系統(tǒng)全部安裝好,然后拔掉一個(gè)硬盤,插上一個(gè)新硬盤自動(dòng)恢復(fù)鏡像,基本10來分鐘恢復(fù)好一個(gè)硬盤,插到機(jī)器上去。這樣,還是比裝系統(tǒng)來的快。當(dāng)然啦,型號(hào)是一模一樣的。。。



這招不錯(cuò)
作者: 老臧    時(shí)間: 2008-10-20 15:03
樓主說的多是網(wǎng)絡(luò)工程師的工作
也是運(yùn)維工程師必備的

支持!

RAID 那招學(xué)習(xí)了
作者: 7717060    時(shí)間: 2008-10-20 15:39
不錯(cuò)看了一下
作者: theanswer    時(shí)間: 2008-10-22 14:51
原帖由 cnleon 于 2008-10-18 22:16 發(fā)表
2,系統(tǒng)工程師的工作    你至少要理解各種系統(tǒng)服務(wù),在出問題的情況下要迅速解決問題,而不是等系統(tǒng)工程師來解決。


到底誰來做?


一般IDC工作人員是在機(jī)房,事故發(fā)生的現(xiàn)場

如果能現(xiàn)場解決的話,是不需要插網(wǎng)線等系統(tǒng)工程師上線來做。

因?yàn)檫@個(gè)過程是一個(gè)響應(yīng)的過程。比如某天凌晨2點(diǎn)。

我們小公司,要求必須具備這個(gè)素質(zhì),雖然也可以推脫,和自己的無關(guān)。

但是從運(yùn)營角度講,響應(yīng)的時(shí)間=down機(jī)時(shí)間。

所以,IDC部門和系統(tǒng)運(yùn)維部門最好是在同一個(gè)人管,這樣方便協(xié)同。
作者: media008    時(shí)間: 2008-10-22 21:11
寫的不錯(cuò)啊!!你是那里的
作者: jiang2798    時(shí)間: 2008-10-23 01:58
LZ 看了 一個(gè)字“爽”
作者: 騾子先生    時(shí)間: 2008-10-24 10:32
牛人,不過實(shí)施起來很難,中國的公司習(xí)慣于"亂",不亂不顯出“救世主”的能力。
作者: mz198424    時(shí)間: 2008-10-24 10:37
標(biāo)題: 回復(fù) #1 theanswer 的帖子
學(xué)習(xí)了!
作者: sshnuke    時(shí)間: 2008-10-24 22:46
mark了等樓主更新
真是全面具體啊
作者: zbxy110    時(shí)間: 2008-10-25 14:07
這位老兄說的很實(shí)在,公司的運(yùn)維本來就是服務(wù)開發(fā)和應(yīng)用的,集技術(shù)于一身 呵呵當(dāng)然也包括運(yùn)動(dòng)員拉

[ 本帖最后由 zbxy110 于 2008-10-25 14:10 編輯 ]
作者: mudone    時(shí)間: 2008-10-27 10:56
LZ謙虛了,45000臺(tái)機(jī)器的公司還小公司。。。
Raid那招不錯(cuò)。
作者: theanswer    時(shí)間: 2008-10-27 23:39
我看到我的帖子成為精華帖了,感謝版主,感謝觀眾,也感謝veyron兄的帖子讓我有寫完這個(gè)帖子的動(dòng)力。我會(huì)用更加平實(shí)純樸,更加幽默詼諧,更多找抽的詞句完成下來的帖子的...
作者: 5iwww    時(shí)間: 2008-10-28 16:05
LZ說的沒錯(cuò),但是公司有時(shí)候是必須要人來做運(yùn)維的,如果都是機(jī)器,或者有很好的一套系統(tǒng)運(yùn)維監(jiān)控設(shè)備的話,想必很多搞系統(tǒng)的人要失業(yè),這也是某些人不希望看到的。所以,話雖然說的很漂亮,事情卻不能那么做。就跟一些電信級(jí)的操作一樣,明明很簡單的事情,這工單,那工單,地方電信推來推去把你當(dāng)皮球踢的事情多的是。 一句話,光懂技術(shù),不懂人際關(guān)系的運(yùn)維工程師,一輩子賣的都是體力。
作者: jenkinhuang    時(shí)間: 2008-10-29 14:50
謝謝!留下位置,等待樓主繼續(xù)。。。。。
作者: nhge003    時(shí)間: 2008-10-29 15:49
厲害,學(xué)習(xí)了
作者: zhengwei_zw    時(shí)間: 2008-10-30 11:12
四萬五千臺(tái)服務(wù)器?暈死。。哪家公司哦?

raid那招,我很早就用
作者: zhengwei_zw    時(shí)間: 2008-10-30 11:19
寫這篇文章的人,根本不真實(shí)
引用“我做的最弱智的一件事情就是,來了400臺(tái)服務(wù)器,50個(gè)交換機(jī),8臺(tái)EMC,我一個(gè)人花了一星期把箱子才全部拆完。。!
你們公司能買400臺(tái)服務(wù)器,何不多請(qǐng)一個(gè)運(yùn)維人員?
偏偏就要你一個(gè)人去拆箱子???
你不是腦殼有問題,那就是你的服務(wù)器只有4臺(tái)。
作者: fjlycfq    時(shí)間: 2008-10-30 11:26
不錯(cuò)寫得很好,支持樓主繼續(xù)寫下去。。。。。。
作者: minuteman    時(shí)間: 2008-10-30 12:57
原帖由 zhengwei_zw 于 2008-10-30 11:19 發(fā)表
寫這篇文章的人,根本不真實(shí)
引用“我做的最弱智的一件事情就是,來了400臺(tái)服務(wù)器,50個(gè)交換機(jī),8臺(tái)EMC,我一個(gè)人花了一星期把箱子才全部拆完。。。”
你們公司能買400臺(tái)服務(wù)器,何不多請(qǐng)一個(gè)運(yùn)維人員?
偏偏 ...

就我個(gè)人的經(jīng)歷來說,也許是真實(shí)的
這是在國內(nèi)啊,相信國內(nèi)很多做IDC的公司,在租用機(jī)房所在地,應(yīng)該不會(huì)超過2個(gè)常駐人員的。
我是在運(yùn)營商工作的,領(lǐng)導(dǎo)摳門的話,一樣會(huì)出現(xiàn)這樣的情況。
曾經(jīng)也碰到過400多臺(tái)服務(wù)器,100多臺(tái)交換機(jī),5個(gè)人收貨搬運(yùn)拆箱上架,一天搞定,累的那個(gè)慘啊。
領(lǐng)導(dǎo)就是不立項(xiàng)讓外包工程隊(duì)來做,你有啥辦法?
作者: zhengwei_zw    時(shí)間: 2008-10-30 13:59
400臺(tái)
不可能讓1個(gè)人負(fù)責(zé)
從賣到上架,再到系統(tǒng)安裝,管理
絕對(duì)不可能1個(gè)人管理負(fù)責(zé)的
作者: sz2273    時(shí)間: 2008-11-04 15:37
6,運(yùn)維工作人員飲食結(jié)構(gòu)交流(囧)

狂汗一下,我們一般吃飯都覺得沒時(shí)間了還飲食文化。無語ing
作者: sz2273    時(shí)間: 2008-11-04 15:39
原帖由 zhengwei_zw 于 2008-10-30 11:12 發(fā)表
四萬五千臺(tái)服務(wù)器?暈死。。哪家公司哦?

raid那招,我很早就用



呃,最早用的應(yīng)該是dd吧。哇咔咔

當(dāng)然我說的不是WIN了,那就直接無語了
作者: theanswer    時(shí)間: 2008-11-06 11:23
原帖由 zhengwei_zw 于 2008-10-30 13:59 發(fā)表
400臺(tái)
不可能讓1個(gè)人負(fù)責(zé)
從賣到上架,再到系統(tǒng)安裝,管理
絕對(duì)不可能1個(gè)人管理負(fù)責(zé)的



那也要看什么公司什么領(lǐng)導(dǎo)了。
比如我曾從上海送110臺(tái)服務(wù)器坐公司的貨車從上海到東莞機(jī)房。
還要連夜裝系統(tǒng)2天部署完畢,弄完后是第二天晚上8點(diǎn),說休息一下去吃飯,結(jié)果睜開眼就是第二天10點(diǎn)半,睡過了只好從東莞打車去廣州白云機(jī)場。
比如我一個(gè)人一早上獨(dú)立上8臺(tái)EMC CX500+4臺(tái)HP 585,EMC的工程師過來看了傻站10秒鐘后直接一句話:兄弟,今天我管飯...

比如我們濟(jì)南某機(jī)房,600臺(tái)機(jī)器我和我小弟2個(gè)人1個(gè)周上架完畢,網(wǎng)通的領(lǐng)導(dǎo)都說了,你們部門的人就是瘋子。

要說人家?guī)兔σ簿褪枪┴浬踢^來幾個(gè)人幫你把箱子拆好,但是你見過這樣的供貨商么?或者人家來了,各個(gè)都是大爺(也有好人)。

你可以不相信,我也不愿意和你爭辯,但是這是事實(shí)。最后,你可以否認(rèn)我的工作,但是不可否認(rèn)我小弟的勤勞。謝謝。
如果你還不相信,那你可以找找上海某家HP的經(jīng)銷商,或者上海熱線某機(jī)房,問問那個(gè)一手提一臺(tái)DELL6650的兄弟是誰。
你也可以問問某網(wǎng)絡(luò)游戲公司的資產(chǎn)監(jiān)管的部門,是哪個(gè)兄弟帶了幾個(gè)民工晚上11點(diǎn)開始到第二天早上4點(diǎn),從某機(jī)房搬2000臺(tái)報(bào)廢的機(jī)器到15公里外沒有電梯的4樓庫房,公司就給了2輛金杯,民工都累倒了他還在干,為了按時(shí)把機(jī)柜騰出來第二上新項(xiàng)目。新項(xiàng)目的服務(wù)器還是我們?nèi)藖砩,由于是緊急項(xiàng)目,你有沒有見過從公司的部門經(jīng)理+部門總監(jiān)都親自到場搬服務(wù)器上架,為了趕一個(gè)新項(xiàng)目。我承認(rèn)我們公司規(guī)劃有嚴(yán)重問題,但是我絕對(duì)否認(rèn)你的一個(gè)人搞不定400機(jī)器說。

雖然聽起來很不真實(shí)。但是現(xiàn)實(shí)就是這樣,你可以不做,有人爭著做。你可以拿著高薪沾沾自喜,但是并不代表拿著你一半錢的人就一定干不來你做的事情。做IT的,本來就是在創(chuàng)造奇跡,你可以不相信奇跡,但是事實(shí)確實(shí)別人做出來了。你可以否定別人做的事情,我可以說你比我們做的好的多,你是我學(xué)習(xí)的榜樣,但是你拿出來共享過么?或者,你可以拿出更好的方案了反駁我。RAID你很早就知道了,但是chinaunix有多少人知道?說白了也只是個(gè)自由軟件的應(yīng)用者,而不是自由軟件的傳播者。

下面這臺(tái)機(jī)器我們都是2個(gè)人來上的,照相的是我小弟,和機(jī)器合影的人就是我。這個(gè)照片原發(fā)在公司表揚(yáng)論壇上。所以我在文章的開始就說了,如果你不是個(gè)好的運(yùn)動(dòng)員,就不要來做運(yùn)維工程師。不要給我說你裝了幾個(gè)銀行系統(tǒng),會(huì)幾個(gè)linux shell沒事編譯幾個(gè)kernel你就是運(yùn)維工程師了,充其量也就是個(gè)xx(不想說出來)的裝機(jī)男或者操作員而已。沒有好的人品,永遠(yuǎn)只是個(gè)普通的IT民工。


[ 本帖最后由 theanswer 于 2008-11-6 13:35 編輯 ]
作者: dhjs04    時(shí)間: 2008-11-06 13:45
哈哈,我最喜歡你說的那句,你給人家牛,那你買的產(chǎn)品只能是。。。蒙牛

不過我是很誠實(shí)的,你跟我牛最多我是討厭罷了,不會(huì)蒙你地。。
作者: theanswer    時(shí)間: 2008-11-06 14:35
原帖由 dhjs04 于 2008-11-6 13:45 發(fā)表
哈哈,我最喜歡你說的那句,你給人家牛,那你買的產(chǎn)品只能是。。。蒙牛

不過我是很誠實(shí)的,你跟我牛最多我是討厭罷了,不會(huì)蒙你地。。



我?guī)讜r(shí)給你牛了,冤枉。。。

我是非典型的IT民工+裝機(jī)男
作者: LinuxForShare    時(shí)間: 2008-11-07 10:21
原創(chuàng)是牛人啊!強(qiáng)頂。!
作者: voxxu    時(shí)間: 2008-11-08 12:26
不頂不行啊
作者: lengi    時(shí)間: 2008-11-11 19:48
兄弟,你是盛大的吧?
裝2000太windows啊。
作者: saim.shang    時(shí)間: 2008-11-12 10:45
聽說dell可以用腳本把服務(wù)器的設(shè)置全部搞定
os可以內(nèi)部網(wǎng)部署完成
作者: lktpd    時(shí)間: 2008-11-13 15:46
估計(jì)樓主是盛大的。反正肯定是游戲公司。
作者: 7717060    時(shí)間: 2008-11-18 10:25
比如 XX路XX號(hào)XX大廈XX樓XX室,你寫到xx號(hào),送快遞的會(huì)給你堆到院子里,你寫到xx樓,送快遞的會(huì)給你送到電梯口,你寫到xx室,他們才會(huì)給你搬到室內(nèi)。因?yàn)樗拓浀亩际欠⻊?wù)器廠商找的,你因?yàn)檫@個(gè)事情去聯(lián)系廠商修改送貨地址,至少要多等N小時(shí)。而且他們視你的單子的數(shù)量和樓層,判斷來多少搬運(yùn)人員。而且,一定要把服務(wù)器搬到你指定的地方再簽字收貨,否則...嘿嘿...  

學(xué)習(xí)了
作者: veyron    時(shí)間: 2008-11-18 12:59
呵呵,頂一個(gè)
作者: phpman    時(shí)間: 2008-11-18 21:54
萬惡的Windows系統(tǒng)。  萬惡的垃圾架構(gòu)師!
作者: iamshiyu    時(shí)間: 2008-11-20 13:38
太牛了,非常感謝這么寶貴的經(jīng)驗(yàn)。
能否問下,干了6年運(yùn)維,呆了幾個(gè)地方?最長的一個(gè)地方呆了多久?
作者: dayip.cn    時(shí)間: 2008-11-20 13:38
提示: 作者被禁止或刪除 內(nèi)容自動(dòng)屏蔽
作者: adminsinx    時(shí)間: 2008-11-21 09:31
LZ可是全才啊。
作者: adminsinx    時(shí)間: 2008-11-21 09:33
運(yùn)維界的奇才!
作者: apuawv    時(shí)間: 2008-11-21 10:20
牛人,頂頂頂!
作者: ttxx    時(shí)間: 2008-11-25 17:12
哥們你太強(qiáng)了。。。。第一次看完這么長的文章。。


不過我更關(guān)心的想知道你是哪個(gè)公司的。

或者能把你的一些技術(shù)給大家共享出來,呵呵
作者: fuyic    時(shí)間: 2008-11-26 17:49
唉,看了這個(gè)帖,樓主很NB。
我原來覺得我已經(jīng)很強(qiáng),沒想到有比我還強(qiáng)的。
不過你們的規(guī)劃實(shí)在SB。。。。這么多高強(qiáng)度工作居然讓這么少人完成,不知道兄弟你月薪多少。
還有就是兄弟千萬挺住,別閃到腰。
上次我閃到腰難受了一個(gè)多月。
上星期我們剛在某機(jī)房搞定了400臺(tái)服務(wù)器上線,沒有好規(guī)劃的話就是折騰人滴。
作者: fuyic    時(shí)間: 2008-11-26 17:52
對(duì)了有一點(diǎn)特別可以交流的,你們知道不知道這些服務(wù)器廠商有沒有箱子回收計(jì)劃?
要是有這項(xiàng),那我們就發(fā)啦。。。哇哈哈哈。
賣廢品實(shí)在是太便宜了。最近北京紙箱價(jià)格又掉了。。。
突然發(fā)現(xiàn)某些供應(yīng)商的庫管人員油水很大。。。。。我們的供應(yīng)商管拆箱的裸機(jī)到IDC。
作者: hunter989    時(shí)間: 2008-12-01 18:03
lz說的沒錯(cuò),上次去網(wǎng)通的機(jī)房,趕上百度上服務(wù)器,擺了慢慢一樓到,半個(gè)月才拆完!機(jī)房就2人,那叫一個(gè)苦
作者: ice2oo1    時(shí)間: 2008-12-02 13:36
和我的工作差不多。。。。。就是那么郁悶的,,,,所以過得象打雜般的生活
作者: haoo123    時(shí)間: 2008-12-03 11:45
忒強(qiáng)悍了。。。。。。
作者: stokeorange    時(shí)間: 2008-12-03 12:08
佩服LZ的精神品質(zhì),自嘆不如。
作者: panlingyu    時(shí)間: 2008-12-03 12:11
windows 裝機(jī) 是見識(shí)過了的  我們公司也有點(diǎn)那個(gè)什么。
作者: theanswer    時(shí)間: 2008-12-05 16:23
原帖由 panlingyu 于 2008-12-3 12:11 發(fā)表
windows 裝機(jī) 是見識(shí)過了的  我們公司也有點(diǎn)那個(gè)什么。


我們公司裝機(jī)規(guī)定中的一些細(xì)則:
1,安裝系統(tǒng)安裝系統(tǒng)補(bǔ)丁必須拔掉網(wǎng)線,一經(jīng)發(fā)現(xiàn)沒有拔網(wǎng)線安裝系統(tǒng)或補(bǔ)丁,一律重裝;連續(xù)發(fā)現(xiàn)3次者,扣除本月績效獎(jiǎng)金。
2,安裝系統(tǒng)必須用原版的windows光盤安裝后,打經(jīng)過安全部認(rèn)證的驅(qū)動(dòng)盤,和安全部定時(shí)下發(fā)的補(bǔ)丁光盤。

所以不是我們沒有分發(fā)的裝備或者技術(shù),而是公司的硬性規(guī)定。
作者: theanswer    時(shí)間: 2008-12-05 16:25
原帖由 ttxx 于 2008-11-25 17:12 發(fā)表
哥們你太強(qiáng)了。。。。第一次看完這么長的文章。。


不過我更關(guān)心的想知道你是哪個(gè)公司的。

或者能把你的一些技術(shù)給大家共享出來,呵呵



雖然已經(jīng)離職,但是這個(gè)不用透露了吧,在這里是和大家聊技術(shù)聊情感,來自大公司或者小公司已經(jīng)無所謂了吧?

有問題我看到會(huì)和你一起討論怎么做的,因?yàn)槲易龅牟⒉灰欢ㄊ亲詈米钸m合你的辦法。
作者: theanswer    時(shí)間: 2008-12-05 16:28
原帖由 fuyic 于 2008-11-26 17:49 發(fā)表
唉,看了這個(gè)帖,樓主很NB。
我原來覺得我已經(jīng)很強(qiáng),沒想到有比我還強(qiáng)的。
不過你們的規(guī)劃實(shí)在SB。。。。這么多高強(qiáng)度工作居然讓這么少人完成,不知道兄弟你月薪多少。
還有就是兄弟千萬挺住,別閃到腰。
上 ...



體力活干的越多,工資就越低。所以,就別問這個(gè)了...

所以離職后,現(xiàn)在的工作是linux sa,
現(xiàn)在的公司50多人中,有50%用linux,35%的人用mac os,14%的人用windows,還有一個(gè)奇才,用的是windows98在ibm x301上。
作者: theanswer    時(shí)間: 2008-12-05 16:29
原帖由 iamshiyu 于 2008-11-20 13:38 發(fā)表
太牛了,非常感謝這么寶貴的經(jīng)驗(yàn)。
能否問下,干了6年運(yùn)維,呆了幾個(gè)地方?最長的一個(gè)地方呆了多久?


公司全國的機(jī)房都去過,只是時(shí)間長短的問題,最短呆了2小時(shí),配置好交換機(jī)防火墻走人,
最長的機(jī)房呆了2年多...

在一個(gè)公司...
作者: theanswer    時(shí)間: 2008-12-05 16:32
原帖由 ice2oo1 于 2008-12-2 13:36 發(fā)表
和我的工作差不多。。。。。就是那么郁悶的,,,,所以過得象打雜般的生活



關(guān)鍵是:招聘的時(shí)候,需要你CCNP,需要你RHCE,需要你MCSE,
結(jié)果進(jìn)來的結(jié)果,就是裝機(jī)男,我一度研究我發(fā)明的這個(gè)詞語,裝機(jī)男,的英文怎么翻譯。
作者: lFANS    時(shí)間: 2008-12-06 23:50
感觸良多,謝謝。
作者: spihiker    時(shí)間: 2008-12-11 16:46
NIU  REN
作者: chuhongze    時(shí)間: 2008-12-14 10:02
theanswer-兄弟,看了你的大作,感觸良多。聽說你從裝機(jī)男升為LINUX-SA為你高興?次恼碌臅r(shí)候很受感動(dòng)。你能體諒別人的不理解更顯示出你的大度。這樣的工作你能做幾年,很是感慨。希望能和你交個(gè)朋友。發(fā)你站內(nèi)短信了。
作者: zjzct    時(shí)間: 2008-12-15 23:31
干好裝機(jī)男的工作也不容易呀!
作者: theanswer    時(shí)間: 2008-12-17 15:34
原帖由 chuhongze 于 2008-12-14 10:02 發(fā)表
theanswer-兄弟,看了你的大作,感觸良多。聽說你從裝機(jī)男升為LINUX-SA為你高興?次恼碌臅r(shí)候很受感動(dòng)。你能體諒別人的不理解更顯示出你的大度。這樣的工作你能做幾年,很是感慨。希望能和你交個(gè)朋友。發(fā)你站內(nèi) ...



謝謝前輩,
已經(jīng)加你msn了

雖然說是裝機(jī)男,
但是從各種服務(wù)器到個(gè)各種存儲(chǔ)各種防火墻交換機(jī)都熟悉,也是個(gè)CCNP,MS的域也是若干年前一直做的,
現(xiàn)在是linux sa,也是mysql DBA,但是還是一個(gè)打雜的,

沒事幫公司MM裝裝星際譯王,裝裝紅旗office,裝裝永中office,添加添加打印機(jī)啥的....

沒閃人的原因是沒事和老外MM飚英語...
沒事追追埃及MM什么的...
囧...
作者: ben1984    時(shí)間: 2008-12-19 17:04
提示: 作者被禁止或刪除 內(nèi)容自動(dòng)屏蔽
作者: gyp334a    時(shí)間: 2008-12-24 16:26
看完了我不得不驚嘆。
作者: aoegiss    時(shí)間: 2008-12-24 22:15
niubility
作者: gogo407    時(shí)間: 2008-12-26 14:31
看完了,我覺得我要鍛煉身體
身體不行還干不了裝機(jī)男
作者: 妖哥    時(shí)間: 2009-01-15 21:05
樓主大牛,加油,繼續(xù)....謝謝分享
作者: evan_wan    時(shí)間: 2009-06-12 17:15
強(qiáng)!。。。。。!
作者: Hongqiyaodao    時(shí)間: 2009-08-17 16:01
提示: 作者被禁止或刪除 內(nèi)容自動(dòng)屏蔽
作者: guoli0813    時(shí)間: 2009-08-18 16:39
看了,雖然LZ用的是很詼諧的語言,但是個(gè)中心酸我們都有體會(huì),當(dāng)初我抱著hp那個(gè)接近100斤的機(jī)器從亦莊機(jī)房南門到他們大廳,那天太陽公公還挺賞臉,30多度,干辣辣的熱呀,。。。。。。。
作者: h101com    時(shí)間: 2009-08-21 16:20
頂!
作者: greendays    時(shí)間: 2009-08-24 10:39
兄弟辛苦了,做一樣的工作,運(yùn)維這行有苦也有樂,很佩服你。
作者: jiean    時(shí)間: 2009-09-02 11:14
原帖由 guoli0813 于 2009-8-18 16:39 發(fā)表
看了,雖然LZ用的是很詼諧的語言,但是個(gè)中心酸我們都有體會(huì),當(dāng)初我抱著hp那個(gè)接近100斤的機(jī)器從亦莊機(jī)房南門到他們大廳,那天太陽公公還挺賞臉,30多度,干辣辣的熱呀,。。。。。。。


以前也在亦莊,兄弟體力不錯(cuò)啊
作者: lala-flag    時(shí)間: 2009-09-02 13:49
重新閱讀
作者: fla119    時(shí)間: 2009-09-17 20:32
提示: 作者被禁止或刪除 內(nèi)容自動(dòng)屏蔽
作者: konds    時(shí)間: 2009-11-11 17:19
這個(gè)一定要頂阿
作者: wangbo992724    時(shí)間: 2009-12-25 14:25
標(biāo)題: 像是國內(nèi)某cdn運(yùn)營公司吧
網(wǎng)游公司08年之前沒有哪家有45000吧
作者: wangbo992724    時(shí)間: 2009-12-25 14:31
辦法4,HP的ILO2功能,實(shí)現(xiàn)遠(yuǎn)程分發(fā)。前提你得一臺(tái)一臺(tái)配置好BIOS里的ILO2。也是蠻痛苦的。IBM和DELL現(xiàn)在也都有這個(gè)功能,但是你在分發(fā)以前,還是得一臺(tái)一臺(tái)機(jī)器插上網(wǎng)線,配置好BIOS的IP,痛苦。然后把操作系統(tǒng)和機(jī)器的驅(qū)動(dòng)程序和后續(xù)的軟件全部做到一張DVD里,讓他自動(dòng)運(yùn)行。然后所有的服務(wù)器遠(yuǎn)程運(yùn)營這一個(gè)ISO,最好多弄幾臺(tái),否則一臺(tái)機(jī)器弄的慢死。

-- 這個(gè)可以使用dhcp吧,不用每個(gè)機(jī)器都去配置IP
插上線就可以,貌似可以省不少力。HP的ILO缺省就是dhcp模式。
作者: minmig    時(shí)間: 2010-01-02 15:22
看完了,不回貼看不過去啊。
作者: sky-鵬    時(shí)間: 2010-02-10 11:50
拜讀~~~~
作者: 大司南    時(shí)間: 2010-02-16 13:43
感謝樓主分享,感動(dòng)的不是樓主的體力,是樓主的人品~~
作者: smallfish    時(shí)間: 2010-02-20 14:25
好文章,學(xué)習(xí)了,感謝樓主!
作者: dgvri    時(shí)間: 2010-02-23 16:17

  1. 7,英語               不想說了,我的最大痛苦就在這里
復(fù)制代碼
也是我永完的痛,英語不好搞技術(shù)太費(fèi)勁了。

  1. 12,組織者            給你2個(gè)啥都不會(huì)的民工,再給你2000臺(tái)服務(wù)器,要求你2天把服務(wù)器裝完,你咋辦?
復(fù)制代碼
如果組織得當(dāng),一切心中有數(shù),民工干活比技術(shù)人員干的都好,深有體會(huì)

  1. 機(jī)器選型的時(shí)候你也要為自己考慮,比如HP的ILO功能,可以讓你遠(yuǎn)程BIOS級(jí)操作服務(wù)器
復(fù)制代碼
ILO或IPMI可以做很多工作,直接重定向后,你就可以直接遠(yuǎn)程管理這臺(tái)服務(wù)器,就像是在顯示器前操作一樣,設(shè)BIOS,RAID,按F1-F12這些等,系統(tǒng)壞了你可以用這種方式來修
方便,不是一盤的方便。

  1. 結(jié)果我機(jī)器至少被熱死了100臺(tái)以上,機(jī)器是HP的,機(jī)器過熱,HP會(huì)自動(dòng)關(guān)機(jī),而且會(huì)不讓你啟動(dòng)。你崩潰不?注:不是給hp做廣告哈。
復(fù)制代碼
HP的一般超過31度就開始掛了;我們?cè)谕獾赜脕砀鉉DN的機(jī)房都是不太正規(guī)的機(jī)房,空調(diào)老是三天兩頭出問題,一出問題機(jī)器就死,而且不是死一兩臺(tái),是全死。
從ILO的WEB可以看到當(dāng)前環(huán)境溫度,可以使這個(gè)來和機(jī)房理論。

  1. 下面是拆箱子,面對(duì)著堆積如山的2000臺(tái)服務(wù)器,我是連抬手的力氣都拿不出來。。。當(dāng)時(shí)機(jī)房只有我們公司3個(gè)人+電信值班2個(gè)人。。。
  2. 這時(shí)候,我的辦法是。。。我打電話找來了2隊(duì)收廢品的:
  3. 這么多箱子,除了機(jī)器和電源線留下,里頭的導(dǎo)軌光盤等等你全部拿走,誰拆的多誰拿的多。。。
  4. 最后按照我的要求幫忙搬到機(jī)柜上。。。于是我們5個(gè)人是監(jiān)工。。。看人家拆箱子搬機(jī)器。
  5. 于是人家2隊(duì)人找來了30多號(hào)人,一早上把2000臺(tái)機(jī)器全部拆箱子完畢放到機(jī)柜上。
  6. 要是我們幾個(gè)人拆,估計(jì)......
復(fù)制代碼
同感同感,太同感了,我一般都是直接讓供貨商找民工來拆,紙箱子直接賣掉,08年時(shí)一個(gè)HP紙箱能賣到六塊錢,我們一幫兄弟半年的吃喝都是靠它,09年一個(gè)紙箱一塊錢
誰說經(jīng)濟(jì)沒有危機(jī)?

  1. 裝系統(tǒng)
復(fù)制代碼
不說了,PXE安裝LINUX,比啥都方便,而且超快無比

  1. 我一看TMD全部是DVD,IBM的機(jī)器直接佩combo
復(fù)制代碼
我們的服務(wù)器除了HP DL580G5外,其它的都不帶光驅(qū),也確實(shí)用不著。

  1. 辦法4,HP的ILO2功能,實(shí)現(xiàn)遠(yuǎn)程分發(fā)。前提你得一臺(tái)一臺(tái)配置好BIOS里的ILO2。也是蠻痛苦的。IBM和DELL現(xiàn)在也都有這個(gè)功能,但是你在分發(fā)以前,還是得一臺(tái)一臺(tái)機(jī)器插上網(wǎng)線,配置好BIOS的IP,痛苦。然后把操作系統(tǒng)和機(jī)器的驅(qū)動(dòng)程序和后續(xù)的軟件全部做到一張DVD里,讓他自動(dòng)運(yùn)行。然后所有的服務(wù)器遠(yuǎn)程運(yùn)營這一個(gè)ISO,最好多弄幾臺(tái),否則一臺(tái)機(jī)器弄的慢死。
復(fù)制代碼
BIOS我們是找供貨商派技術(shù)人員一來設(shè),ILO的IP是DHCP自動(dòng)分配,但是是以MAC來分配的,我們直接把ILO做成了機(jī)房的第三個(gè)網(wǎng)絡(luò),方便遠(yuǎn)程管理。

  1. 好了系統(tǒng)裝好了,電源線和網(wǎng)線連接完,和瀑布一樣的。這時(shí)候還是盡量把他扎一下吧。
  2. 否則機(jī)器通風(fēng)不暢,會(huì)導(dǎo)致熱死。
復(fù)制代碼
上架邦線都是找民工干的,邦的不好看直接讓他們拆了重新邦

  1. 簡單辦法就是電源線扎一邊,網(wǎng)線扎一邊。有錢的公司可以買個(gè)網(wǎng)線序號(hào)標(biāo),沒錢就自己拿膠布標(biāo)。
復(fù)制代碼
從下往上15臺(tái),最下面的接交換機(jī)的確1口,2接2口,以此類推;服務(wù)器都做了bonding,第二個(gè)口接到相鄰的機(jī)柜的交換機(jī)上,從21口開始,所以,網(wǎng)線上沒有任何的標(biāo)簽,只要知道這個(gè)規(guī)律,就搞不錯(cuò)線的順序。

  1. 資產(chǎn)管理
復(fù)制代碼
以SN號(hào)為唯一識(shí)別碼,但有進(jìn)也碰到?jīng)]有SN號(hào)的情況,極少,一般是換了主板沒有把SN重新涮進(jìn)去,不過一般主機(jī)上都是SN號(hào)的標(biāo)簽,這個(gè)是錯(cuò)不了的。
資產(chǎn)編號(hào)也是打出來標(biāo)簽到貼上去,這樣SN+資產(chǎn)編號(hào),在數(shù)據(jù)庫中一查就知道是什么時(shí)間買的,哪批,合同號(hào),質(zhì)保時(shí)間等。

  1. 維修也一樣了,機(jī)器壞了,或者需要重裝系統(tǒng),按照上面的流程,一步步走一遍,就可以了。年底統(tǒng)計(jì)機(jī)房一天要干多少活,省的某些領(lǐng)導(dǎo)認(rèn)為機(jī)房人TMD都在閑著。機(jī)房的人呢?沒有流程不干活,否則白干。

  2. 在流程系統(tǒng)里重啟服務(wù)器,重啟服務(wù)器要是要流程,就太慢了,那么你可以做一個(gè)綠色通道,寫清楚原因,重啟哪個(gè)機(jī)器,直接提交給相關(guān)機(jī)房人員,在你的流程系統(tǒng)里綁定一個(gè)短信網(wǎng)關(guān),機(jī)房人員可以收到需要重啟服務(wù)器的短信。準(zhǔn)確無誤。

復(fù)制代碼
如果你的機(jī)房有一千臺(tái)HP服務(wù)器,他們就會(huì)派個(gè)專門的人員來響應(yīng),所以,我們一般周二去機(jī)房,在此之前一般會(huì)在上周五發(fā)郵件給HP,內(nèi)容一般是有多少臺(tái)什么樣的服務(wù)器,SN號(hào)是多少,都是什么樣的故障,需要帶多少什么樣的配件等等。
這一天都需要做什么工作,在周一的時(shí)候就要發(fā)給部門所有人員,讓大家補(bǔ)充,周一下午最終確定周二去機(jī)房都做什么,怎么分工等,所以流程真的很重要。

再說重啟,因?yàn)槲覀兊臋C(jī)房沒有人值班,我們是既當(dāng)IDC管理又當(dāng)SA,所以有死機(jī)重啟這樣的工作,直接用ILO的reboot.

  1. 升級(jí)你的服務(wù)器
復(fù)制代碼
一般服務(wù)器三年報(bào)廢,能用到三年頭上的很少,所以也就很少碰到有升級(jí)的事,不過測試部門用的服務(wù)器一般都是不太好的,到是給他們搞過不少的硬件更換。
至于配件的記錄情況,我們一般是每周一小盤,一月一大盤,每次購買的配件都記錄在案,每個(gè)配件的使用也都記錄在案,使用日期,用到哪臺(tái)機(jī)器上這些,不過配件管理這塊的確不太好管理。

  1. 要說的是,假如你一個(gè)機(jī)柜上放的機(jī)器比較多,比如4個(gè)6個(gè)機(jī)器一摞,恰巧壞了,恰巧一個(gè)人在機(jī)房,非得解決,怎么辦?
  2. 簡單,一個(gè)辦法,但是還是需要你有力氣,雖然有力學(xué)原理
  3. 比如有4臺(tái)服務(wù)器,最下面的壞了,
  4. 你可以拽住最下面的把4臺(tái)一起往出拉,拉出來一點(diǎn),把上面3臺(tái)往后推,這樣一點(diǎn)一點(diǎn)的拉出來
復(fù)制代碼
我倒。。。。。。。。
我告訴大家,一定要用導(dǎo)軌,不是一般的方便,直接抽拉,而且上下的服務(wù)器絕對(duì)不受影響

  1. 上面3臺(tái)一定要留出來一點(diǎn),否則放下的時(shí)候,機(jī)器和機(jī)柜托板會(huì)壓住你的手,你一松手,機(jī)器震一下,硬盤就掛了。。。
復(fù)制代碼
太經(jīng)典了,我也這樣做過。。。。。
作者: theAnswer    時(shí)間: 2010-02-24 11:42
感謝樓上。。。

不過話說。4年后看4年前的做事方法。真的很感嘆,很好玩兒。

雖然現(xiàn)在有跟過的解決辦法了,但是都是一步一步走來的。。。
作者: fuyic    時(shí)間: 2010-02-24 11:45
嘿嘿,樓上的,你知道不ILO1 在1.74版本之前有個(gè)BUG,輸域名經(jīng)常無法進(jìn)去得輸IP才能進(jìn),可以刷ILO firmware 升級(jí),但是這樣我刷掛過很多。。。。于是主板就廢了得換主板才能重新用。另外ILO2 把REMCONS 這個(gè)功能取消了,不能SSH ILO操作屏幕了,只能用VSP得在內(nèi)核重定向輸出到屏幕,簡直是退化!IPMI這個(gè)只能在系統(tǒng)下面用,系統(tǒng)掛了的時(shí)候還得靠ILO RAC IMM這種東西來搞。

    PXE其實(shí)裝多了也麻煩的,最近我就煩IBM3650的裝機(jī),WEB配RAID那叫一個(gè)慢,還好這幾天我研究會(huì)了命令行模式,不過IBM實(shí)在是慢。最省事的還是收集好內(nèi)網(wǎng)網(wǎng)口的MAC然后做分發(fā),一插網(wǎng)線就開始裝了,這才是最省事的。
   
    現(xiàn)在服務(wù)器生產(chǎn)廠商為啥前面版都不留點(diǎn)貼標(biāo)簽的位置呢,資產(chǎn)號(hào) IP 沒地方貼好麻煩。

    導(dǎo)軌是方便,可有的地方都是托盤的,所以最好還是放之前規(guī)劃好一個(gè)盤子放一個(gè)機(jī)器最多不超過倆,這樣之后就方便多了,放6個(gè)。。。。那就沒法搞了,也不是沒法搞,多去幾個(gè)人,上面抬著下面抽,累點(diǎn)。
作者: dgvri    時(shí)間: 2010-02-24 12:10
一般的IDC都是用的托盤,但是要是自建IDC就可以按自己的要求來,把托盤全拆掉,不過要是就幾臺(tái)服務(wù)器也沒必要用導(dǎo)軌了
作者: macaw_w    時(shí)間: 2010-03-22 23:35
樓主辛苦了,致敬一下
作者: uploading    時(shí)間: 2010-05-17 13:20
留名兒!
作者: yoohuu    時(shí)間: 2010-05-17 13:41
theanswer 贊一個(gè),我頂你
作者: 1984qht    時(shí)間: 2010-05-19 23:57
頂一個(gè),確實(shí)牛的很
作者: syl_0735    時(shí)間: 2010-05-26 21:32
前輩牛人啊,非常佩服




歡迎光臨 Chinaunix (http://72891.cn/) Powered by Discuz! X3.2