亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
樓主: mazu
打印 上一主題 下一主題

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇 [復(fù)制鏈接]

論壇徽章:
0
61 [報(bào)告]
發(fā)表于 2004-03-29 14:02 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

很好呀,加油。。。。

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
62 [報(bào)告]
發(fā)表于 2004-03-29 18:42 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

上周五,時(shí)光逆轉(zhuǎn),一下子回到了70年代,過著不能上網(wǎng)的日子,真是郁悶到了極點(diǎn)      
還好受苦受難的日子終于過去了,感謝佛祖,感謝上帝,感謝真主,感謝老天,感謝~~~~~~~~~~~

          

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
63 [報(bào)告]
發(fā)表于 2004-03-29 18:48 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

明天接著發(fā)。。。。。。。。。。。。。。。。。歡迎大家繼續(xù)支持

論壇徽章:
0
64 [報(bào)告]
發(fā)表于 2004-03-30 15:07 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

非常好,希望繼續(xù)下去。

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
65 [報(bào)告]
發(fā)表于 2004-03-31 09:17 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

[故事之十五]私自運(yùn)行Proxy發(fā)生沖突,服務(wù)器響應(yīng)速度“變慢”,網(wǎng)蟲太“勤快”

[癥狀]某市工商局信息中心今日向網(wǎng)絡(luò)醫(yī)院“報(bào)案”,報(bào)告其關(guān)鍵的企業(yè)數(shù)據(jù)服務(wù)器經(jīng)常出現(xiàn)“阻塞”,起因是分布在各地的各個(gè)業(yè)務(wù)受理局、所等的工作人員時(shí)常向信息中心抱怨在進(jìn)行企業(yè)數(shù)據(jù)調(diào)用、核查和進(jìn)行新企業(yè)登記操作時(shí)經(jīng)常遇到“梗阻”,速度變慢或業(yè)務(wù)出現(xiàn)暫時(shí)性的停頓的現(xiàn)象。由于故障現(xiàn)象不是持續(xù)存在,雖然檢查過多次,也殺過多次“毒”,更換速度更快的服務(wù)器后情況好轉(zhuǎn),但未從根本上能解決問題,始終沒有找到真正的“病根”所在。要求幫助查找“元兇”。
走進(jìn)該工商信息中心嶄新明亮的機(jī)房,可以看到正面的墻上有一幅巨大的網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)涫疽鈭D,上面非常清楚的標(biāo)明了各種網(wǎng)上設(shè)備和網(wǎng)絡(luò)設(shè)備的型號、名稱、位置、速度、鏈路類型和連接關(guān)系等等。初步感覺這樣的網(wǎng)絡(luò)器管理水平應(yīng)該是不錯(cuò)的。
但,經(jīng)過了解獲知,目前實(shí)際的網(wǎng)絡(luò)的結(jié)構(gòu)比較特殊,與拓?fù)鋱D上的結(jié)構(gòu)有較大區(qū)別:用于業(yè)務(wù)網(wǎng)的大部分機(jī)器還設(shè)在舊的信息中心機(jī)房中,只有企業(yè)數(shù)據(jù)服務(wù)器等關(guān)鍵設(shè)備安裝在新工商大廈的信息中心機(jī)房中,且同辦公網(wǎng)連通。新大廈和舊信息中心相距約2000米,中間通過光纜和路由器連接起來,并在辦公網(wǎng)側(cè)設(shè)置了防火墻。辦公網(wǎng)的多數(shù)用戶都可以通過WAN鏈路訪問internet國際互聯(lián)網(wǎng)。信息中心主任對此的解釋是:按工程規(guī)劃的要求,需要把原信息中心機(jī)房的全部設(shè)備和人員搬遷到新大廈的信息中心機(jī)房,但因發(fā)現(xiàn)新大廈存在建筑質(zhì)量問題,兩個(gè)月前只搬遷了少部分設(shè)備和絕大部分的人員。為了不影響業(yè)務(wù),在對設(shè)備采取臨時(shí)性的重新布局后即投入了運(yùn)行。工作狀況一直正常。多數(shù)業(yè)務(wù)設(shè)備還留在了舊機(jī)房中,由2名留守人員負(fù)責(zé)管理。大約一個(gè)月前開始出現(xiàn)故障征兆。
該信息中心負(fù)責(zé)下轄8個(gè)工商分局,76個(gè)工商所的網(wǎng)絡(luò)連接和業(yè)務(wù)保障工作。局和分局之間用幀中繼鏈路連接,工商所和分局之間用DDN、ISDN連接,少數(shù)用撥號方式連接。業(yè)務(wù)網(wǎng)與辦公網(wǎng)之間用防火墻隔離。業(yè)務(wù)網(wǎng)中的用戶除分局的少數(shù)用戶外按設(shè)計(jì)要求均不能上互聯(lián)網(wǎng)。
       
[診斷過程]從安裝在辦公網(wǎng)中的網(wǎng)管系統(tǒng)上觀察,企業(yè)數(shù)據(jù)服務(wù)器流量為28%,屬正常。就近從辦公網(wǎng)用網(wǎng)絡(luò)測試儀F683對服務(wù)器進(jìn)行連通性測試,損失率為0%。這說明至少在此時(shí)此刻服務(wù)器是工作狀態(tài)是不錯(cuò)的。用網(wǎng)絡(luò)助理(網(wǎng)絡(luò)一點(diǎn)通)對服務(wù)器發(fā)送10%的流量,觀察服務(wù)器的使用情況。從數(shù)據(jù)包交換對話矩陣中發(fā)現(xiàn),服務(wù)器對辦公網(wǎng)中的用戶均有響應(yīng),而對原業(yè)務(wù)網(wǎng)中的用戶則有少數(shù)幾個(gè)“不響應(yīng)”的記錄。由此可以推斷故障原因絕大多數(shù)可能還在原業(yè)務(wù)網(wǎng)中。
        將網(wǎng)絡(luò)測試儀移動(dòng)到信息中心舊樓中進(jìn)行測試,結(jié)果如下:網(wǎng)絡(luò)流量為45%(略高),碰撞率為3%,錯(cuò)誤率0%,廣播7%(略高)?傮w基本正常。進(jìn)而觀察網(wǎng)絡(luò)協(xié)議的分布狀態(tài),基本正常。查看數(shù)據(jù)包對話矩陣,則發(fā)現(xiàn)凡是對企業(yè)數(shù)據(jù)服務(wù)器的訪問數(shù)據(jù)包均有部分“不響應(yīng)”記錄。該記錄涉及面很廣,幾乎40%的工作站均有牽連。
為了驗(yàn)證是否是數(shù)據(jù)鏈路的問題,進(jìn)行了ICMP Ping和ICMP Monitor測試,前者報(bào)告有兩個(gè)MAC地址響應(yīng),后者則報(bào)告記錄到大量的目標(biāo)不可達(dá)、重定向、擁塞告警等數(shù)據(jù)幀。這說明網(wǎng)絡(luò)的數(shù)據(jù)鏈路中有重復(fù)的IP地址,而且網(wǎng)絡(luò)對數(shù)據(jù)幀的路由運(yùn)算也存在問題。啟動(dòng)網(wǎng)絡(luò)測試儀的網(wǎng)段自動(dòng)搜尋功能,自動(dòng)查詢網(wǎng)絡(luò)連接結(jié)構(gòu),結(jié)果發(fā)現(xiàn)有多余路由解析操作(Proxy),但沒有發(fā)現(xiàn)重復(fù)的IP地址(這說明重復(fù)的IP地址不在該網(wǎng)段,而存在于數(shù)據(jù)訪問通道中)。
因網(wǎng)管人員沒有MAC地址備份文檔,故建議將舊樓中的所有本地工作站關(guān)機(jī),此時(shí)網(wǎng)絡(luò)立即恢復(fù)正常。為確定與服務(wù)器重名的工作站,再分批打開所有工作站,結(jié)果發(fā)現(xiàn)留守人員的2臺(tái)機(jī)器中有1臺(tái)IP地址與企業(yè)數(shù)據(jù)服務(wù)器重名。進(jìn)一步檢查該工作站,還發(fā)現(xiàn)其私自安裝并運(yùn)行了Proxy代理,與網(wǎng)段搜索的結(jié)構(gòu)一致。
       
[診斷評點(diǎn)]故障原因有三。原因之一:是IP地址重復(fù),原因之二:是運(yùn)行非法路由代理。當(dāng)業(yè)務(wù)網(wǎng)用戶要求進(jìn)一步的地址解析分析時(shí),留守機(jī)與數(shù)據(jù)服務(wù)器發(fā)生沖突,多數(shù)的數(shù)據(jù)流向發(fā)生混亂(注意,此時(shí)的數(shù)據(jù)幀結(jié)構(gòu)仍正常),使用戶的訪問發(fā)生“梗阻”。應(yīng)用軟件則經(jīng)常要求重新聯(lián)絡(luò)和重傳數(shù)據(jù),導(dǎo)致流量偏高、業(yè)務(wù)流程速度變慢。由于沖突基本限制在原信息中心網(wǎng)絡(luò)中,所以企業(yè)數(shù)據(jù)服務(wù)器的流量顯示正常!網(wǎng)管系統(tǒng)也無錯(cuò)誤數(shù)據(jù)包報(bào)告!原因之三:對留守人員的管理出現(xiàn)真空。留守人員因“無聊”(員工自述)而渴望“越權(quán)”連接互聯(lián)網(wǎng),并由此開始迅速成為一名“白日網(wǎng)蟲”,進(jìn)而干擾正常業(yè)務(wù)流程。由于其操作并不一定持續(xù)存在,從而導(dǎo)致問題出現(xiàn)一個(gè)多月不能解決。其實(shí),辦公網(wǎng)中的互聯(lián)網(wǎng)用戶也會(huì)或多或少地受到影響,只不過因白天用戶的使用頻率低未曾察覺而已。
       
[診斷建議]網(wǎng)絡(luò)管理的漏洞大多數(shù)來自于內(nèi)部管理人員,建立嚴(yán)格的內(nèi)部管理機(jī)制是非常必要的。同時(shí),建議將MAC地址的備份列入必備文檔。另外,每日對網(wǎng)絡(luò)進(jìn)行狀態(tài)自動(dòng)搜尋會(huì)有助于很快發(fā)現(xiàn)并清除非法用戶。
健康的網(wǎng)絡(luò)維護(hù)方案中其實(shí)早就有關(guān)于定期測試(包括每日測試和每日循環(huán)測試)的項(xiàng)目,只要堅(jiān)持每日必要的測試和檢查,就可以保證99.9%的網(wǎng)絡(luò)不會(huì)有超過2天而解決不了的嚴(yán)重網(wǎng)絡(luò)問題存在。

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
66 [報(bào)告]
發(fā)表于 2004-03-31 09:22 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

[故事之十六]網(wǎng)線共用,升級100Mbps后干擾服務(wù)器
       
[癥狀]今天的“病人”是某移動(dòng)電話公司計(jì)費(fèi)中心。據(jù)該中心的網(wǎng)絡(luò)主管人員介紹,為了緩解移動(dòng)電話用戶解交電話費(fèi)難的問題,該中心三個(gè)月前投巨資對原計(jì)費(fèi)中心的網(wǎng)絡(luò)進(jìn)行了調(diào)整和升級。與四家被委托代收手機(jī)費(fèi)的銀行之間的網(wǎng)絡(luò)連接速度從標(biāo)準(zhǔn)的64Kbps速率DDN專線全部擴(kuò)展為E1(2.048Mbps)速率,計(jì)費(fèi)中心網(wǎng)絡(luò)從10Mbps以太網(wǎng)全部升級為以交換機(jī)為主的100Mbps以太網(wǎng)。升級前各委托收費(fèi)銀行經(jīng)常反映網(wǎng)絡(luò)連接時(shí)常莫名其妙地中斷,但一般能迅速恢復(fù),業(yè)務(wù)妨礙不算大。升級后網(wǎng)絡(luò)速度提高了很多,但其下轄的各營業(yè)網(wǎng)點(diǎn)(共計(jì)120個(gè))在為手機(jī)用戶辦理交費(fèi)收費(fèi)手續(xù)時(shí)計(jì)算機(jī)屏幕上常會(huì)提示“網(wǎng)絡(luò)遠(yuǎn)端故障,無法提供數(shù)據(jù)”或“數(shù)據(jù)傳輸不穩(wěn)定,請檢查網(wǎng)絡(luò)”,此時(shí)營業(yè)網(wǎng)點(diǎn)的收費(fèi)服務(wù)會(huì)暫停,用戶意見很大。有時(shí)雖然還能提供服務(wù),不過數(shù)據(jù)處理速度明顯變慢,最差的時(shí)候處理一筆業(yè)務(wù)查詢竟然需要反反覆覆操作5、6分鐘(正常時(shí)一般在10秒鐘以內(nèi))。比網(wǎng)絡(luò)設(shè)備升級前反而要慢得多。此故障每星期都要出現(xiàn)1到2次,每次從1小時(shí)到2小時(shí)不等。
由于一直沒有查明升級前網(wǎng)絡(luò)時(shí)常中斷的真正故障原因,網(wǎng)絡(luò)管理人員在做此次網(wǎng)絡(luò)升級規(guī)劃時(shí)曾心存僥幸地寄希望于通過設(shè)備升級來徹底排除這些遺留網(wǎng)絡(luò)故障。遺憾的是,他們的運(yùn)氣實(shí)在太差,非但老問題沒有解決,反而惹出了更大的新問題。遂向網(wǎng)絡(luò)醫(yī)院“掛號”求診。
       
[診斷過程]由于銀行網(wǎng)和電信計(jì)費(fèi)網(wǎng)不在同一個(gè)地方,出了“網(wǎng)絡(luò)醫(yī)院”我們需要決定先去哪里?從上述的故障現(xiàn)象初步分析,銀行絡(luò)網(wǎng)和移動(dòng)通信公司計(jì)費(fèi)中心網(wǎng)絡(luò)以及其連接的鏈路都有可能存在問題。計(jì)費(fèi)中心的網(wǎng)絡(luò)設(shè)備和路由設(shè)備大部分在此次升級時(shí)都更換過,升級后故障依舊存在且表現(xiàn)更嚴(yán)重,基本可以排除新入網(wǎng)設(shè)備存在嚴(yán)重問題的可能性。網(wǎng)絡(luò)測試可以從銀行網(wǎng)絡(luò)和計(jì)費(fèi)網(wǎng)絡(luò)同時(shí)著手。途中從銀行各營業(yè)廳網(wǎng)絡(luò)使用者處了解到,手機(jī)收費(fèi)出現(xiàn)“麻煩”時(shí)銀行的其它業(yè)務(wù)流程均保持正常,并不受此影響(此時(shí)電信計(jì)費(fèi)中心網(wǎng)絡(luò)的用戶也沒有反映網(wǎng)絡(luò)異常)。這說明銀行網(wǎng)絡(luò)存在問題的可能性要比計(jì)費(fèi)網(wǎng)絡(luò)及其連接鏈路存在問題的可能性低。而問題出現(xiàn)在手機(jī)計(jì)費(fèi)網(wǎng)絡(luò)和與銀行網(wǎng)絡(luò)的路由設(shè)備范圍內(nèi)的可能性比較大,故我們決定先前往設(shè)在移動(dòng)通信公司機(jī)房的手機(jī)計(jì)費(fèi)網(wǎng)絡(luò)進(jìn)行檢查測試,首先檢查計(jì)費(fèi)網(wǎng)絡(luò)及其連接鏈路。
        第一次網(wǎng)絡(luò)測試是在網(wǎng)絡(luò)沒有出現(xiàn)故障時(shí)進(jìn)行的,結(jié)果顯示各項(xiàng)測試指標(biāo)都顯示網(wǎng)絡(luò)工作完全正常。將F683網(wǎng)絡(luò)測試儀接入計(jì)費(fèi)網(wǎng)絡(luò)的交換路由器,監(jiān)測網(wǎng)絡(luò)的工作狀況,顯示路由器利用率為1%(相當(dāng)于E1鏈路中有20Kbps左右的業(yè)務(wù)流量),錯(cuò)誤統(tǒng)計(jì)為0%,與網(wǎng)管系統(tǒng)觀察的數(shù)據(jù)完全一致,將F683網(wǎng)絡(luò)測試儀改為與計(jì)費(fèi)服務(wù)器并聯(lián)的方式監(jiān)測,測試結(jié)果相同,這表明此時(shí)網(wǎng)絡(luò)工作很正常。在與計(jì)費(fèi)網(wǎng)絡(luò)所在地的局域網(wǎng)使用和維護(hù)人員交談中了解到,網(wǎng)絡(luò)工作人員從來沒有感覺到他們的LAN有異常情況,雖然他們也知道手機(jī)用戶在經(jīng)常抱怨,但從計(jì)費(fèi)LAN處檢查不出什么實(shí)質(zhì)問題,計(jì)費(fèi)服務(wù)器表現(xiàn)也正常。故障出現(xiàn)時(shí)從網(wǎng)管系統(tǒng)上觀察,路由器、交換機(jī)、計(jì)費(fèi)服務(wù)器都沒有問題。用OneTouch網(wǎng)絡(luò)助理(即網(wǎng)絡(luò)故障一點(diǎn)通)仿真用戶流量對銀行的路由器、銀行網(wǎng)業(yè)務(wù)轉(zhuǎn)接服務(wù)器(以上測試在銀行進(jìn)行)、移動(dòng)通信公司的計(jì)費(fèi)網(wǎng)絡(luò)與銀行網(wǎng)絡(luò)的連接路由器、網(wǎng)絡(luò)通道上的交換機(jī)、計(jì)費(fèi)服務(wù)器等進(jìn)行2分鐘80%持續(xù)流量沖擊測試(上述測試在計(jì)費(fèi)中心),用F683網(wǎng)絡(luò)測試儀監(jiān)測移動(dòng)監(jiān)測各關(guān)鍵設(shè)備,結(jié)果基本相同,利用率為均80%,無錯(cuò)誤出現(xiàn),除了計(jì)費(fèi)服務(wù)器處的碰撞率2%外,其它各處均為0%;ICMP Ping測試均在3ms以內(nèi),ICMP監(jiān)測測試無擁塞、數(shù)據(jù)不可達(dá)、重定向、數(shù)據(jù)參數(shù)錯(cuò)誤等顯示,這說明,網(wǎng)絡(luò)的通道測試結(jié)果是比較好的。
        在這種情況下,一般可以采用兩種測試方法繼續(xù)檢查故障,一種是被動(dòng)監(jiān)測法,即將網(wǎng)絡(luò)測試儀、流量分析儀、網(wǎng)管等監(jiān)測設(shè)備啟動(dòng),對網(wǎng)絡(luò)實(shí)施不間斷監(jiān)測,等待問題的重新出現(xiàn);另一種是主動(dòng)測試法,即將所有涉及到的網(wǎng)絡(luò)設(shè)備和終端設(shè)備及其業(yè)務(wù)均啟動(dòng)或進(jìn)行人為地仿真模擬,然后監(jiān)測網(wǎng)絡(luò)的工作狀態(tài),進(jìn)行故障定位。為了盡快定位故障,經(jīng)與計(jì)費(fèi)網(wǎng)、銀行網(wǎng)網(wǎng)絡(luò)管理人員商定,我們決定采用第二種方法進(jìn)行監(jiān)測和測試(注意,此測試方案需要?jiǎng)佑煤芏嗟娜肆臀锪?,即將所有有關(guān)的網(wǎng)絡(luò)設(shè)備網(wǎng)絡(luò)終端設(shè)備啟動(dòng),并安排人員進(jìn)行業(yè)務(wù)流程模擬操作。
        第二次測試在當(dāng)天業(yè)務(wù)結(jié)束后進(jìn)行。在啟動(dòng)所有網(wǎng)絡(luò)設(shè)備5分鐘后,預(yù)期的故障現(xiàn)象果然出現(xiàn)。從網(wǎng)管系統(tǒng)上觀察,計(jì)費(fèi)網(wǎng)和銀行網(wǎng)的連接路由器流量上升為3%,交換機(jī)流量增加1倍,計(jì)費(fèi)服務(wù)器流量減少70%,網(wǎng)絡(luò)沒有發(fā)現(xiàn)異常情況。用F683網(wǎng)絡(luò)測試儀對整個(gè)計(jì)費(fèi)通道的有關(guān)鏈路和設(shè)備進(jìn)行移動(dòng)監(jiān)測,結(jié)果顯示:路由器和交換機(jī)的數(shù)據(jù)與網(wǎng)管系統(tǒng)的觀察結(jié)果一致,而計(jì)費(fèi)服務(wù)器的流量為68%,正常數(shù)據(jù)7%,錯(cuò)誤數(shù)據(jù)61%(幻象干擾Ghosts、FCS錯(cuò)誤碎幀等)。很顯然,計(jì)費(fèi)服務(wù)器與交換機(jī)之間的這條鏈路很可能有問題。
        暫停業(yè)務(wù),從計(jì)費(fèi)服務(wù)器網(wǎng)卡上拔下電纜插頭進(jìn)行電纜測試,結(jié)果顯示只有1-2和3-6兩對電纜,4-5和7-8線對沒有連接。網(wǎng)管人員解釋,升級后除了新增加的布線外,電纜系統(tǒng)多數(shù)沒有變動(dòng),只有少數(shù)鏈路進(jìn)行了調(diào)整。進(jìn)一步檢查發(fā)現(xiàn)4-5和7-8線對連接到了另一臺(tái)備份服務(wù)器上,該服務(wù)器用于每周兩次人工對各種關(guān)鍵數(shù)據(jù)進(jìn)行審查、備份并上報(bào)局有關(guān)單位;謴(fù)業(yè)務(wù),啟動(dòng)備份服務(wù)器進(jìn)行數(shù)據(jù)備份和傳輸,結(jié)果故障現(xiàn)象出現(xiàn)。
        將備份服務(wù)器臨時(shí)用一條新鏈路單獨(dú)連接,故障徹底消失。對換下的電纜進(jìn)行測試,近端串?dāng)_NEXT不合格(超差-2dB,綜合近端串?dāng)_PSNEXT-8dB)
       
[診斷評點(diǎn)]網(wǎng)絡(luò)電纜內(nèi)含4對(8根)細(xì)電纜線,一般的10Base-T和100Base-Tx網(wǎng)絡(luò)只使用其中的1-2和3-6線對,4-5和7-8線對不用,在10Base-T網(wǎng)絡(luò)中曾流行將4-5或7-8線對用來傳輸電話,或者用4-5和7-8線對用來連接另一臺(tái)電腦。在100Base-Tx以太網(wǎng)中,由于網(wǎng)絡(luò)工作頻率和數(shù)據(jù)率很高,串?dāng)_量很大,故這類用法是不被允許的。計(jì)費(fèi)網(wǎng)絡(luò)升級前有部分站點(diǎn)用一條電纜連接兩臺(tái)計(jì)算機(jī),升級后這部分電纜沒有變動(dòng),由于離新增加的交換機(jī)比較近,故將備份服務(wù)器接入了并用電纜。備份服務(wù)器平時(shí)雖然基本不用,但連接脈沖仍然會(huì)對計(jì)費(fèi)服務(wù)器造成干擾,只是干擾量很少而已,這就是我們在交換機(jī)鏈路中觀察到2%碰撞率記錄的產(chǎn)生原因。由于該電纜的綜合近端串?dāng)_PSNEXT不合格,數(shù)據(jù)備份服務(wù)器在工作時(shí)對計(jì)費(fèi)服務(wù)器會(huì)產(chǎn)生很大干擾,破壞傳輸數(shù)據(jù),使得同一個(gè)數(shù)據(jù)包不得不多次重傳和多次重新處理,真實(shí)流量急劇上升到68%,重處理流量由0%上升到6.98%。由于服務(wù)器使用的是價(jià)格便宜的工作組交換機(jī),所以網(wǎng)管系統(tǒng)無法從交換機(jī)端口發(fā)現(xiàn)鏈路中存在的嚴(yán)重問題。
升級前業(yè)務(wù)偶然有中斷的現(xiàn)象,這也是由于并用線纜串?dāng)_造成的,由于當(dāng)時(shí)是10Base-T網(wǎng)絡(luò),速度低,所以這種影響比較小,往往只是偶爾且是瞬間的影響。
       
[診斷建議]在10Base-T以太網(wǎng)中存在著大量的非標(biāo)準(zhǔn)化布線以及大量不合格的布線鏈路,由于10Base-T網(wǎng)絡(luò)工作速度低,這些嚴(yán)重質(zhì)量問題往往被掩蓋起來。直到升級到100Base-Tx以太網(wǎng)后這些問題才會(huì)明顯地暴露出來。10Base-T網(wǎng)絡(luò)布線系統(tǒng)中表現(xiàn)不明顯的問題同時(shí)也給集成商、工程商和廣大用戶造成一種錯(cuò)覺,認(rèn)為布線系統(tǒng)只要是物理上聯(lián)通的就不會(huì)有問題,從而忽視了影響鏈路質(zhì)量的布線產(chǎn)品品質(zhì)問題、施工工藝問題對網(wǎng)絡(luò)造成的嚴(yán)重影響。
        建議網(wǎng)絡(luò)設(shè)計(jì)者首先采用標(biāo)準(zhǔn)化的設(shè)計(jì)方案,且只有工程商和用戶在簽訂建造網(wǎng)絡(luò)的合同時(shí)選用標(biāo)準(zhǔn)化的施工工藝和標(biāo)準(zhǔn)化的現(xiàn)場認(rèn)證測試方案,才能初步保證綜合布線系統(tǒng)的質(zhì)量。
        《網(wǎng)絡(luò)測試和維護(hù)方案》中一般建議每年(必要時(shí)每半年)對布線系統(tǒng)輪測一遍,以保證布線系統(tǒng)的性能合格,排除因布局變動(dòng)、用戶數(shù)量增刪和人為調(diào)整等原因?qū)Σ季系統(tǒng)造成的損害。另外,網(wǎng)絡(luò)的業(yè)務(wù)工作和故障情況要有比較準(zhǔn)確完整的記錄,這樣才能有助于故障的查找。如果“病人”對自己網(wǎng)絡(luò)的業(yè)務(wù)流程比較熟悉,則可以避免動(dòng)用眾多人員加班配合排除故障。

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
67 [報(bào)告]
發(fā)表于 2004-03-31 09:33 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

[故事之十七]供電質(zhì)量差,路由器工作不穩(wěn)定,造成路由漂移和備份路由器擁塞
       
[癥狀]今天的“病人”是位居某中心城市的一家大區(qū)銀行,報(bào)告的故障現(xiàn)象是:故障時(shí)斷時(shí)續(xù),呈周期性“發(fā)作”,每隔10分鐘左右在其轄區(qū)內(nèi)就有部分支行或分行打來電話報(bào)告業(yè)務(wù)流程出現(xiàn)問題。具體表現(xiàn)都很一致:先出現(xiàn)業(yè)務(wù)中斷,1分鐘后連接恢復(fù),但速度非常慢。此故障已經(jīng)持續(xù)了2天,網(wǎng)管人員懷疑是路由器故障,曾試著分別更換了備用的同城結(jié)算路由器和主路由器,無效。
       
[診斷過程]我們驅(qū)車來到“病人”的計(jì)算中心,首先向網(wǎng)絡(luò)管理人員了解故障情況;旧吓c網(wǎng)絡(luò)醫(yī)院“接診”記錄報(bào)告的內(nèi)容相同。從表現(xiàn)的故障現(xiàn)象來看,根據(jù)以往的經(jīng)驗(yàn),基本上可以初步推斷是路由鏈路的問題。網(wǎng)管人員確認(rèn),業(yè)務(wù)中斷時(shí),普通Ping測試不通,此現(xiàn)象以前也出現(xiàn)過幾次,很快就恢復(fù)了。因此也沒有引起注意。
        從記錄的故障報(bào)告(電話登記)看,無論是本城轄區(qū)還是大區(qū)內(nèi)的遠(yuǎn)程網(wǎng)絡(luò)都報(bào)告過路由中斷現(xiàn)象。由于故障每隔10分鐘左右就會(huì)周期性地出現(xiàn),雖然比較頻繁,卻為故障診斷提供了很大方便?梢钥紤]選擇任意路由進(jìn)行連續(xù)的Ping測試,監(jiān)測其連接狀況與故障發(fā)生時(shí)刻的關(guān)系。為此我們將F683網(wǎng)絡(luò)測試儀接入計(jì)算中心網(wǎng)絡(luò)進(jìn)行監(jiān)測。選擇曾報(bào)告過故障的其下轄的某郊縣路由器作連續(xù)的ICMP Ping測試,響應(yīng)時(shí)間為9ms,質(zhì)量尚可。3分鐘后,有用戶報(bào)告故障出現(xiàn),不過網(wǎng)絡(luò)測試儀顯示正常,說明我們監(jiān)測的路由鏈路可能是正常的。立即改變監(jiān)測方向,向報(bào)告遇到故障的用戶的路由器做ICMP Monitor,結(jié)果大量的目標(biāo)不可達(dá)記錄出現(xiàn),并出現(xiàn)源限制、回應(yīng)請求和回應(yīng)響應(yīng)幀。20秒鐘后,出現(xiàn)大量重定向幀記錄,目標(biāo)不可達(dá)幀記錄速度減緩,源限制、回應(yīng)請求和回應(yīng)響應(yīng)則開始大量出現(xiàn)。
        以上記錄表明,路由器的動(dòng)態(tài)路由表在故障出現(xiàn)時(shí)發(fā)生了很大變化。網(wǎng)絡(luò)原來的路由中斷后,繼之被重定向路由取代。打開靜態(tài)路由表,為了與動(dòng)態(tài)路由作比較,我們啟動(dòng)F683分段路由追蹤功能,追蹤從測試儀到先前報(bào)告故障的遠(yuǎn)程路由器?梢钥吹,路由在本城出口的下一站,即大區(qū)鏈接的第一個(gè)路由就發(fā)生了中斷。動(dòng)態(tài)路由已經(jīng)由備份路由取代。狀態(tài):擁塞。
        原路由為主路由,通道速率為E1,為ATM鏈路,備份路由為DDN基本速率鏈接,速度僅為64Kbps。打開主路由器的Mib庫,觀測到主路由器的流量為0.02%,錯(cuò)誤為2%;表明它處于輕負(fù)荷狀態(tài),并有少量錯(cuò)誤流量。觀察備份路由器的Mib庫,流量為100%,說明它處于超負(fù)荷運(yùn)行狀態(tài)。
        由于故障為周期故障,為了觀測它的發(fā)生規(guī)律,我們在征得“病人”同意的前提下,決定不急于尋找主路由器中斷和擁塞的原因,而是先觀測在一個(gè)周期里故障變化的全過程并記錄之。我們用第二臺(tái)網(wǎng)絡(luò)測試儀和網(wǎng)絡(luò)故障一點(diǎn)通接入網(wǎng)絡(luò),分別觀察主路由器、備份路由器、主服務(wù)器的工作流量和錯(cuò)誤,并對主路由器作連續(xù)的ICMP 監(jiān)測。約8分鐘后,主路由器流量開始迅速上升,備份路由器出現(xiàn)重定向指示,約15秒后報(bào)告?zhèn)浞萋酚善魍瞥鰞?yōu)化路由,動(dòng)態(tài)路由表恢復(fù)到與靜態(tài)路由相同的設(shè)置。網(wǎng)絡(luò)完全恢復(fù)正常。
        分析故障關(guān)系,可以斷定故障的最大關(guān)聯(lián)設(shè)備是主路由器。由于用戶在機(jī)架上已經(jīng)安裝了冷備份的主路由器,我們先將冷備份路由器替換到主路由器的位置。5分鐘后路由器更換完畢,開機(jī)接入網(wǎng)絡(luò),3分鐘后網(wǎng)絡(luò)恢復(fù)正常。但只持續(xù)了2分鐘,故障現(xiàn)象又重新出現(xiàn)?磥恚仨殞χ髀酚善髯鲈敿(xì)監(jiān)測才能發(fā)現(xiàn)真正的故障所在。
網(wǎng)絡(luò)建構(gòu)拓?fù)涫,主路由器與三個(gè)外區(qū)遠(yuǎn)程路由器和一個(gè)本地路由器相連,我們可以同時(shí)監(jiān)測這幾個(gè)路由器的工作狀況。監(jiān)測結(jié)果如下:故障出現(xiàn)時(shí),外區(qū)主路由器和本城路由器的路由表隨著故障的出現(xiàn)也發(fā)生變化,而此時(shí)同城結(jié)算業(yè)務(wù)不受影響。受影響的業(yè)務(wù)方向是外地與本城、本城與外地、外地經(jīng)本地跨區(qū)等。用Fluke的ATM測試儀測試遠(yuǎn)程ATM路由通道,將遠(yuǎn)端ATM交換機(jī)Loopback(環(huán)回)以后監(jiān)測三個(gè)方向的通道情況,顯示完全正常。再對與主路由器相關(guān)的連接電纜進(jìn)行測試,全部合格。這表明主路由器的工作環(huán)境是基本正常的。此時(shí)我們需要了解主路由器鏈路中的“垃圾流量”的分布。但由于網(wǎng)絡(luò)醫(yī)院的流量分析儀出借給了別的“病人”,所以我們暫時(shí)不能觀察主路由器的詳細(xì)流量狀況。實(shí)際上,我們這是也只需要檢查主路由器的接地質(zhì)量和供電環(huán)境即可(因?yàn)橐呀?jīng)試驗(yàn)更換過主路由器),這兩個(gè)因素當(dāng)中的任何一個(gè)不負(fù)荷要求,都有可能引發(fā)主路由器中斷的故障。
首先觀測為主路由器供電的UPS電源。當(dāng)故障發(fā)生時(shí)UPS顯示過載,而輸出回路卻顯示輕負(fù)荷。用F43電力質(zhì)量分析儀觀察也顯示故障時(shí)輸入諧波超差6倍。輸出回路超差400倍,故障恢復(fù)后,過載指示也隨之消失,但輸出回路仍超差80倍。證明UPS電源低效。
        將主路由器的供電電源接到另一臺(tái)UPS電源上,故障徹底消失。故障原因?yàn)楣╇娰|(zhì)量不合格。我們注意到,該計(jì)算中心所在的大樓正在裝修,網(wǎng)管人員說等大樓裝修完畢后還要將網(wǎng)絡(luò)設(shè)備擴(kuò)容。初步干擾源很可能就來自與裝修有關(guān)的部分。由于故障的周期性,經(jīng)過仔細(xì)觀察發(fā)現(xiàn),故障出現(xiàn)的周期與樓旁塔吊的上下周期一致!為準(zhǔn)確判定諧波干擾的源地點(diǎn),我們將F43電力質(zhì)量分析儀接入供電網(wǎng)絡(luò)進(jìn)行核實(shí),結(jié)果發(fā)現(xiàn),每當(dāng)塔吊上升時(shí),故障現(xiàn)象就出現(xiàn)(下降時(shí)諧波為上升時(shí)的三分之一,網(wǎng)絡(luò)有少許變慢)。
       
[診斷評點(diǎn)]為主路由器供電的UPS電源由于失效,對外界電力干擾諧波的過濾能力下降,當(dāng)為重負(fù)載的用電設(shè)備供電時(shí),此諧波會(huì)引發(fā)許多設(shè)備出錯(cuò)。如果此時(shí)恰逢UPS電源濾波失效,則相關(guān)設(shè)備會(huì)受到干擾。本故障中,主路由器由于大量干擾進(jìn)入,使得鏈路阻塞,路由器連接中斷,路由變更指令使得各業(yè)務(wù)流量流向備份路由器,備份路由器的路由通道能力又不能滿足,致使網(wǎng)絡(luò)出現(xiàn)擁塞。這就是本次故障先中斷后恢復(fù)然后阻賽的原因。同城結(jié)算數(shù)據(jù)由于多數(shù)不經(jīng)過主路由器,所以未受到影響。
        塔吊下降時(shí),雖然引入的干擾也不少,不過因?yàn)槠涓蓴_的絕對值未超過主路由器的承受范圍,所以主路由器還能應(yīng)付。大樓裝修以前也出現(xiàn)過類似的故障,因干擾源很快消失并不再持續(xù)存在,因此不可能引起維護(hù)人員的注意。
       
[診斷建議]與電纜和光纜系統(tǒng)一樣,電力諧波和UPS電源也是列入定期檢查的內(nèi)容,一般建議作半年定期檢查,關(guān)鍵的網(wǎng)絡(luò)建議作為周定期檢查的項(xiàng)目。諧波干擾是經(jīng)常存在的環(huán)境因素,如果此時(shí)UPS電源不出問題,一般不會(huì)影響網(wǎng)絡(luò)的正常運(yùn)行,但諧波干擾是嚴(yán)重影響網(wǎng)絡(luò)性能的原因之一,一旦竄入網(wǎng)絡(luò)則引起的故障多數(shù)都是“致癱性”或致命性的。還由于多數(shù)用戶對干擾類型的故障“相當(dāng)?shù)亍辈皇煜ぃ侍嵴埓蠹乙疠^多關(guān)注。

論壇徽章:
0
68 [報(bào)告]
發(fā)表于 2004-03-31 22:11 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

繼續(xù)努力 多出精品

論壇徽章:
0
69 [報(bào)告]
發(fā)表于 2004-04-01 14:57 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

好東西,值得期待

論壇徽章:
1
榮譽(yù)版主
日期:2011-11-23 16:44:17
70 [報(bào)告]
發(fā)表于 2004-04-04 10:05 |只看該作者

【吐血推薦】網(wǎng)絡(luò)醫(yī)院的故事----連載(ZT)轉(zhuǎn)載結(jié)束,共35篇

[故事之十八]中心DNS服務(wù)器主板“失!,占用帶寬資源并攻擊其它子網(wǎng)的服務(wù)器
        [癥狀]有“病人”來電報(bào)告網(wǎng)絡(luò)的一個(gè)子網(wǎng)突然變慢,中心主網(wǎng)絡(luò)則基本正常。以下是“病人”的主述“癥狀”:“病人”是某市電信多媒體網(wǎng)絡(luò)服務(wù)公司(163、169),該市為地級市,為本市及市轄縣的普通用戶提供本地?zé)峋網(wǎng)站服務(wù)和Internet接入服務(wù)。昨天,先是其服務(wù)的用戶反映網(wǎng)絡(luò)速度很慢,Email需要等待超過60秒以上的時(shí)間才能聯(lián)通,隨即其市營業(yè)廳(即子網(wǎng)所在地)報(bào)告速度突然變慢,影響業(yè)務(wù)!安∪恕痹谥鳈C(jī)房安裝有網(wǎng)管系統(tǒng),網(wǎng)管人員從網(wǎng)管系統(tǒng)上觀察發(fā)現(xiàn)除了營業(yè)廳子網(wǎng)路由器流量很高以外(測試為97%),中心網(wǎng)絡(luò)的路由器與其它子網(wǎng)的交互流量均為40%以下。沒有其它特別現(xiàn)象,應(yīng)該說網(wǎng)絡(luò)速度不會(huì)受影響。由于維護(hù)人員沒有配備其它網(wǎng)絡(luò)測試工具,又不能在白天斷開網(wǎng)絡(luò)停止用戶服務(wù)來進(jìn)行檢查。經(jīng)人介紹遂請網(wǎng)絡(luò)醫(yī)院派員幫助檢查。
       
[診斷過程]這個(gè)故障表現(xiàn)比較簡單,檢查的時(shí)候只要查出子網(wǎng)的路由通道流量來源就可以很快確定故障方向,進(jìn)一步則立即可以查出流量源。由于用戶沒有配備分析網(wǎng)絡(luò)流量的工具,我們估計(jì)故障在子網(wǎng)的可能性較大,所以直接驅(qū)車駛向子網(wǎng)所在地,即電信營業(yè)廳。從總網(wǎng)絡(luò)拓?fù)鋱D上看,營業(yè)廳子網(wǎng)與中心網(wǎng)絡(luò)的鏈路為E1,是營業(yè)廳網(wǎng)絡(luò)的業(yè)務(wù)通道。由于該通道一般只用于傳輸一些業(yè)務(wù)數(shù)據(jù),其子網(wǎng)的網(wǎng)站數(shù)量只有45臺(tái),所以斷定網(wǎng)管報(bào)告97%的流量肯定是過高了。有一種情況可以比較多地占用E1通道的有效流量,那就是營業(yè)廳子網(wǎng)內(nèi)有站點(diǎn)與中心網(wǎng)絡(luò)的站點(diǎn)或服務(wù)器之間存在多媒體動(dòng)態(tài)圖象傳輸應(yīng)用,比如VOD等。這種情況在不少地方時(shí)有發(fā)生,但它要求必須有動(dòng)態(tài)圖象源才可以實(shí)施“點(diǎn)播”,而中心網(wǎng)絡(luò)的所有服務(wù)器目前不提供這種寬帶視頻服務(wù)(當(dāng)然,我們不排除存在系統(tǒng)管理員私自安裝的可能性)。
        營業(yè)廳網(wǎng)絡(luò)由于規(guī)模小,中心網(wǎng)絡(luò)的網(wǎng)管系統(tǒng)只支持到路由器一級的管理。營業(yè)廳子網(wǎng)的交換機(jī)和服務(wù)器等采用的是廉價(jià)的桌面交換機(jī),所以無法支持網(wǎng)絡(luò)管理。我們將網(wǎng)絡(luò)測試儀F683接入交換機(jī)進(jìn)行測試,啟動(dòng)便攜網(wǎng)管功能,可以看到路由器的流量和網(wǎng)管系統(tǒng)觀測的到的流量是相同的,均為97%左右。查看中心網(wǎng)絡(luò)與此相連的路由器通道流量,也是97%左右。這說明路由器通道鏈路性能基本正常,不過這樣高的通道流量極易導(dǎo)致路由器擁塞和丟包,所以從正常流量的角度看97%的流量又是不正常的,F(xiàn)在需要弄清的是,如此高的路由流量是從哪里來的?數(shù)據(jù)包到達(dá)路由器以后的去向等。這樣就可以很快定位導(dǎo)致如此之高的通道流量的數(shù)據(jù)源和擁塞源。將Fluke的流量分析儀F695接入子網(wǎng)絡(luò)的路由器通道進(jìn)行監(jiān)測和分析,結(jié)果顯示95%流量流向了業(yè)務(wù)數(shù)據(jù)服務(wù)器,且多數(shù)為HTTP和Email方面應(yīng)用(流量分析儀專門分析包括應(yīng)用層在內(nèi)的網(wǎng)絡(luò)上層協(xié)議的應(yīng)用流量及分布)。其中,Internet訪問流量占通道流量的88%,本地流量占7%。查看流量分析儀指示的流量來源分布圖,沒有發(fā)現(xiàn)集中的流量應(yīng)用,IP地址分布比較均衡,最高的流量只占0.5%。這些數(shù)據(jù)表明,用戶的應(yīng)用比例均勻,故障原因應(yīng)該在應(yīng)用過程中而不是某個(gè)集中的用戶“轟擊”,比如黑客等。也就是說,應(yīng)用的過程和數(shù)據(jù)通道路徑出了問題。這是因?yàn),這些流量按通道設(shè)計(jì)不應(yīng)該到達(dá)營業(yè)廳網(wǎng)絡(luò)的業(yè)務(wù)服務(wù)器。而是應(yīng)該直接從中心網(wǎng)絡(luò)的Internet主路由器進(jìn)入互聯(lián)網(wǎng)。
那么,這些流量是如何被引導(dǎo)到營業(yè)廳服務(wù)器方向上來的呢?我們知道,IP數(shù)據(jù)包在傳輸過程中會(huì)在路由器中作地址解析(ARP),或是在本地DNS中進(jìn)行域名分析。如果這些分析路徑出問題,則IP數(shù)據(jù)包的傳輸和交換就會(huì)出問題。根據(jù)流量分析儀的指示,我們?nèi)我膺x擇了10個(gè)IP地址做路由追蹤測試,用Fluke的F683網(wǎng)絡(luò)測試儀追蹤的結(jié)果是,他們都要經(jīng)過一個(gè)DNS服務(wù)器。而模仿營業(yè)廳網(wǎng)絡(luò)成員分別對已知的本地和外地用戶做ICMP監(jiān)測和路由追蹤測試,結(jié)果發(fā)現(xiàn),ICMP監(jiān)測中“重定向”數(shù)據(jù)包Redirect占82%,“目標(biāo)不可達(dá)”數(shù)據(jù)包Destination Unreachable 數(shù)量占13%。這表明,只有約2%的用戶能一次性出入正常路由到達(dá)目標(biāo)站點(diǎn),其余95%的IP數(shù)據(jù)包都要經(jīng)過路由競爭或重新發(fā)送才能有部分機(jī)會(huì)到達(dá)目的地。由此,可以重點(diǎn)檢查主路由器的路由表和DNS的轉(zhuǎn)換表。由于多數(shù)Internet訪問流量被引導(dǎo)到了營業(yè)廳業(yè)務(wù)服務(wù)器,故重點(diǎn)檢查DNS服務(wù)器。用F683網(wǎng)絡(luò)測試儀對DNS服務(wù)器做查詢,觀察查詢結(jié)果,發(fā)現(xiàn)DNS轉(zhuǎn)換表有相當(dāng)大的比例指向了營業(yè)廳子網(wǎng)中的業(yè)務(wù)服務(wù)器。懷疑是DNS服務(wù)器出了問題。我們隨機(jī)通知中心網(wǎng)絡(luò)的網(wǎng)管人員將DNS服務(wù)器重新啟動(dòng)并快速設(shè)置一次,稍后網(wǎng)絡(luò)管理人員報(bào)告網(wǎng)絡(luò)業(yè)務(wù)恢復(fù)正常。用F683網(wǎng)絡(luò)測試儀的Internet工具包查詢DNS服務(wù)器,可以看到指向營業(yè)廳業(yè)務(wù)服務(wù)器的數(shù)據(jù)已經(jīng)全部消失。這表明網(wǎng)絡(luò)已經(jīng)完全恢復(fù)了正常工作。但好景不長,約3分鐘后,故障重新出現(xiàn),仍有97%的通道流量被引導(dǎo)指向了營業(yè)廳子網(wǎng)。由于DNS服務(wù)器只設(shè)置了一臺(tái),沒有備份或備用服務(wù)器。我們不得不立即來到中心網(wǎng)絡(luò)機(jī)房,對DNS服務(wù)器及其周圍設(shè)備進(jìn)行檢查。測試服務(wù)器網(wǎng)卡和與交換機(jī)相連的電纜,正常。為了不中斷服務(wù),我們請網(wǎng)管人員在另一臺(tái)備用服務(wù)器上臨時(shí)安裝設(shè)置了DNS服務(wù)器。經(jīng)過短暫的業(yè)務(wù)中斷后,更換上的新DNS服務(wù)器開始投入適用。只見子網(wǎng)路由器的通道流量立刻降低到了1.5%。經(jīng)過30分鐘的穩(wěn)定工作后,所有用戶均恢復(fù)到正常工作狀態(tài)。
       
[診斷評點(diǎn)]DNS服務(wù)器用于將用戶域名轉(zhuǎn)換為IP地址,一般來說不會(huì)出現(xiàn)什么問題。但由于某些原因,轉(zhuǎn)換地址通通指向了營業(yè)廳子網(wǎng)的業(yè)務(wù)服務(wù)器。業(yè)務(wù)服務(wù)器不具備路由處理功能,對發(fā)送來的IP數(shù)據(jù)包要么拒收并置之不理,要么返回目標(biāo)不可達(dá)或需要重定向的報(bào)告數(shù)據(jù)包。這就是我們在ICMP監(jiān)測時(shí)經(jīng)常觀察到的現(xiàn)象。該市中心網(wǎng)絡(luò)支持的用戶數(shù)量不多,與省中心網(wǎng)絡(luò)的鏈路帶寬為155M的ATM鏈路,用戶帶寬大有富余。所以上Internet的用戶其上網(wǎng)速度主要受子網(wǎng)帶寬的影響和限制。因?yàn)樵S多的用戶要經(jīng)過擁擠的無效E1鏈路,造成路由重定向和嚴(yán)重的時(shí)延。大量的IP數(shù)據(jù)包擁向只有2M帶寬的子網(wǎng)路由器,流量達(dá)到了97%,造成子網(wǎng)工作速度突然變慢,路由器出現(xiàn)嚴(yán)重?fù)砣痊F(xiàn)象。為了確定地址指向的錯(cuò)誤原因,我們建議用戶抽時(shí)間按下列步驟定位故障:首先,將原來的故障DNS服務(wù)器的工作平臺(tái)和應(yīng)用軟件以及網(wǎng)卡驅(qū)動(dòng)程序全部重新安裝一遍,然后選擇深夜用戶數(shù)量最少的時(shí)候接入網(wǎng)絡(luò)使用,查看轉(zhuǎn)換表是否正常;其次,如果仍然不正常,則更換網(wǎng)卡,主板等硬件,逐步縮小故障范圍。       

[診斷建議]為了防止DNS服務(wù)不穩(wěn)定造成業(yè)務(wù)中斷或出錯(cuò),不少網(wǎng)管人員在設(shè)置DNS服務(wù)器時(shí)都安裝了備用DNS服務(wù)器,亦即安裝不只一臺(tái)DNS服務(wù)器。但這樣做也會(huì)帶來一個(gè)潛在的危險(xiǎn):即主DNS服務(wù)器出問題,備用DNS服務(wù)器自動(dòng)投入運(yùn)行,這樣會(huì)犧牲一定的網(wǎng)絡(luò)帶寬,使得系統(tǒng)總體性能有所下降。危險(xiǎn)在于,性能的下降常常是在不知不覺中來到的。所以,為了保證網(wǎng)絡(luò)經(jīng)常處于良好的工作狀態(tài),網(wǎng)絡(luò)管理人員需要定期檢查DNS服務(wù)器的轉(zhuǎn)換表。這也是“周維護(hù)”(即每周定期維護(hù)項(xiàng)目)中建議的內(nèi)容之一(當(dāng)然,要保持網(wǎng)絡(luò)的優(yōu)良性能不只是要檢查路由優(yōu)化性能,還有其它許許多多工作需要做。比如:性能評測、基準(zhǔn)測試、通道測試、應(yīng)用監(jiān)測、拓?fù)浣Y(jié)構(gòu)的有效管理、定期維護(hù)等等,有關(guān)這方面內(nèi)容讀者如感興趣可參閱《網(wǎng)絡(luò)測試技術(shù)簡介》)。本故障中的DNS指向錯(cuò)誤導(dǎo)致用戶的IP數(shù)據(jù)包對準(zhǔn)了子網(wǎng)中的一臺(tái)服務(wù)器,由于子網(wǎng)通道窄引發(fā)“速度問題”。如果對準(zhǔn)的不是子網(wǎng)服務(wù)器而是中心網(wǎng)絡(luò)本地網(wǎng)段中的某臺(tái)機(jī)器,則故障強(qiáng)度會(huì)減弱,用戶不會(huì)感到非常明顯的速度變慢(主網(wǎng)均為100BaseT鏈路)。這樣,“病人”可能不會(huì)感到明顯的“身體不適”從而使得網(wǎng)絡(luò)長期帶病運(yùn)行。就象人一樣,定期的體檢對及時(shí)發(fā)現(xiàn)疾病及其隱患是非常必要的。而如何及時(shí)發(fā)現(xiàn)路由優(yōu)化方面的問題,也是網(wǎng)絡(luò)定期項(xiàng)目測試中的內(nèi)容之一,對大型網(wǎng)絡(luò)則更有必要,必須堅(jiān)持定期維護(hù)和測試。
        許多網(wǎng)絡(luò)設(shè)備如路由器、交換機(jī)、智能集線器等都支持SNMP網(wǎng)管功能,但為了全面監(jiān)測網(wǎng)絡(luò)通道功能,還需要網(wǎng)絡(luò)設(shè)備支持全面的RMON和RMON2。用這樣的設(shè)備組建起來的網(wǎng)絡(luò)其管理和故障診斷功能是很不錯(cuò)的。但現(xiàn)實(shí)的問題是,這樣的網(wǎng)絡(luò)設(shè)備價(jià)格是普通網(wǎng)絡(luò)設(shè)備的6~10倍左右,用戶難以接受。因此,為了隨時(shí)監(jiān)測網(wǎng)絡(luò)的服務(wù)應(yīng)用流量及其比例、來源、工作記錄以及必要時(shí)進(jìn)行解包分析,建議用戶在重要的服務(wù)器通道、核心交換通道或路由通道上安裝監(jiān)測接口。以便必要時(shí)可以隨時(shí)將流量分析儀、網(wǎng)絡(luò)測試儀等接入通道進(jìn)行監(jiān)測和分析。如此,本故障的查找時(shí)間可以縮短到20分鐘左右。當(dāng)然,如果資金允許,也可以將流量分析儀長期接入通道對多個(gè)重要的網(wǎng)絡(luò)設(shè)備進(jìn)行全速率透明流量監(jiān)測,這樣甚至可以把故障定位時(shí)間縮短到1分鐘以內(nèi)。
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP