容錯服務器與集羣服務器該如何選擇

來源:文萃谷 2.31W

有些CIO清楚容錯系統較之集羣具有更高的可靠性,但讓CIO為難的是應該如何説服CEO去選擇容錯服務器,因為明擺着的一個事實是:一台容錯服務器20多萬元,集羣服務器一台只要2萬元左右,2台不過是4萬多元。所以,要説服CEO並不容易。

容錯服務器與集羣服務器該如何選擇

如果從ROI(投資回報率)來看,容錯服務器整體上是一個系統,相應的操作系統、數據庫、應用軟件等只需要一份授權;與之相比,集羣系統硬件成本低,但是軟件成本高,需要多購買一份軟件的授權。總體計算下來,容錯佔優。但在國內環境下,有些廠商往往採用硬件贈送軟件的方式,或者採用開源軟件,就會使得容錯在總體價格上的優勢被削弱。採用開源軟件的問題在於技術支持上往往跟不上。

除了投資之外,可靠性上差異更為重要。對於某些關鍵業務應用,如MES系統(Manufacturing Execution Systems,製造執行系統),它是連接ERP系統和基礎自動化系統的橋樑,負責廠級生產管理和調度執行。其可靠性不可或缺,系統一旦宕機,生產就會停頓,損失無法估量。對於這樣的關鍵業務系統,集羣方案是不能夠滿足需要的,集羣系統的設計目的是容災,用於災難情況下的系統恢復,而恢復是需要時間的,存在中斷的危險。

有些廠商宣稱集羣系統可以無縫切換,多數情況下,這是做不到的。有些演示環境確實可以做到,但實際情況下,無縫切換很難實現。與之相比,容錯系統具有更高的可靠性,從可靠性等級來衡量,容錯系統的可靠性是99.999%,也就是5個9的水平;集羣只有4個9。表明看僅是區區0.009的分別,但實際上,其中的差別是巨大的。

CIO肯定清楚其中的分別,但要讓CEO搞清楚就難了。5個9、4個9都是一些技術語言,用來説服CEO往往是事倍功半。

説服CEO不要採用技術語言,只需要讓他清楚一件事情:一個閃電或一個控制信號錯誤導致了動車追尾,罪魁禍首就是可靠性不夠。那麼,採用容錯就可以高枕無憂了嗎?當然不是,但是容錯方案是可靠性最高的方案了,如果連容錯都抵擋不住,那麼也就沒有系統可以抵擋了。

一句話,要讓CEO做選擇題。CEO可以不選擇最好的方案,但一定要讓CEO意識到可能存在的風險。CIO只要做到這點就可以了,至於最終決策不是CIO應該考慮的問題

容錯服務器與集羣服務器該如何選擇 [篇2]

1980年,當Bill Fost先生苦思冥想在為新公司取個什麼名字的時候,無意間看到了飛機外層層疊疊的雲層,由此“Stratus”誕生了。但是Bill Fost沒有想到,1990當他們註冊北京辦事處的時候,竟然可以使用“美國容錯計算機公司”,這種用技術術語命名公司的現象,此後再也沒有出現過。不知道國內有多少用户知道 “美國容錯計算機公司”,進而瞭解容錯技術,但是相信,這幾年數量有限與很多技術領先型公司相類似,“酒香不怕巷子深”是其風格,市場上的低調在一定程度上制約了發展。

容錯的含義比較寬泛,這種不確定性容易引發歧義,增加理解上的難度。從概念上來説,容錯是指服務器對於錯誤的容納能力,是應用過程中對於服務器穩定性追求的一個目標。為了這樣一個目標,有幾種技術上的實現方法,目前國內談論最多的是三種:服務器羣集技術、雙機宂餘服務器方案和單機容錯技術。

實際上,服務器羣集和雙機宂餘的技術比較類似,雙機宂餘是最簡單的集羣,是其一個特例,也可以把服務器集羣技術視為雙機宂餘的延伸,可以理解為一種多機容錯的方案。在一般的討論之中,集羣技術是為了解決計算性能不足的問題,通過多台服務器的集羣計算,為高性能計算領域應用提供所需要的高性能。採用集羣技術,通過多台服務器之間的負載均衡,可以解決服務器單點故障所引發的系統不穩定,提高系統的可靠性,因此集羣具有更好的容錯能力,但是在實際的應用中,集羣技術多用於高性能計算。

單機容錯技術以Stratus公司的ftServer、惠普公司的NonStop服務器和NEC公司的Express5800/ft為代表。這種技術具有比雙機宂餘方案更高的容錯能力。據記者查閲有關技術資料,雙機宂餘系統的可靠性可以達到99.9%,也就是3個9的能力,而Stratus公司的方案,其可靠性可以達到5個9。 在記者的採訪中,惠普公司企業服務器產品經理陳武勝表示,其NonStop服務器作為目前惠普公司最高檔的服務器,其可靠性可以達到7個9的水平。在記者看來,雙機宂餘與單機容錯有很多的差異,絕不是3個9和5個9的區別。為了瞭解這些區別,記者分別採訪了有關軟硬件廠商,並結合實際的應用案例,幫助讀者瞭解有關容錯服務器的技術。

《容錯服務器與集羣服務器該如何選擇》全文內容當前網頁未完全顯示,剩餘內容請訪問下一頁查看。

熱門標籤