數(shù)據(jù)中心中斷,等等數(shù)據(jù)中心突發(fā)事故時(shí)有發(fā)生,供電故障是我國常見的災(zāi)害原因數(shù)據(jù)中心。雙保數(shù)據(jù)中心 Data for you數(shù)字時(shí)代的雙保,越來越多的用戶采用私有云架構(gòu),自建數(shù)據(jù)中心,數(shù)據(jù)中心停電應(yīng)急預(yù)案數(shù)據(jù)中心停電應(yīng)急預(yù)案升級(jí)數(shù)據(jù)中心應(yīng)對(duì)突發(fā)停電事件的應(yīng)急反應(yīng)速度和處理能力,快速高效地處理停電事件,最大限度地減少停電對(duì)數(shù)據(jù)中心運(yùn)行的影響。
所以,總的來說,數(shù)據(jù)中心機(jī)房的巡檢管理要檢查什么?一般來說數(shù)據(jù)中心機(jī)房的巡視管理包括:檢查服務(wù)器、備份系統(tǒng)數(shù)據(jù)庫、檢查軟件系統(tǒng);檢查機(jī)房的網(wǎng)絡(luò)設(shè)備;檢查公司的網(wǎng)絡(luò)狀態(tài)。此外,要及時(shí)發(fā)現(xiàn)和發(fā)現(xiàn)網(wǎng)絡(luò)和信息系統(tǒng)設(shè)備隱患,并消除故障。以下是某公司數(shù)據(jù)中心機(jī)房巡檢管理的具體要求,供您參考。1.巡回檢查時(shí),檢查狀態(tài)。如發(fā)現(xiàn)機(jī)房物理環(huán)境異常、設(shè)備狀態(tài)異常、網(wǎng)絡(luò)或應(yīng)用系統(tǒng)異常故障,應(yīng)立即按照操作規(guī)程進(jìn)行恢復(fù)。
(2)服務(wù)器:檢查服務(wù)器是否宕機(jī),服務(wù)器(磁盤陣列)的硬盤燈是否正常。(3)機(jī)房環(huán)境:檢查空調(diào)工作狀態(tài)和機(jī)房溫度。(4)網(wǎng)絡(luò)設(shè)備:檢查網(wǎng)絡(luò)設(shè)備,包括交換機(jī)、路由器、防火墻及其下屬設(shè)備。檢查設(shè)備的工作狀態(tài)。(5)網(wǎng)絡(luò)渠道:檢查內(nèi)外網(wǎng)絡(luò)渠道狀況,包括公司內(nèi)部局域網(wǎng)、公司和互聯(lián)網(wǎng)的狀況,以及公司到各合作單位的網(wǎng)絡(luò)渠道。
可以使用數(shù)據(jù)中心巡檢機(jī)器人輔助巡檢。巡檢機(jī)器人可以24小時(shí)進(jìn)行巡檢,識(shí)別各種儀表盤和指示燈的狀態(tài),監(jiān)測(cè)數(shù)據(jù)中心中的溫度、濕度等各種指標(biāo),如有異常及時(shí)預(yù)警。杭州陳果機(jī)器人在機(jī)器人檢測(cè)方面做得很好。保持業(yè)務(wù)全年不間斷運(yùn)行是最能體現(xiàn)數(shù)據(jù)中心。現(xiàn)在的數(shù)據(jù)中心系統(tǒng)比較復(fù)雜,幾乎不可能保證沒有故障。
因此,重視數(shù)據(jù)中心操作的高可靠性非常重要。馬航曾經(jīng)是備受尊敬的航空公司之一。但最近兩年兩次大崩盤后,面臨倒閉的局面。數(shù)據(jù)中心也是如此。故障之前沒有發(fā)布不代表以后不會(huì)發(fā)布。一旦出現(xiàn)嚴(yán)重的業(yè)務(wù)中斷,那么數(shù)據(jù)中心的業(yè)務(wù)會(huì)受到多方面的影響,不僅是財(cái)務(wù)上的損失,還有-