跳到主要內容區塊

ntuccepaper2019

校務服務

計資中心環境監控系統
  • 卷期:v0018
  • 出版日期:2011-09-20

作者:陳永樵 / 臺灣大學計算機及資訊網路中心作業管理組程式設計師


一、 前言


計資中心共有三間重要機房,負責提供全校的網路及主機服務,為全校師生最重要的支援設施,一旦發生緊急意外情況,將造成全校師生教學研究的停擺,更甚者全校的行政相關作業也會受到巨大的影響,所以機房運轉的安全平順,就是計資中心執行機房作業的最高原則。

計中的機房為24小時運轉,但是卻沒有24小時值班人員,為了達成全天候機器正常運作的目標,所以建置環境監控的預警系統,達到機房任何異常情形出現,立即警示給相關負責人員,可以於第一時間進行危機處理,避免異常狀況的擴大,即時解決問題,恢復機房的正常運作。
計資中心的環境監控系統所設置的監控項目包括以下幾個項目:

1. 溫度
2. 濕度
3. 漏水偵測
4. 消防系統狀態(海龍系統)
5. 空調機箱狀態
6. 冰水機狀態
7. 電力轉換盤狀態(停電狀態)
8. 發電機狀態
9. 不斷電系統狀態

當任何項目出現異常狀態,系統隨即動作,以行動電話簡訊通知預設的處理人員,可以讓相關人員迅速知道相關狀態,做最有效的處理。

 

二、 系統配置


計資中心環境監控系統於2004建立,初期僅建立停電預警,隨後增加溫濕度監控、各項相關空調、電力設備及漏水監控,隨後中心增建320機房,所以就形成監控406、420及320機房的整體監控系統,系統的監控如下圖所示:

 

 

圖中顯示六個區塊,上方為網路機房(420),圖中間為伺服機房(406),左下兩個方塊分別為不斷電系統機房(分東、西側),右下兩個區塊分別為發電機系統及冰水機系統,另外320機房為新增的機房單獨列出如下圖。

 

 

整體系統總計於各相關設備處設置66個監控點,任何點的異常狀況,立即以簡訊通知預設的相關人員,設置的各項監控點數量如下:

1. 溫度,17處。
2. 濕度,15處。
3. 漏水偵測,6處。
4. 消防系統狀態(海龍系統),3處。
5. 空調機箱狀態,6處。
6. 冰水機狀態,3處。
7. 電力轉換盤狀態(停電狀態),3處。
8. 發電機狀態,1處
9. 不斷電系統狀態,12處。

 

系統設置一個訊號收集盤,各監控點有些接到電力設備的乾接點,或是經由RS485介面(UPS系統),將各項訊號傳送至訊號收集盤,訊號收集盤將所有的監控點訊號轉成數位訊號,經由RJ-45的內部網路傳送至處理主機,進行訊號判讀及存檔,系統主機包括一台個人電腦及一組簡訊發送的GSM模組,訊號收集盤安裝於420機房內,整體盤體圖如下所示。

 

 

三、 系統設定


環境監控系統有許多系統參數可以設定,包括溫濕度的範圍、警訊通知群組、異常狀況通知群組等多個項目,當系統接獲異常狀態時,就會跳出下圖中出現的『新增警訊顯示/確認』的視窗,通知管理者需要處理異常狀態,並立即簡訊通知預設的負責人員,進行預警,簡訊的發送標準,對於狀態的改變,如發電機故障、台電停電、UPS故障等狀況,僅會發出一次簡訊通知,如果為環境參數超出預設範圍,會定時每五分鐘發出警訊,通知需要立即處理,例如溫濕度、電力系統電壓等超出預設範圍,會持續通知,要求立即改善。

 

 

各項系統參數的設定如下所述:

 

  1. 設定簡訊通知的相關人員,將所有需要通知的相關人員手機號碼輸入系統中,本中心設定的人員包括:

�� 主任
�� 作業組組長
�� 作業組相關人員
�� 網路組相關人員
�� 程式組相關人員
�� 機電維修廠商:發電機保養廠商、UPS保養廠商及空調保養廠商
  設定的畫面如下圖。

 

  1. 設定個人的通知清單,可以區分負責人員的相關需要通知的項目,例如下圖中顯示作業組『李XX』通知清單為『台電停電-2、3F機房溫度1告警、3F機房溫度2告警、3F機房濕度1告警、3F機房濕度2告警』等五項,可以清楚得知李泳泉負責320機房的主機維護管理,所以320機房的一些環境參數改變會警示通知。

各項通知項目為:

  • 台電停電:通知所有系統中的人員,包括主任、組長、中心工程師、保養廠商等,預警相關人員需要隨時standby。
  • 406機房警示:通知作業組相關人員。
  • 420機房警示:通知網路組所有系統中的人員。
  • 320機房警示:通知作業組相關人員。
  • 發電機故障:通知發電機保養廠商。
  • UPS機房溫濕度異常或是主機故障訊息:通知UPS保養廠商。
  1. 設定溫濕度及其他相關警示範圍,其設定值如下(設定圖示如下圖):
    溫度範圍:機房正常溫度攝氏15-28度,UPS機房正常溫度攝氏15-35度。(因為UPS機房廠商設定工作溫度為40度以下)
    濕度範圍:正常範圍80%-20%。
    UPS輸出電壓:正常範圍400-360V(標準輸出電壓380V)。

 

四、 歷史資料


環境監控系統中所得到的參數都會儲存於主機的資料庫中,系統中有現成的介面可以直接由資料庫檔讀出數據,也可以直接輸出成excel檔,也可以直接在系統中直接畫出圖表,得知一定時間內機房溫度的最大值、最小值及平均值,操作方式如下圖。

 

 

五、 結論


本套環境監控系統建置相當久,但是因為是封閉式的系統,所以免掉電腦病毒的侵襲,系統運作尚稱穩定,電力訊號的接收都是使用乾接點的方式連接,訊號錯誤的機率小,但是對於環境溫濕度變化異常,會持續五分鐘發簡訊通知,有時僅達臨界高溫,持續發簡訊相當浪費資源,未來可能採取異動發送方式,但是缺點為無法持續知道系統溫度狀態。
本系統為封閉式的系統,所以即時資料或是歷史資料如果需要上網,讓中心人員可以隨時觀看,未來將必須加裝另一片網卡,並架設IIS網頁伺服器,並撰寫程式讀取系統資料,才可供隨時讀取資料。