前言:本站為你精心整理了略說地震數據庫維護現狀分析及對策范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。
1現狀
目前,Oracle數據庫系統主要集中分布在國家中心、41個區域中心、33個應急中心、300個縣節點、300個臺站,其中雙機系統79套,單機系統600套。而支撐行業數據庫運行的硬件平臺多樣,部署方式復雜,具體表現在以下幾個方面。數據庫系統的部署環境多樣復雜。雙機數據庫IT環境涉及到IBM服務器、曙光服務器和SUN服務器系統,以及數據存儲系統EMC與HDS。數據庫系統的技術結構復雜,管理難度高。系統大多采用Unix和Linux系統,數據庫使用Oracle10gRAC,存儲使用OracleASM管理。數據庫系統地域分散。主要集中分布在國家中心、41個區域中心、33個應急中心、300個縣節點和300個臺站。系統管理分散。各級節點自行管理維護。在部分節點內部,服務器和操作系統一般按照業務應用分多個運行維護小組,各自管理維護。以上特點決定了地震行業數據庫運行維護是一個復雜而艱巨的任務,需要總結多年來數據庫運維過程中出現的問題,制定合理的運行維護策略,以保證數據庫系統的正常運行。
2運行維護事件分析
為了更好地分析數據庫運行維護過程中出現的問題,作者分析整理了近4年來數據庫運行維護過程中出現的各類問題,其中系統故障6類、存儲故障5類、網絡故障3類、ASM故障11類、CRS故障8類、數據庫本身故障12類及其它故障4類進一步對表1中7大類故障進行分析,可以看出存在以下問題:操作系統平臺存在兼容性問題如部分省局數據庫運行在曙光服務器上,操作系統為SUSE,操作系統與后臺存儲系統之間的銜接容易出故障。而采用IBM和SUN硬件平臺的節點數據庫系統就沒有類似問題的發生。存儲系統平臺存在兼容性問題如應急數據庫系統部署在HDS之上,HDS經常容易發生數據壞塊的情況,造成數據庫故障,如:表1中的存儲故障;ASM故障的;CRS故障的等。日常維護存在問題在操作系統和存儲系統軟硬件平臺不出現問題的情況下,需要維護人員每天、每周和每月定時做很多工作,如:查看磁盤空間使用情況、數據庫告警日志等。而目前缺乏統一的規章制度與規范,督促維護人員完成這些日常工作,維護工作的好壞基本上取決于維護人員的責任心。再者,運行維護人員的水平較低,一些基本的數據庫維護工作難以很好的完成。如果有一套健全的規章制度與規范,同時還有一批具有較高數據庫運行維護經驗的管理人員,那么上述7大類故障中的大多數故障是可以提前預防的。數據庫管理和維護缺乏科學依據缺乏一套有效的數據庫監控系統來對數據庫運行狀態的各關鍵指標信息進行數據搜集和統計,完成如日常性能監控、每月性能評估、數據庫審計等人工工作量大,難以完成的工作,將數據庫隱患消滅在萌芽狀態。而在數據庫運行維護中凸顯出來的主要問題有:運行維護管理制度不健全。目前Oracle數據庫管理被動、分散、管理規范不完善,如:缺乏統一的備份與管理策略、安全策略、管理流程等。運行維護人員技術水平較低。相對于專業的Oracle數據庫運行維護人員而言,目前行業內的技術人員在數據庫方面的運行維護技能水平較低,技術人員相對不固定。雖然技術人員通過了每年的技術培訓,但在提高運行維護的能力方面還有待進一步提高。運行維護技術平臺亟待建立。缺乏數據庫基礎運行環境(操作系統、存儲系統和網絡)的統一故障預警及故障監測機制。管理員對系統故障的反應速度無法提高,一般是在出現問題以后才進行查找及處理,難以充分保障關鍵業務系統的可用性,無法做到“主動式”系統管理。
3對策與建議
完善行業數據庫運行管理制度以提高數據庫運行水平和管理能力為目標,建立一套完整的流程管理規范,同時結合必要的工具管理軟件,使主機、存儲和數據庫系統得到責任保障,保證數據庫系統連續穩定運行。加強人員培訓一般來說,地震行業比較注重硬件平臺建設,而對流程和人員的軟平臺建設有所忽略。由于當前人員的技術水平還較低,再加之相關培訓的不足,因此解決實際問題的能力和效率較低。為此需要開展相關的技術培訓,以提高地震系統數據庫的運行和維護技能。建立數據庫運行維護技術支撐平臺應建立數據庫基礎運行環境(操作系統、存儲系統和網絡)的統一故障預警及故障監測機制,由過去的“被動式”管理轉變為“主動式”管理,以提高數據庫管理人員對系統故障的反應速度,保障關鍵業務系統的可用性。建立數據庫運行維護知識庫開展數據庫知識轉移工作,建立一套持續機制,確保維護知識和技能的傳承。將數據庫運行維護中的每次事件、故障或者問題解決過程中所獲得的解決方法和維護經驗都記錄下來,建立一個知識庫,以提高對出現的事件及問題的處理效率。
4結語
本文僅針對目前存在的問題提出了一些方向上的解決辦法。在未來的發展中,還需要將成熟的管理理論與具體的需求及目標結合起來,以探求出解決具體問題的方案。Oracle數據庫系統的運行維護是一個需要長期面對的研究課題,應結合IT行業運行維護的相關管理理論,進行不斷的開發和完善。
作者:周娜李永紅李曉京張蕾單位:中國地震臺網中心