網(wǎng)絡運維 設備管控

如何實現(xiàn)網(wǎng)絡安全監(jiān)控運維?

銀行數(shù)據(jù)中心綜合監(jiān)控運維方案

銀行數(shù)據(jù)中心綜合監(jiān)控運維方案
    馬上咨詢

    ? ? ? ? 隨著金融科技的不斷變革,銀行的網(wǎng)絡整體規(guī)劃和建設思路也在不斷追趕新時代銀行業(yè)務的發(fā)展需要。隨之而來的是銀行數(shù)據(jù)中心的網(wǎng)絡規(guī)模不斷擴大,從更初的單中心逐漸延伸到多地多中心運營的模式,使用的網(wǎng)絡技術也從傳統(tǒng)的交換路由、負載均衡、防火墻逐步發(fā)展到軟件定義網(wǎng)絡、網(wǎng)絡服務虛擬化等各類新興技術。?

    ? ? ? ? 同時,在金融需求越來越旺盛,銀行業(yè)務發(fā)展越來越快的當下,銀行數(shù)據(jù)中心出現(xiàn)異常運行而造成的損失和后果就愈發(fā)嚴重。在云計算、大數(shù)據(jù)等新興技術不斷涌現(xiàn)的新形勢下,如何保障數(shù)據(jù)中心安全生產(chǎn)運行,高效率、高質(zhì)量地運維龐雜的網(wǎng)絡環(huán)境,已成為銀行信息科技部門的必答題。

    第1章 銀行數(shù)據(jù)中心運維建設背景

    ? ? ? ? 根據(jù)銀監(jiān)會編制的《中國銀行業(yè)信息科技“十三五”發(fā)展規(guī)劃監(jiān)管指導意見》中明確指出: 提高運維自動化水平,打造智能化運維體系。

    ? ? ? ? 《意見》表明:提高基礎資源和應用部署的自動化水平,實現(xiàn)快速交付、動態(tài)調(diào)整、彈性部署,降低人工操作風險,自動化部署比例不低于75%。持續(xù)推進生產(chǎn)運維監(jiān)控精細化、自動化、智能化建設,強化系統(tǒng)風險和故障的早預警、早定位和早處置。實現(xiàn)應用層面交易全流程、全節(jié)點監(jiān)控全覆蓋,結合應用系統(tǒng)交易特性及相關數(shù)據(jù)的分析對比,提升交易過程監(jiān)控的智能化水平。強化容量管理,做好相關資源的動態(tài)規(guī)劃,預防非計劃性、突發(fā)性的容量瓶頸問題發(fā)生。強化運維、開發(fā)、安全、風險管理的信息共享和一體化協(xié)作,提升多方聯(lián)動能力。加強運維大數(shù)據(jù)分析,利用運維大數(shù)據(jù)加強業(yè)務風險防控,探索利用運維大數(shù)據(jù)推動業(yè)務流程優(yōu)化并支持業(yè)務創(chuàng)新。

    第2章 銀行數(shù)據(jù)中心網(wǎng)絡運維痛點

    ? ? ? ? 隨著銀行數(shù)據(jù)中心信息系統(tǒng)規(guī)模逐漸壯大,信息科技部的運維工作任務日益繁重,傳統(tǒng)的局部、粗放、碎片化的IT運維管理模式已經(jīng)無法滿足新形勢下業(yè)務連續(xù)性保障的實際需求。在現(xiàn)有的銀行運維體系下,運維管理的工作涵蓋從機房基礎設施,到各類網(wǎng)絡及網(wǎng)絡設備、服務器、操作系統(tǒng)、數(shù)據(jù)庫、中間件、各級業(yè)務系統(tǒng)所引發(fā)的各類事件和問題,如容量不足、故障恢復、災備轉(zhuǎn)移等等內(nèi)容。

    ? ? ? ? 銀行IT運維也面臨著應用系統(tǒng)繁多,系統(tǒng)間關聯(lián)關系負責,業(yè)務環(huán)節(jié)繁多等壓力,而在日常運維工作中,事件處理中信息不全、問題描述不準確、關鍵信息缺失等情況,也給運維部門帶來重重困難。

    • 銀行數(shù)據(jù)中心的系統(tǒng)硬件從型號、品牌呈現(xiàn)數(shù)量多、品牌多的特點,難以統(tǒng)一管理。
    • 支撐業(yè)務系統(tǒng)的虛擬化、云計算、大數(shù)據(jù)、微服務、容器、信創(chuàng)等技術趨勢迅速翻新,迫IT環(huán)境復雜度、規(guī)模都急劇提升;節(jié)點分布范圍更加廣,物理位置不統(tǒng)一,對故障定位、變更升級等運維工作帶來新挑戰(zhàn)。
    • 新增業(yè)務需配置多廠商、多類型設備,各廠商設備配置命令千差萬別,協(xié)議繁復,配置更其復雜,大量重復性的策略開通工作,費時費力;而上云的業(yè)務也同樣面臨異構多云跨廠商業(yè)務開通的難題。
    • 銀行業(yè)務的多元化發(fā)展,對系統(tǒng)和網(wǎng)絡設施的依賴性不斷增加,在傳統(tǒng)運維方案中,難以自動發(fā)現(xiàn)業(yè)務應用拓撲關系和交易訪問路徑,難以直觀定位業(yè)務節(jié)點,故障根源定位慢,缺乏對業(yè)務系統(tǒng)整體健康狀況和運行趨勢的監(jiān)測,無法判定業(yè)務系統(tǒng)是否存在運行瓶頸。
    • 跨部門排障行為復雜,需較長時間進行故障定位,無法達到精準化報警;同時由于系統(tǒng)和應用間交互關系復雜,往往需要多部門聯(lián)動、多環(huán)節(jié)并發(fā)式排障,造成異常處置不及時。
    • 銀行運維數(shù)據(jù)存儲分散,缺乏統(tǒng)一數(shù)據(jù)標準,存在數(shù)據(jù)一致性、準確性、完整性不足等問題,不易管理及挖掘價值,難以評估系統(tǒng)當前和未來對資源的需求,及資源分配的合理性。
    • 銀行數(shù)據(jù)中心的安全生產(chǎn)水平,依賴于開發(fā)、測試、運行以及業(yè)務、風險管理、支持保障等多個部門,在實際運維工作中,運維職能難以清晰界定,部門間協(xié)同存在客觀難度。
    • 在銀行實際運維工作中,部分場景問題解決過度依賴專家人員,解決方案沒有形成知識,難以傳承復用,也無法持續(xù)擴展打造自身知識運營體系。


    第3章 智和信通銀行數(shù)據(jù)中心自動化運維解決方案

    ? ? ? ? 銀行作為對IT系統(tǒng)可用性、業(yè)務系統(tǒng)穩(wěn)定性要求更高的金融機構,對整體網(wǎng)絡架構的可靠性、安全性等方面提出更高要求。銀行數(shù)據(jù)中心的網(wǎng)絡運維涉及網(wǎng)絡可視化、故障管理、性能管理、業(yè)務管理、配置管理、變更管理、應急保障等多方面的需求。同時,因業(yè)務的特殊性,客戶對銀行服務中斷和性能問題的容忍度較低,運維需求已由單純的實現(xiàn)IT支撐,逐步轉(zhuǎn)變?yōu)橹С謽I(yè)務發(fā)展,平穩(wěn)應對業(yè)務量持續(xù)及爆發(fā)式增長,保障用戶體驗等方面的需求,因此在系統(tǒng)異構的現(xiàn)狀下,如何保障業(yè)務連續(xù)性和高可靠性建設正在逐步成為銀行數(shù)據(jù)中心運維的重點。

    ? ? ? ? 北京智和信通深入分析銀行運維需求,針對銀行數(shù)據(jù)中心基礎架構復雜度不斷增長,服務器數(shù)量急劇增加,業(yè)務復雜度快速發(fā)展的現(xiàn)狀,提出自動化運維方案,為銀行網(wǎng)絡保駕護航。

    智和信通銀行網(wǎng)絡運維平臺功能模型

    3.1.異地網(wǎng)絡架構可視化

    ? ? ? ? 目前大型銀行基本采取全國數(shù)據(jù)集中管理的模式,在網(wǎng)絡架構上采用“全國一網(wǎng)”的形式。網(wǎng)絡架構中軟硬件環(huán)境涉及的技術復雜,廠商眾多。北京智和信通通過網(wǎng)絡架構拓撲可視化能力,將網(wǎng)絡數(shù)據(jù)從離線表格轉(zhuǎn)移至平臺內(nèi),從靜態(tài)的網(wǎng)絡架構數(shù)據(jù)轉(zhuǎn)化為動態(tài)智能拓撲,實現(xiàn)全網(wǎng)設備、資源、鏈接關系、IP等實時更新、快速定位。

    ? ? ? ? 在動態(tài)拓撲上展現(xiàn)設備實時狀態(tài),通過樹形、平面結構聯(lián)動展示設備間鏈接關系,通過按片區(qū)、按地域、按層級等多種布局方式劃分網(wǎng)絡,使用不同顏色、粗細、圖標表示被管理對象的狀態(tài)信息,助力運維人員實時了解網(wǎng)絡架構及全網(wǎng)運行狀態(tài),快速感知資源、鏈路、流量等異常信息。

    銀行網(wǎng)絡撲示意圖

    3.2.“兩地三中心”的災備架構可視化

    ? ? ? ? 為滿足銀行對業(yè)務穩(wěn)定運行與快速恢復,確立“兩地三中心”的災備模式,即數(shù)據(jù)中心、同城災備中心和異地災備中心,非常重要。但是異地+多中心的模式,給網(wǎng)絡可視化運維管理帶來更大挑戰(zhàn)。

    ? ? ? ? 北京智和信通自動化運維方案通過多維管理視圖,對不同品牌、類型、版本的網(wǎng)絡設備、安全設備、無線設備、存儲、主機、中間件、數(shù)據(jù)庫、虛擬化、應用服務、視頻監(jiān)控等IT資源進行統(tǒng)一、全方位、多層次的綜合管理,實時分析資源當前性能和運行狀態(tài),直觀反映資源的動態(tài)變化對支撐業(yè)務的影響。

    銀行網(wǎng)絡撲示意圖

    3.3.端到端全鏈路可視化

    ? ? ? ? 從整體維度到局部維度展示銀行網(wǎng)絡內(nèi)設備鏈路各項指標,整體可觀測、可告警、可分析、可統(tǒng)計,通過實時監(jiān)控各個端口以及每條線路的通斷情況和性能指標,結合專業(yè)的流量監(jiān)控分析能力,對鏈路容量進行即時監(jiān)控,并生成流量分析報告,為容量規(guī)劃提供依據(jù)。

    ? ? ? ? 針對銀行雙運營商網(wǎng)絡的模式,對雙鏈路進行管理,通過不同顏色展示主備線路,支持自動切換監(jiān)控線路,實現(xiàn)主線路掉線設備顯示紅色,副線路掉線設備顯示棕色,全掉線顯示灰色。

    鏈路綜合信息示意圖

    3.4.全網(wǎng)資源統(tǒng)一監(jiān)控

    ? ? ? ? 本方案實現(xiàn)網(wǎng)絡設備信息高頻采集,并結合智能算法,實現(xiàn)對整體網(wǎng)絡架構、設備運行狀態(tài)、業(yè)務可用狀態(tài)的實時信息采集和感知。通過對銀行網(wǎng)絡中海量設備的智能解析和關聯(lián)分析,結合全流量采集分析能力,形成整個網(wǎng)絡通信鏈路的多端網(wǎng)絡流量分析鏈,助力運維人員從多個維度實現(xiàn)對相應告警的智能分析,解決傳統(tǒng)運維監(jiān)控中關聯(lián)數(shù)據(jù)缺失,輔助排障信息不足的問題。

    3.4.1.全網(wǎng)軟硬件設備統(tǒng)一監(jiān)控

    ? ? ? ? 方案針對銀行網(wǎng)絡內(nèi)各類設備、業(yè)務系統(tǒng)構建統(tǒng)一、智能監(jiān)控體系,對業(yè)務系統(tǒng)、操作系統(tǒng)、基礎設施、主機存儲、數(shù)據(jù)庫、中間件、虛擬化、云、數(shù)據(jù)中心機房等全方位監(jiān)管。屏蔽廠商、型號差異,掌握銀行網(wǎng)絡整體運行情況和運行效能,能高效、快速、精準進行故障定位診斷。

    設備資源可視化顯示?

    3.4.2.全網(wǎng)帶寬、流量監(jiān)控與回溯分析

    ? ? ? ? 方案基于海量流量數(shù)據(jù)的存儲挖掘,實現(xiàn)對網(wǎng)絡流量的偵測分析。通過網(wǎng)絡流量分析技術,采集、分析、存儲所有網(wǎng)絡流量,回溯分析數(shù)據(jù)包特征、異常網(wǎng)絡行為,以多維數(shù)據(jù)分析和深度挖掘為手段,實現(xiàn)數(shù)據(jù)包層面的流量追蹤,發(fā)現(xiàn)潛伏于網(wǎng)絡中的未知攻擊。

    ? ? ? ? 針對銀行中業(yè)務專線、物聯(lián)網(wǎng)專線等專線線路管理需求,通過實時監(jiān)控和定期對專線線路的使用情況進行統(tǒng)計分析,為每條專線的擴容或縮容提供數(shù)據(jù)依據(jù)。

    全網(wǎng)流量監(jiān)控與回溯分析示意圖

    ? ? ? ? 從設備、接口、IP、服務、應用、會話、QoS等層級的實時流量監(jiān)控和歷史流量分析,識別帶寬消耗較大的應用程序、服務、協(xié)議或 IP 地址,避免網(wǎng)絡容量過載,并提升更終用戶網(wǎng)絡體驗。

    3.4.3.IP地址分配與管理

    ? ? ? ? 銀行對IP地址管理的性與安全性存在更高要求,北京智和信通自動化運維方案支持端到端規(guī)劃、部署、管理和監(jiān)控IP 地址。通過智能IP掃描能力,定義多層次子網(wǎng),掃描其范圍內(nèi)每個IP地址的當前狀態(tài),包括IP地址,MAC地址等信息,也可以查看IP段內(nèi)地址使用詳情,便于銀行信息科技部進行IP地址分配管理等。


    ? ? ? ? 通過端口視圖及列表視圖的形式,展示當前IP地址的使用情況,可查看某個子網(wǎng)的IP現(xiàn)網(wǎng)詳情信息,如IP、掩碼、主機名、設備類型、現(xiàn)網(wǎng)MAC、現(xiàn)網(wǎng)接入設備、現(xiàn)網(wǎng)接入端口、規(guī)劃MAC、規(guī)劃接入設備、使用人等,可批量分配IP地址,保障了IP地址使用的性。


    ? ? ? ? 通過黑白名單配置,通過黑白名單功能用來檢測用戶所關心的設備是否在網(wǎng)絡中出現(xiàn)及出現(xiàn)時間,對非法接入設備進行告警處置。支持IP-MAC綁定,對全網(wǎng)MAC和IP進行配對綁定,并周期性對MAC-IP進行檢測,當IP-MAC的綁定關系發(fā)生沖突時產(chǎn)生告警,保證入網(wǎng)終端安全可信。

    3.4.4.視頻設備集中監(jiān)控

    ? ? ? ? 本方案可對不同品牌、不同型號的攝像頭進行統(tǒng)一運維,融合網(wǎng)絡高清、智能分析、多級管控為一體。支持監(jiān)管視頻監(jiān)控體系涉及的視頻前端設備(攝像頭、卡口、編解碼器),傳輸設備(光纖收發(fā)器、EPON 等)內(nèi)場設備(網(wǎng)絡與安全設備、主機/虛擬機、存儲設備)、機房動力環(huán)境等多種設備,等統(tǒng)一接入、集中管理。并通過網(wǎng)絡拓撲一鍵自動發(fā)現(xiàn)生成能力,直接生成視頻系統(tǒng)可視化拓撲,通過定時輪詢和事件上報進行可用性和健康度檢查。

    視頻監(jiān)控效果示意圖

    ? ? ? ? 平臺輕松對接多品牌、型號攝像頭,通過onvif接口協(xié)議和智能化識別技術,實現(xiàn)對視頻畫面自動偵測、自動提取,主動監(jiān)控發(fā)現(xiàn)和分析出攝像機設備常見的故障,如設備不連通、畫面偏色、信號缺失、清晰度異常、亮度異常等問題和原因,并及時在拓撲圖中顯示出當前視頻監(jiān)控的可用情況。

    3.4.5.設備模型庫監(jiān)管無限制

    ? ? ? ? 方案采取用戶自定義設備類型及其設備資源的方式,賦予用戶自定義適配設備的能力,更大可能地支持對不同設備類型的支持。通過自定義設備類型及其設備資源,更大限度上提高了智和網(wǎng)管平臺的管理范圍,真正實現(xiàn)了對設備及其資源的化管理,達到管控萬物的目標。


    3.5.適配國產(chǎn)信創(chuàng)環(huán)境

    ? ? ? ? 平臺以JAVA編程語言為基礎,從功能塊、數(shù)據(jù)庫、界面全部基于統(tǒng)一JAVA技術平臺和統(tǒng)一數(shù)據(jù)關系模型。

    ? ? ? ? 智和信通國產(chǎn)信創(chuàng)能力采用Java、HTML5跨平臺技術,兼容國產(chǎn)化操作系統(tǒng)、數(shù)據(jù)庫、中間件、CPU和虛擬化等,支持包括:中標麒麟、銀河麒麟、中科方德、達夢、人大金倉、南大通用、神州通用、華為虛擬化、H3C虛擬化、深信服虛擬化等。


    3.6.業(yè)務可用性管理

    ? ? ? ? 銀行業(yè)務系統(tǒng)流程從終端用戶側的柜面、網(wǎng)銀、手機銀行,到ESB業(yè)務系統(tǒng)總線,再到后端核心系統(tǒng),每個環(huán)節(jié)互相關聯(lián)影響。本方案以保障業(yè)務可用性為基礎,通過對承載業(yè)務的IT基礎設施構建真實的業(yè)務模型。

    銀行業(yè)務系統(tǒng)示意圖

    ? ? ? ? 方案通過構建業(yè)務系統(tǒng)與部門、IT資源及關鍵指標的關聯(lián)關系,整合前端、應用、后臺任務、外部服務、數(shù)據(jù)庫及基礎設施,直觀呈現(xiàn)面向服務的業(yè)務系統(tǒng)體系架構;直觀、便捷地幫助運維人員對銀行內(nèi)辦公系統(tǒng)、交易系統(tǒng)、支付系統(tǒng)、網(wǎng)銀系統(tǒng)、基金系統(tǒng)、保險系統(tǒng)、官網(wǎng)、手機APP系統(tǒng)等進行監(jiān)控,掌握業(yè)務的運行狀態(tài)和健康水平,了解業(yè)務動態(tài)變化趨勢,快速定位故障源,降低運營風險。

    業(yè)務看板示意圖

    3.7.實時故障預警,及時洞察異常信息

    ? ? ? ? 北京智和信通銀行數(shù)據(jù)中心自動運維方案,通過統(tǒng)一的故障管理平臺,將各個模塊中的監(jiān)控信息統(tǒng)一采集、分析,實現(xiàn)整個銀行網(wǎng)絡中各種事件信息、設備故障、網(wǎng)絡異常、流量異常等告警,以智能化手段進行標準化的分析、壓縮、并歸關聯(lián)等,通過多種方式實時傳達告警信息,保證落實到指定人員進行處理,為銀行提供主動式的故障解決方案。

    ? ? ? ? 采集銀行內(nèi)所有聯(lián)網(wǎng)設備,如存儲、服務器、路由器、交換機、防火墻、虛擬化、云、自動提款機、自動存款機、存折補登機、多媒體查詢機、票據(jù)打印機、開卡機等設備、資源、應用、服務等的狀態(tài)信息,通過對告警機制以及閾值的設置,即時獲取準確的告警信息,快速定位告警設備,提升告警處理效率,降低因設備故障帶來的損失。


    3.8.全覆蓋IT資源自動巡檢

    ? ? ? ? 傳統(tǒng)的人工巡檢,尤其是應用巡檢,缺乏統(tǒng)一的規(guī)范、標準,導致巡檢的范圍和深度都存在一定的局限性,并且是基于人工的手工統(tǒng)計,工作效率比較低,同時耗費較大的人力資源。

    ? ? ? ? 本方案依托平臺將以前依賴手工進行的日常巡檢轉(zhuǎn)換為自動化、定時執(zhí)行的巡檢策略。制定統(tǒng)一的巡檢指標、巡檢方式、巡檢頻度等,保證巡檢標準化、巡檢范圍、巡檢深度;通過設計巡檢作業(yè)、數(shù)據(jù)采集方式、自動化作業(yè)調(diào)度等實現(xiàn)日常巡檢的自動化,代替手工工作,提高效率的同時,解放管理人員,釋放管理人員更多的精力,使更多的精力處理更重要的事項。


    3.9.網(wǎng)絡變更實現(xiàn)“人工+智能”

    ? ? ? ? 銀行網(wǎng)絡對運維的顆粒度和精細程度均有較高要求,運維過程中網(wǎng)絡人員將面對每日數(shù)以百計的網(wǎng)絡變更及調(diào)整,相關的變更從用戶域訪問控制到變更投產(chǎn),都需要投入大量的人力進行變更內(nèi)容的評審和準備。在安全合規(guī)的前提下,將運維人員從整體的變更流程及變更內(nèi)容的準備中解脫出來,實現(xiàn)網(wǎng)絡變更、設備配置自動化。


    3.10.人工運維與故障自愈結合

    ? ? ? ? 通過實時發(fā)現(xiàn)告警,進行預診斷分析,判斷告警類型和級別,如果是一般告警,平臺進行自動恢復,如果是嚴重復雜告警則通過告警通知、運維工單等形式通知運維管理人員,進行人工處理。同時,將只能有專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺內(nèi)的流程,形成可保留可復用的運維知識。

    3.11.全場景實現(xiàn)自動災備切換

    ? ? ? ? 通過一鍵啟停的應用控制和場景觸發(fā),簡化人工操作,實現(xiàn)快速災備切換。保障在遇到系統(tǒng)故障、業(yè)務崩潰等災難時,自動將源端業(yè)務切換到備端數(shù)據(jù)中心,從而保障業(yè)務的連續(xù)性,實現(xiàn)業(yè)務的高可用。

    3.12.靈活編排,多運維場景支持

    ? ? ? ? 自動化運維編排,可實現(xiàn)完全根據(jù)用戶場景,定制化設計運維劇本,真正將運維任務托管至平臺,解放人力。

    • 開發(fā)環(huán)境自動化,如軟件代碼自動化更新、自動化編譯、自動化打包、自動化發(fā)布預生產(chǎn)環(huán)境。
    • 應用發(fā)布自動化,如服務自動化升級、軟件自動化部署等。
    • 故障自愈能力,如網(wǎng)口異常自動關閉、磁盤爆滿自動清理、非法設備入侵阻斷、CPU空間不足自動重啟等。
    • 定時服務重啟,如在工作日每天晚上定時關閉應用,每天早上自動重啟應用等。
    • 智能批量設備管控,如批量設備策略執(zhí)行,當設備的配置狀態(tài)不一時,能夠基于當前設備自身的狀態(tài)自動決策適合于本設備的管控操作等。
    • 定期設備健康狀況自檢,如定期設備健康狀態(tài)自檢、服務運行狀態(tài)自檢等。
    • 基于HTTP接口自動化,如基于HTTP接口的工單自動化、審批自動化、業(yè)務自動化等。
    • 高可用服務自動切換,如主備數(shù)據(jù)庫運行狀況自檢異常自動切換,服務運行狀態(tài)檢查主備切換等。
    • 虛擬化、云服務資源自動化擴容,如在虛擬化環(huán)境資源不足時自動化根據(jù)實際情況進行擴容。
    • 日常運維自動化,如自動化定期執(zhí)行批處理cmd\sh腳本、自動化定期數(shù)據(jù)清洗、自動化定期環(huán)境檢查并導出報表等。

    3.13.積累形成運維知識庫

    ? ? ? ? 在銀行日常網(wǎng)絡運維服務中,重復的故障和請求約占到70%,只有30%的故障真正需要專業(yè)人員來解決,知識經(jīng)驗對提升重復工作的效率起到了至關重要的作用。

    ? ? ? ? 通過智和網(wǎng)管平臺自動化運維的能力,將只能有專家處理的各類操作和判斷轉(zhuǎn)化為可存在于平臺內(nèi)的流程,形成可保留可復用的運維知識,減少因誤操作帶來的損失,保障運維效率。以規(guī)范的流程進行運維作業(yè),保障關鍵數(shù)據(jù)的完整合規(guī)。

    3.14.可視化數(shù)據(jù)分析

    ? ? ? ? 利用圖形、圖表、圖表等易于理解的形式,提取和分析大量復雜的銀行網(wǎng)絡中各類運維數(shù)據(jù),呈現(xiàn)分析結果,從而幫助運維人員在短時間內(nèi)更好地理解和獲得更多的信息,幫助運維部門能夠?qū)崟r了解業(yè)務和其所依賴IT資源的運行狀況,以及提供系統(tǒng)運維和優(yōu)化的指示和依據(jù)。

    銀行拓撲大屏示意圖

    ? ? ? ? 適配各種應用場景,二十四小時不間斷監(jiān)控,細粒度可達網(wǎng)絡中每個設備、資源和鏈路。所有的網(wǎng)絡故障都一目了然地呈現(xiàn),大大降低了管理成本,同時也提高了運維人員處理故障的能力,節(jié)省的故障處理時間,為運維人員管理網(wǎng)絡提供了可靠的保證。

    3.15.資產(chǎn)全生命周期監(jiān)管

    ? ? ? ? 對于銀行的網(wǎng)絡資產(chǎn)管理,采取統(tǒng)一數(shù)據(jù)標準,對整體網(wǎng)絡資產(chǎn)進行梳理和調(diào)用,避免資產(chǎn)信息在運維系統(tǒng)和實物間的差異,減少網(wǎng)絡運維過程中信息不一致、數(shù)據(jù)不統(tǒng)一等問題通過平臺將資產(chǎn)實物與運維數(shù)據(jù)庫一一對應,解決網(wǎng)絡設備在日常運維過程中出現(xiàn)“脫管”或“半脫管”的問題,實現(xiàn)對整體銀行網(wǎng)絡內(nèi)IP、ARP、MAC接口數(shù)據(jù),訪問控制信息,應用系統(tǒng)信息,網(wǎng)絡地址及性能容量、設備資產(chǎn)配置容量、機房布線容量信息的集中管理。


    ? ? ? ? 建立健全資產(chǎn)臺賬,實現(xiàn)一機一檔,通過自定義多級資產(chǎn)分類,細化資產(chǎn)類別,實現(xiàn)資產(chǎn)分類管控,提高資產(chǎn)精細管理程度。從資產(chǎn)入庫、領用、變更、維修、調(diào)撥、到報廢處置,資產(chǎn)每一步操作均實現(xiàn)完整記錄,支持追溯,通過平臺實現(xiàn)資產(chǎn)整個生命周期的全流程閉環(huán)管理,使得IT資產(chǎn)每一次生命周期變更,都有流程可依、都有跡可循,從而實現(xiàn)IT資產(chǎn)監(jiān)管。

    3.16.定制化運維工單體系

    ? ? ? ? 通過方案實現(xiàn)運維工單“無紙化”,支持于設備和故障管理頁面快速創(chuàng)建工單,把控故障處理進度,通過工單平臺簡化故障處理流程,形成自動化故障處理機制,并在每個處理流程的節(jié)點上責任到人,實現(xiàn)在快速響應故障的同時,實現(xiàn)兼顧運維流程管控。

    ? ? ? ? 通過建立工單服務基準,預設工單在不同優(yōu)先級、不同狀態(tài)時,受理人應該響應的時間及未響應時的處理方式,生成工單自動化處理規(guī)則,并以多種方式進行通知,避免時響應提升全流程服務管理質(zhì)量。

    3.17.多級部署適配“全國一網(wǎng)”結構

    ? ? ? ? 在“全國一網(wǎng)”數(shù)據(jù)集中管理的背景下,一旦關鍵節(jié)點出現(xiàn)故障或受到攻擊,更可能引發(fā)連鎖反應,波及全行,造成區(qū)域性或全行性異常。因此銀行數(shù)據(jù)中心的運維工作不僅要確??傊行牡纳a(chǎn)安全,更重要的是要保障各分中心、各個節(jié)點的安全運行。全行執(zhí)行統(tǒng)一的運維標準和要求,橫向到邊,縱向到底,一體化管理。

    ? ? ? ? 因此,北京智和信通為銀行采取多級運維平臺部署方案,采用綜合-區(qū)域-設備運維平臺-設備的結構,部署多級架構運維平臺方案,上級運維平臺可以查看下級運維平臺(包含其子集)的監(jiān)控信息,綜合運維平臺可以管理所有設備,下級運維平臺對本區(qū)域內(nèi)單位或本單位網(wǎng)絡進行管理。每級運維平臺可以單獨監(jiān)控各自的網(wǎng)絡設備,也可以由綜合運維平臺集中管理。

    智和網(wǎng)管平臺多級部署示意圖

    ? ? ? ? 實現(xiàn)上級運維平臺對各二級單位的網(wǎng)絡設備運行數(shù)據(jù)的采集、管理、存儲,集成數(shù)據(jù)庫進行數(shù)據(jù)的本地存儲,并通過安全的傳輸方式將數(shù)據(jù)上傳至綜合運維平臺。

    部署方案優(yōu)勢:

    • 對于銀行總部平臺,可對接下層分行子平臺,支持完整的網(wǎng)絡、設備、資源、告警、事件等數(shù)據(jù)同步
    • 對于分行子平臺,可完成其下各網(wǎng)點、機房等的設備群交互,可具有平臺完整的監(jiān)控、管理權限。
    • 子平臺支持橫向水平擴展,隨著項目規(guī)模靈活增設
    • 支持聯(lián)動資產(chǎn)平臺、工單平臺、呼叫中心等,提供一體化運維解決方案


    第4章 方案應用價值

    ? ? ? ? 通過部署智信通自動化運維方案,將傳統(tǒng)手工繪制的網(wǎng)絡拓撲圖升級到了網(wǎng)絡拓撲可視化,將傳統(tǒng)表格式的網(wǎng)絡資源管理升級到了應用級的網(wǎng)絡資源可視化,將傳統(tǒng)的網(wǎng)絡定點抓包分析升級到了應用級的網(wǎng)絡流量可視化,將傳統(tǒng)的經(jīng)驗式故障定位升級到了清單化的自動檢查定位。實現(xiàn)“高可用、高性能、高質(zhì)量”運維管理體系,

    ? ? ? ? 在降低故障發(fā)生概率的同時,在故障發(fā)生后,“早感知、快定位、急止損、優(yōu)改進”,降低影響范圍。不但保障網(wǎng)絡基礎架構穩(wěn)定性的關鍵性能指標,而且通過運維自動化提升整體網(wǎng)絡團隊的能力。

    第5章 標桿案例

    5.1.某農(nóng)商銀行雙鏈路監(jiān)控

    ? ? ? ? 由于農(nóng)商行是移動+電信雙線路模式,其核心是想對雙線路進行管理,監(jiān)控各鄉(xiāng)鎮(zhèn)網(wǎng)點的網(wǎng)絡狀況,明確移動和電信哪條線路出現(xiàn)問題,及時進行處理。

    • 實現(xiàn)對市和各鄉(xiāng)鎮(zhèn)網(wǎng)點的監(jiān)控;
    • 實現(xiàn)每臺設備上電信與移動雙ip監(jiān)控;
    • 實現(xiàn)對交換機的詳細管理,包括性能、故障等;
    • 將拓撲界面投影到大屏幕上進行展示。

    需求實現(xiàn)

    ? ? ? ? 智和信通提出了智和網(wǎng)管平臺+定制開發(fā)的方案,基礎需求采用智和網(wǎng)管平臺成熟功能,并針對農(nóng)商行雙線路的情況進行部分開發(fā)。

    • 通過開發(fā),實現(xiàn)雙線路監(jiān)控,實現(xiàn)自動切換監(jiān)控IP;
    • 由于農(nóng)商行的網(wǎng)點型網(wǎng)絡結構,設計通過設備顏色對雙線路進行展示,主線路掉線設備顯示紅色, 副線路掉線設備顯示棕色,全掉線顯示灰色;
    • 通過自動切換監(jiān)視IP,實現(xiàn)對設備不間斷的故障、性能等監(jiān)控。