某銀行總行兩地三中心引入智和信通運(yùn)維平臺(tái),實(shí)現(xiàn)集中監(jiān)控、統(tǒng)一運(yùn)維
通過(guò)部署智和信通運(yùn)維方案該中心實(shí)現(xiàn)兩地三中心設(shè)備集中管理,當(dāng)出現(xiàn)故障時(shí)可進(jìn)行關(guān)聯(lián)分析,通過(guò)跨崗位信息聯(lián)動(dòng),為運(yùn)維人員提供更加便捷的故障分析和處置手段,在降低故障發(fā)生概率的同時(shí),在故障發(fā)生后,“早感知、快定位、急止損、優(yōu)改進(jìn)”,降低影響范圍。為日常運(yùn)維保障、高層管理決策提供支撐,助力保障業(yè)務(wù)連續(xù)性。
近年來(lái),某銀行總行中心業(yè)務(wù)持續(xù)發(fā)展,各項(xiàng)業(yè)務(wù)數(shù)量與復(fù)雜度復(fù)雜的逐年上升,信息系統(tǒng)數(shù)量增加且規(guī)模不斷擴(kuò)大,作為支撐的網(wǎng)絡(luò)設(shè)備數(shù)量逐漸增長(zhǎng)、類(lèi)型不斷增加。為保障業(yè)務(wù)連續(xù)性,其上線了各類(lèi)運(yùn)管工具,然而,現(xiàn)有運(yùn)管工具多,相互獨(dú)立,缺少關(guān)聯(lián),數(shù)據(jù)分散,導(dǎo)致工具聯(lián)動(dòng)弱、監(jiān)控處置慢、運(yùn)維效率低,且部分系統(tǒng)易用性差難以靈活擴(kuò)展、配置。因此,急需一款集中運(yùn)維監(jiān)控平臺(tái),替換老舊監(jiān)控平臺(tái),形成統(tǒng)一的運(yùn)維管理,實(shí)現(xiàn)統(tǒng)一監(jiān)控、統(tǒng)一告警、統(tǒng)一分析。
項(xiàng)目現(xiàn)狀
某銀行總行中心目前因設(shè)備類(lèi)型與品牌型號(hào)復(fù)雜,采用了多種運(yùn)管工具進(jìn)行管理,工具相互獨(dú)立,難以滿足其日益豐富的運(yùn)維需求?,F(xiàn)急促統(tǒng)一監(jiān)控運(yùn)維平臺(tái)對(duì)設(shè)備進(jìn)行集中監(jiān)控,打通數(shù)據(jù)孤島,實(shí)現(xiàn)跨團(tuán)隊(duì)數(shù)據(jù)共享及宏觀統(tǒng)一監(jiān)控。
設(shè)備類(lèi)型:Aix、Windows Server、Centos等操作系統(tǒng);DB2、MySQL、Gbase等數(shù)據(jù)庫(kù);nginx、WAS、MQ等中間庫(kù);浪潮、華三、曙光等品牌服務(wù)器;浪潮、IBM等小型機(jī);docker容器;存儲(chǔ)設(shè)備、安全設(shè)備、網(wǎng)絡(luò)設(shè)備等。
設(shè)備數(shù)量:1600+臺(tái)設(shè)備。
部署需求:兩地三中心部署。
功能需求:
- 國(guó)產(chǎn)信創(chuàng)產(chǎn)品:符合信創(chuàng)要求,自主可控;
- 集中監(jiān)控管理:提供統(tǒng)一監(jiān)控視圖,可根據(jù)使用場(chǎng)景定制不同的展示頁(yè)面,投放至大屏;
- 統(tǒng)一告警管理:支持告警規(guī)則統(tǒng)一配置,多個(gè)數(shù)據(jù)中心的告警規(guī)則可統(tǒng)一配置,支持告警統(tǒng)一顯示;
- 業(yè)務(wù)監(jiān)控運(yùn)維:提供全局視角監(jiān)測(cè)業(yè)務(wù)健康情況;
- 完善可視化:提供網(wǎng)絡(luò)結(jié)構(gòu)、鏈路關(guān)系可視化拓?fù)湔故?,?bào)表、大屏等運(yùn)維數(shù)據(jù)可視化呈現(xiàn);
- 運(yùn)維數(shù)據(jù)統(tǒng)一管理:告警數(shù)據(jù)、性能數(shù)據(jù)、配置數(shù)據(jù)等運(yùn)維數(shù)據(jù)統(tǒng)一接入、處理、存儲(chǔ)、關(guān)聯(lián)、分析等;
- 具備完善的安全措施:完善的身份認(rèn)證機(jī)制、權(quán)限控制體系、詳細(xì)的日志信息記錄等;
- 高靈活、可擴(kuò)展:系統(tǒng)具有靈活的體系結(jié)構(gòu)、良好的擴(kuò)充性;
- 支持分布式部署,實(shí)現(xiàn)異地多中心統(tǒng)一管理。
智和信通方案
經(jīng)過(guò)與某銀行總行中心運(yùn)維團(tuán)隊(duì)的深入交流和詳細(xì)需求調(diào)研,智和信通通過(guò)分布式部署的方式支撐其兩地三中心架構(gòu),在北京中心、北京災(zāi)備中心、某地分中心分別部署智和網(wǎng)管平臺(tái),同時(shí)提供容災(zāi)機(jī)制,任一中心出現(xiàn)問(wèn)題可以無(wú)縫被其他中心接管。最終實(shí)現(xiàn),運(yùn)維數(shù)據(jù)全量同步,在任意中心均可查看全部數(shù)據(jù)的同時(shí),各中心可分別管理各自下屬的設(shè)備,北京中心可以對(duì)全部設(shè)備進(jìn)行管理、查看。
兼容信創(chuàng)國(guó)產(chǎn)生態(tài),產(chǎn)品安全可控
立足于北京智和信通10年的國(guó)產(chǎn)融合經(jīng)驗(yàn),智和信通全部產(chǎn)品與國(guó)產(chǎn)軟硬件產(chǎn)品深度適配,涉及的產(chǎn)品與模塊,均由北京智和信通自主研發(fā),從功能模塊、數(shù)據(jù)庫(kù)、界面全部基于統(tǒng)一Java技術(shù)平臺(tái)和統(tǒng)一數(shù)據(jù)關(guān)系模型,不包含任何第三方功能庫(kù)。在支撐用戶構(gòu)建信創(chuàng)環(huán)境的同時(shí),也針對(duì)各類(lèi)信創(chuàng)設(shè)備、服務(wù)組件等提供相應(yīng)的運(yùn)維服務(wù),在降本增效的同時(shí),促進(jìn)政企用戶業(yè)務(wù)創(chuàng)新發(fā)展。
智能發(fā)現(xiàn)技術(shù),一鍵發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備
通過(guò)智能發(fā)現(xiàn)技術(shù),在智和網(wǎng)管平臺(tái)中用戶僅需輸入IP范圍一步操作,即可自動(dòng)完成網(wǎng)絡(luò)設(shè)備發(fā)現(xiàn)、設(shè)備類(lèi)型識(shí)別、設(shè)備鏈路發(fā)現(xiàn)、設(shè)備故障和性能采集、鏈路流量和狀態(tài)以及網(wǎng)絡(luò)拓?fù)渖?。并且在自?dòng)發(fā)現(xiàn)的過(guò)程中可以搜索到網(wǎng)絡(luò)設(shè)備,并識(shí)別設(shè)備類(lèi)型和廠商型號(hào),生成設(shè)備的面板圖或搜索設(shè)備資源,如:板卡、端口、CPU、內(nèi)存、磁盤(pán)等,并發(fā)現(xiàn)設(shè)備之間的鏈路關(guān)系。
- 網(wǎng)絡(luò)設(shè)備:華為、華三、思科、銳捷、迪普、邁普、紫光、深信服、天融信、山石、Radware、F5、啟明星辰、綠盟、Imperva等主流品牌
- 服務(wù)器硬件:華為、華三、思科、浪潮、曙光、IBM、HP、DELL、聯(lián)想等主流品牌
- 存儲(chǔ)設(shè)備:華為、浪潮、IBM、昆騰、群暉、EMC、DELL、HP、Netapp、OracleFS、宏杉、同有等主流品牌
- 操作系統(tǒng):Windows 2008R2/2012/2016/2019、CentOS 5?以上、RHEL 5?以上、Suse 11/12、UOS V20、AIX6/7
- 云&虛擬化:VMWare、阿里云、騰訊云
- 數(shù)據(jù)庫(kù):DB2、Gbase8a、InfluxDB、MongoDB、MSSQL、MySQL、Oracle、PostgreSQL、Redis、達(dá)夢(mèng)數(shù)據(jù)庫(kù)
- 中間件:Apache、Nginx、RabbitMQ、Tomcat、TongWeb、WAS、ActiveMQ、Kafka、Zookeeper
- 其他設(shè)備:支持上述標(biāo)準(zhǔn)管理協(xié)議即可完成新增兼容
自動(dòng)生產(chǎn)網(wǎng)絡(luò)拓?fù)洌W(wǎng)絡(luò)架構(gòu)可觀測(cè)
已發(fā)現(xiàn)的設(shè)備、資源、鏈路可自動(dòng)生產(chǎn)網(wǎng)絡(luò)拓?fù)洌詧D形方式整體觀測(cè),并以聲光進(jìn)行告警提醒。實(shí)時(shí)分析資源當(dāng)前性能和運(yùn)行狀態(tài),直觀反映資源的動(dòng)態(tài)變化對(duì)支撐業(yè)務(wù)的影響。同時(shí),采取統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),對(duì)整體網(wǎng)絡(luò)中的IP地址進(jìn)行梳理和管理,建立IP與MAC對(duì)應(yīng)關(guān)系庫(kù),端到端規(guī)劃、部署、管理和監(jiān)控IP地址使用情況。
海量設(shè)備集中監(jiān)控,統(tǒng)一管理
集中監(jiān)控中心的各類(lèi)設(shè)備,統(tǒng)一監(jiān)控配置和策略,獲取網(wǎng)絡(luò)設(shè)備、硬件服務(wù)器、存儲(chǔ)設(shè)備的性能運(yùn)行數(shù)據(jù)、日志事件數(shù)據(jù)、流量數(shù)據(jù)等。監(jiān)控策略根據(jù)資源類(lèi)型的不同,涵蓋狀態(tài)信息、響應(yīng)時(shí)長(zhǎng)、使用率、輸出輸入流量、輸入輸出帶寬、時(shí)延、命中率、讀寫(xiě)速度等方方面面。整個(gè)監(jiān)控指標(biāo)體系,支持完全自定義,根據(jù)設(shè)備不同應(yīng)用場(chǎng)景的不同進(jìn)行差異化配置。
全網(wǎng)告警信息集中處理,告警無(wú)延遲
全量匯聚異常告警信息,基于故障模型和AI算法分析故障原因,分析、壓縮、并歸關(guān)聯(lián)故障信息,降低故障風(fēng)暴,秒級(jí)定位故障位置,主動(dòng)出擊快速排障,故障處置全流程展示。根據(jù)各省管理權(quán)限及人員排班安排,定義告警通知策略,從系統(tǒng)內(nèi)聲光閃爍到郵件、短信通知,運(yùn)維人員第一時(shí)間獲知告警信息,排障處置責(zé)任到人。
全網(wǎng)流量透視,端到端分析流量布局
支持通過(guò)Flow流量數(shù)據(jù),提供端到端的流量監(jiān)控能力,從設(shè)備、接口、IP、服務(wù)、應(yīng)用、會(huì)話、QoS等層級(jí)的實(shí)時(shí)流量監(jiān)控和歷史流量分析,識(shí)別帶寬消耗較大的應(yīng)用程序、服務(wù)、協(xié)議或IP地址,避免網(wǎng)絡(luò)容量過(guò)載,并提升最終網(wǎng)絡(luò)體驗(yàn)。
全景業(yè)務(wù)觀測(cè),智能業(yè)務(wù)、應(yīng)用監(jiān)管
智能化、自動(dòng)化的業(yè)務(wù)監(jiān)管方案,支持可量化、可視化的技術(shù)手段,全面監(jiān)控IT業(yè)務(wù)系統(tǒng)服務(wù)的響應(yīng)性能,幫助用戶準(zhǔn)確感知整體業(yè)務(wù)的性能和質(zhì)量狀況。提供業(yè)務(wù)拓?fù)?、可用性撥測(cè)、調(diào)用鏈追蹤、業(yè)務(wù)告警、根因定位等能力。
7×24小時(shí)不間斷監(jiān)控,運(yùn)維數(shù)據(jù)大屏展示
智和網(wǎng)管平臺(tái)平臺(tái)內(nèi)置5種大屏樣式與自定義大屏能力,適配各種應(yīng)用場(chǎng)景,二十四小時(shí)不間斷監(jiān)控,細(xì)粒度可達(dá)網(wǎng)絡(luò)中每個(gè)設(shè)備、資源和鏈路。所有的網(wǎng)絡(luò)故障都一目了然地呈現(xiàn),大大降低了管理成本,同時(shí)也提高了運(yùn)維人員處理故障的能力,節(jié)省的故障處理時(shí)間,為運(yùn)維人員管理網(wǎng)絡(luò)提供了可靠的保證。
多維度權(quán)限劃分,軟件安全可靠
提供給該中心多角色管理員分權(quán)管理網(wǎng)絡(luò)能力,角色與地域權(quán)限立體化管理,使各種角度的運(yùn)維人員責(zé)權(quán)分明。對(duì)不同的管理人員分配不同的操作權(quán)限,可以對(duì)不同的管理人員分配不同的網(wǎng)絡(luò),做到粗、細(xì)粒度的權(quán)限控制,避免越權(quán)管理。同時(shí),針對(duì)危險(xiǎn)操作,能夠有良好的提示以及提供日志記錄。
二次開(kāi)發(fā)平臺(tái),具備靈活擴(kuò)展能力
二次開(kāi)發(fā)平臺(tái)在基礎(chǔ)框架、可重用組件和軟件功能之間保持隔離,既確保了快速定制又不損失組件化、架構(gòu)化特性,該中心研發(fā)人員可選中API或代碼的形式對(duì)平臺(tái)進(jìn)行二次開(kāi)發(fā),提高研發(fā)效率。同時(shí),智和信通提供全套開(kāi)發(fā)資料以及完善的培訓(xùn)服務(wù),該中心可以隨心定制出符合自身需求的運(yùn)維監(jiān)控功能。
應(yīng)用價(jià)值
通過(guò)上線智和網(wǎng)管平臺(tái)該中心實(shí)現(xiàn)兩地三中心設(shè)備集中管理,當(dāng)出現(xiàn)故障時(shí)可進(jìn)行關(guān)聯(lián)分析,通過(guò)跨崗位信息聯(lián)動(dòng),為運(yùn)維人員提供更加便捷的故障分析和處置手段,在降低故障發(fā)生概率的同時(shí),在故障發(fā)生后,“早感知、快定位、急止損、優(yōu)改進(jìn)”,降低影響范圍。為日常運(yùn)維保障、高層管理決策提供支撐,助力保障業(yè)務(wù)連續(xù)性。