應(yīng)用運(yùn)維管理概述
應(yīng)用運(yùn)維管理(Application Operations Management,簡(jiǎn)稱AOM)是云上應(yīng)用的一站式立體化運(yùn)維管理平臺(tái),提供一站式可觀測(cè)性分析和自動(dòng)化運(yùn)維方案,支持快速?gòu)脑贫?、本地采集指?biāo)、日志和性能數(shù)據(jù),幫助用戶及時(shí)發(fā)現(xiàn)故障,全面掌握應(yīng)用、資源及業(yè)務(wù)的實(shí)時(shí)運(yùn)行狀況,提升企業(yè)海量運(yùn)維的自動(dòng)化能力和效率。
回到舊版
進(jìn)入AOM 2.0任意頁(yè)面,在右上角單擊“返回舊版”,即可跳轉(zhuǎn)至AOM 1.0的相關(guān)功能服務(wù)界面,AOM 1.0的相關(guān)操作請(qǐng)參見(jiàn)AOM 1.0用戶指南。
升級(jí)AOM
進(jìn)入AOM 2.0任意頁(yè)面,在右上角單擊“AOM 2.0升級(jí)指引”,即可參考相關(guān)指引將AOM 1.0 的數(shù)據(jù)遷移至AOM 2.0 ,具體操作請(qǐng)參見(jiàn)“升級(jí)AOM”。
權(quán)限設(shè)置
進(jìn)入AOM 2.0任意頁(yè)面,在右上角單擊,為當(dāng)前用戶統(tǒng)一授予云服務(wù)數(shù)據(jù)的訪問(wèn)權(quán)限和API調(diào)用權(quán)限,具體操作請(qǐng)參見(jiàn)“權(quán)限設(shè)置”。
企業(yè)項(xiàng)目
一個(gè)企業(yè)項(xiàng)目可以包含一個(gè)或者多個(gè)應(yīng)用,當(dāng)前該功能僅對(duì)應(yīng)用資源管理和監(jiān)控中心相關(guān)操作開(kāi)放。
進(jìn)入AOM 2.0 “應(yīng)用資源管理”或“監(jiān)控中心”的任意頁(yè)面,在菜單欄“全部企業(yè)項(xiàng)目”的下拉列表中,根據(jù)需要選擇企業(yè)項(xiàng)目。
功能說(shuō)明
|
類別
|
說(shuō)明
|
|---|---|
總覽 |
以應(yīng)用視角和容器視角提供常用服務(wù)或功能快速入口,實(shí)時(shí)監(jiān)控并展示重點(diǎn)資源或應(yīng)用數(shù)據(jù)。 |
應(yīng)用資源管理 |
作為AOM的應(yīng)用資源管理中心,打破傳統(tǒng)ITIL流程中面向基礎(chǔ)資源各服務(wù)、應(yīng)用各自為政、互相割裂的方式,將所有華為云上的資源對(duì)象與應(yīng)用統(tǒng)一管理,并設(shè)置關(guān)聯(lián),為AOM上層運(yùn)維場(chǎng)景服務(wù)提供準(zhǔn)確、及時(shí)、一致的資源配置數(shù)據(jù)。 |
監(jiān)控中心 |
作為AOM的一站式監(jiān)控平臺(tái),提供從資源數(shù)據(jù)發(fā)現(xiàn)、資源數(shù)據(jù)展示到數(shù)據(jù)異常告警的全方位、可視化監(jiān)控服務(wù),可應(yīng)用于ECS、RDS、CCE等云產(chǎn)品的可觀測(cè)性分析。 |
自動(dòng)化運(yùn)維 |
作為AOM的自動(dòng)化運(yùn)維平臺(tái),提供從運(yùn)維任務(wù)創(chuàng)建、觸發(fā)到審批的端到端自動(dòng)化運(yùn)維服務(wù),可應(yīng)用于ECS、RDS、CCE等云產(chǎn)品的運(yùn)維管理。 |
采集管理 |
作為AOM的采集管理平臺(tái),完成統(tǒng)一插件生命周期管理,并為AOM提供指令下發(fā)功能,如腳本下發(fā)和執(zhí)行。UniAgent自身不提供數(shù)據(jù)采集能力,運(yùn)維數(shù)據(jù)由不同的插件分工采集。 |
應(yīng)用運(yùn)維管理的優(yōu)勢(shì)
運(yùn)維中心
集中管理云監(jiān)控、云日志、性能、Prometheus等多維度可觀測(cè)性數(shù)據(jù)源,提供統(tǒng)一監(jiān)控與分析。
雙視角
應(yīng)用視角基于CMDB為復(fù)雜應(yīng)用提供可觀測(cè)性分析能力,容器視角實(shí)現(xiàn)Kubernetes云原生用戶短、平、快容器洞察。
自動(dòng)化運(yùn)維
支持定時(shí)、周期和告警觸發(fā)系統(tǒng)變更,提供批量主機(jī)下發(fā)腳本作業(yè)、批量定時(shí)開(kāi)關(guān)機(jī)等運(yùn)維操作。
告警降噪
提供分組、抑制和靜默等告警降噪策略,在發(fā)送告警通知前按告警降噪規(guī)則對(duì)告警進(jìn)行處理,從容應(yīng)對(duì)海量告警風(fēng)暴。
應(yīng)用運(yùn)維管理產(chǎn)品功能
統(tǒng)一監(jiān)控大盤
AOM作為可觀測(cè)性分析平臺(tái),集中管理日志、性能和指標(biāo)數(shù)據(jù),通過(guò)接入云日志、云監(jiān)控、APM應(yīng)用性能、prometheus指標(biāo)等數(shù)據(jù)源,您可將其按照應(yīng)用等維度添加至同一個(gè)儀表盤中集中呈現(xiàn)。
應(yīng)用資源管理
您可自定義應(yīng)用與資源模型多層級(jí)樹型關(guān)系,即應(yīng)用CMDB樹,提供應(yīng)用、子應(yīng)用、組件和環(huán)境多級(jí)模型,管理復(fù)雜應(yīng)用,支持將容器工作負(fù)載添加至CMDB樹中。應(yīng)用環(huán)境提供部署依賴的云資源實(shí)例,包括ECS/CCE/RDS/DCS/DMS等,您可建立與應(yīng)用依賴的資源關(guān)系,實(shí)現(xiàn)應(yīng)用與資源的聯(lián)動(dòng)分析、報(bào)表統(tǒng)計(jì)和權(quán)限管理。
容器洞察
無(wú)縫對(duì)接華為云CCE云容器引擎,基于原生Kubernetes容器和集群模型,提供可觀測(cè)性分析,用戶可通過(guò)Cluster、Namespace、Deployment、POD和Container進(jìn)行逐步運(yùn)維分析,包括Prometheus監(jiān)控、日志和性能管理等;支持將Promethues服務(wù)器遠(yuǎn)程接入(Remote-Write)到AOM服務(wù),您可通過(guò)PromQL查詢?cè)笜?biāo)并配置告警。
變更管理
當(dāng)您需要批量下發(fā)作業(yè)時(shí),可通過(guò)自定義作業(yè)腳本,批量選擇應(yīng)用關(guān)聯(lián)的ECS主機(jī)實(shí)例,一鍵下發(fā)即可。AOM提供Shell、Python、Bat和PowerShell四種常用IDE編輯腳本,并支持高危命令和審批流程避免越權(quán)操作。除此之外,提供云服務(wù)的變更操作,包括啟停ECS、RDS、軟件部署、清理磁盤等常用變更場(chǎng)景。