華為云計(jì)算 云知識(shí) 華為云發(fā)布全??捎^測(cè)平臺(tái)AOM,以AI賦能應(yīng)用運(yùn)維可觀測(cè)
華為云發(fā)布全棧可觀測(cè)平臺(tái)AOM,以AI賦能應(yīng)用運(yùn)維可觀測(cè)

9月19日,華為全聯(lián)接大會(huì)2024舉辦期間,在“AI賦能應(yīng)用現(xiàn)代化,加速軟件生產(chǎn)力躍升”為主題的論壇上,華為云發(fā)布全棧可觀測(cè)平臺(tái) AOM ,以AI賦能應(yīng)用運(yùn)維可觀測(cè),提升企業(yè)應(yīng)用可用性與穩(wěn)定性。

該平臺(tái)發(fā)布標(biāo)志著華為云在推動(dòng)數(shù)字化轉(zhuǎn)型和智能化運(yùn)維領(lǐng)域的又一重大突破,全棧可觀測(cè)平臺(tái)的推出不僅為企業(yè)提供了更加全面和深入的系統(tǒng)監(jiān)控和數(shù)據(jù)分析能力,還通過(guò)集成先進(jìn)的人工智能技術(shù),實(shí)現(xiàn)了對(duì)復(fù)雜應(yīng)用環(huán)境的實(shí)時(shí)優(yōu)化和問(wèn)題預(yù)警。

應(yīng)用運(yùn)維管理 (Application Operations Management,簡(jiǎn)稱AOM)是云上應(yīng)用一站式可觀測(cè)性分析平臺(tái),基于四層指標(biāo)體系(業(yè)務(wù)層指標(biāo)、應(yīng)用層指標(biāo)、中間件層指標(biāo)、基礎(chǔ)設(shè)施層),提供指標(biāo)、日志、調(diào)用鏈3類數(shù)據(jù)關(guān)聯(lián)分析、根因分析、場(chǎng)景化分析等可觀測(cè)分析能力,全面掌握應(yīng)用、資源實(shí)時(shí)運(yùn)行狀況,及時(shí)發(fā)現(xiàn)故障。

華為云AOM主要能力

全場(chǎng)景數(shù)據(jù)接入,統(tǒng)一監(jiān)控大盤(pán)與告警管理:統(tǒng)一接入中心實(shí)現(xiàn)4層指標(biāo)體系數(shù)據(jù)上報(bào),提供可視化圖表統(tǒng)一匯總呈現(xiàn)指標(biāo)、日志信息,統(tǒng)一告警規(guī)則配置、開(kāi)箱即用告警模板以及智能告警降噪。

全鏈路調(diào)用鏈分析,智能化代碼級(jí)剖析Profiling:支持調(diào)用鏈路時(shí)序圖,直觀展示W(wǎng)eb端、App端到后端服務(wù)、 數(shù)據(jù)庫(kù) 、中間件鏈路關(guān)系,用戶一站式定位故障鏈路,快速發(fā)現(xiàn)消耗資源的代碼,定位CPU、內(nèi)存、時(shí)延性能問(wèn)題。

容器監(jiān)控體系洞察:支持集群維度、核心插件、節(jié)點(diǎn)、負(fù)載、外部5大檢測(cè)維度、16個(gè)巡檢場(chǎng)景、49個(gè)檢測(cè)項(xiàng)診斷,實(shí)施掌握容器健康狀態(tài)。

海量日志引擎:自主創(chuàng)新的高性能搜索引擎,存算分離架構(gòu),多租戶共享海量彈性計(jì)算資源,實(shí)現(xiàn)百億級(jí)日志3秒內(nèi)返回搜索結(jié)果,提供日志結(jié)構(gòu)化解析組合編排、高性能SQL分析、一站式日志加工等能力。

華為云PaaS服務(wù)產(chǎn)品部部長(zhǎng)徐峰對(duì)AIOps領(lǐng)域的發(fā)展做了系統(tǒng)性的規(guī)劃與展望,未來(lái)AIOps將是小模型與大模型結(jié)合使用,小模型聚焦故障感知定位解決量化確定性問(wèn)題,大模型面向故障修復(fù)決策提升運(yùn)維輔助人效,從AI故障感知、AI故障定位、AI生成故障修復(fù)建議三個(gè)方面構(gòu)筑未來(lái)智能可觀測(cè)產(chǎn)品力。

故障感知:通過(guò)多維指標(biāo)智能聚合與故障預(yù)測(cè)算法,面向AnyStack與AnyWhere數(shù)據(jù)實(shí)時(shí)分析,實(shí)現(xiàn)應(yīng)用故障1分鐘及時(shí)發(fā)現(xiàn)。

故障定位:通過(guò)告警相關(guān)性分析、水平&垂直關(guān)聯(lián)分析能力實(shí)現(xiàn)場(chǎng)景化根因分析,5分鐘完成故障定位診斷。

故障決策與修復(fù):生成式算法結(jié)合華為SRE運(yùn)維經(jīng)驗(yàn)和案例庫(kù),覆蓋應(yīng)用到資源各類場(chǎng)景問(wèn)題的解決方案,提供精準(zhǔn)修復(fù)建議,10分鐘完成應(yīng)用故障修復(fù)閉環(huán)。

會(huì)上,上海松鼠云上人工智能技術(shù)有限公司(簡(jiǎn)稱松鼠AI)技術(shù)VP劉海濤分享了松鼠AI基于華為云AOM在智慧教育領(lǐng)域的實(shí)踐。

松鼠AI基于華為云AOM構(gòu)建Ai智適應(yīng)學(xué)習(xí)系統(tǒng)一站式可觀測(cè)性分析能力,融合指標(biāo)、日志、調(diào)用鏈3類數(shù)據(jù),實(shí)時(shí)掌握應(yīng)用健康狀態(tài),通過(guò)數(shù)據(jù)關(guān)聯(lián)、根因診斷、場(chǎng)景化分析等可觀測(cè)能力,做到應(yīng)用運(yùn)維問(wèn)題早發(fā)現(xiàn)早消除,全面保證Ai智適應(yīng)學(xué)習(xí)系統(tǒng)的健康、平穩(wěn)運(yùn)轉(zhuǎn)。

未來(lái),華為云應(yīng)用運(yùn)維管理AOM將持續(xù)聚焦可觀測(cè)領(lǐng)域,利用AI賦能應(yīng)用智能可觀測(cè),推動(dòng)數(shù)字化轉(zhuǎn)型和智能化升級(jí),面向用戶提供更高效、精準(zhǔn)的監(jiān)控和分析解決方案,通過(guò)智能化的數(shù)據(jù)處理和分析能力,為客戶提供全方位的系統(tǒng)洞察,在復(fù)雜的業(yè)務(wù)環(huán)境中快速識(shí)別潛在風(fēng)險(xiǎn),優(yōu)化操作流程,提升業(yè)務(wù)效益,顯著降低運(yùn)維成本。