研究方向
研究方向
負責混合云基礎(chǔ)服務(wù)計算、網(wǎng)絡(luò)競爭力構(gòu)建。突破混合云下一代計算和網(wǎng)絡(luò)關(guān)鍵技術(shù),使能跨云跨池網(wǎng)絡(luò)流量安全治理,數(shù)據(jù)快速平穩(wěn)流轉(zhuǎn)、極致算力調(diào)度,大幅提升全棧云資源利用率,聯(lián)合高校、周邊Lab等組織開展計算、網(wǎng)絡(luò)領(lǐng)域合作創(chuàng)新,構(gòu)建差異化競爭力。
對海量云上資源監(jiān)控數(shù)據(jù)進行ML建模分析,通過模型訓練建立云上負載特征模型,孵化基于資源使用趨勢和特征的智能決策系統(tǒng)。根據(jù)不同應(yīng)用場景,對算法進行優(yōu)化,支撐資源調(diào)度系統(tǒng)完成全局資源優(yōu)化。
針對混合云場景應(yīng)用多樣、集群龐大、資源負載低等特點,構(gòu)建新一代算力智能調(diào)度系統(tǒng)。關(guān)注資源統(tǒng)一、應(yīng)用QoS、實例間干擾、業(yè)務(wù)特征等深層次影響資源使用效率的問題,進行相關(guān)關(guān)鍵技術(shù)的突破,實現(xiàn)資源高效利用。
在多云多池場景下,面向應(yīng)用構(gòu)筑全域網(wǎng)絡(luò),支持應(yīng)用無感自動互聯(lián),簡化服務(wù)到服務(wù)的連接、安全和可觀測,支撐全域應(yīng)用發(fā)布和跨區(qū)域流動。
負責混合云領(lǐng)域全棧運維競爭力構(gòu)建。從數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)分析、數(shù)據(jù)決策維度持續(xù)優(yōu)化運維能力,突破非侵入可觀測、統(tǒng)一監(jiān)控模型、日志/時序異常檢測、基于OpsLLM智能根因診斷等關(guān)鍵技術(shù),實現(xiàn)混合云全棧運維,支持故障1分鐘發(fā)現(xiàn),5分鐘定界,10分鐘恢復(fù)。
結(jié)合eBPF和JavaAgent技術(shù),兼容開源生態(tài),構(gòu)建高性能、低成本、無侵入的數(shù)據(jù)采集能力,標準化混合云可觀測數(shù)據(jù)模型;孵化高效、實時、開放的可觀測平臺能力,構(gòu)建物理和邏輯全鏈路拓撲,支撐混合云全場景運維。
通過日志異常檢測算法從海量日志中識別關(guān)鍵異常點,構(gòu)建智能日志分析系統(tǒng),充分挖掘日志價值;結(jié)合時序異常檢測算法從多維度監(jiān)控指標中智能識別異常波動,支撐業(yè)務(wù)視角智能根因診斷。
構(gòu)建基于混合云專業(yè)運維文檔、歷史故障工單的大模型輔助高精度智能問答能力;針對ChatOps運維場景研究NL2API、NL2SQL技術(shù)的應(yīng)用,提升運維數(shù)據(jù)查詢體驗和效率;研究LLM輔助的智能運維多Agent協(xié)同調(diào)度技術(shù)。
負責華為云批量解決方案創(chuàng)新競爭力構(gòu)建。聚焦模型驅(qū)動站點/云服務(wù)生命周期管理,基于MBSE建模理論,以開發(fā)者集成體驗為中心,持續(xù)沉淀批量交付能力,實現(xiàn)站點數(shù)字孿生技術(shù),支持海量站點信息持續(xù)運營與演進。
面對站點、云服務(wù)、底層硬件等規(guī)模日益增大,復(fù)雜度不斷增加的云系統(tǒng),基于仿真和數(shù)字孿生技術(shù),解決站點收編不可視、升級變更不可靠、環(huán)境不可視、組合驗證場景多等問題,提升站點治理能力及環(huán)境獲取和使用的SLA,實現(xiàn)站點/云服務(wù)生命周期的高效管理,環(huán)境的批量管理和復(fù)制能力。
為了提升復(fù)雜云系統(tǒng)的穩(wěn)定性、可靠性、效率和智能化程度,引入MBSE對云系統(tǒng)分層建模,構(gòu)建全面模型庫,通過仿真等方式驗證模型的正確性。結(jié)合數(shù)字孿生技術(shù),實現(xiàn)實時數(shù)據(jù)同步、健康監(jiān)控、預(yù)測故障、智能決策等,提升云系統(tǒng)的可用性。
-
基礎(chǔ)設(shè)施
負責混合云基礎(chǔ)服務(wù)計算、網(wǎng)絡(luò)競爭力構(gòu)建。突破混合云網(wǎng)絡(luò)和數(shù)據(jù)邊界,使能跨云跨池網(wǎng)絡(luò)流量安全治理,數(shù)據(jù)快速平穩(wěn)流轉(zhuǎn)、極致算力調(diào)度,大幅提升全棧云資源利用率,聯(lián)合高校、周邊Lab等組織開展計算、網(wǎng)絡(luò)領(lǐng)域合作創(chuàng)新,構(gòu)建差異化競爭力。
-
智能運維
負責混合云領(lǐng)域全棧運維競爭力構(gòu)建。從數(shù)據(jù)采集、數(shù)據(jù)治理、數(shù)據(jù)分析、數(shù)據(jù)決策維度持續(xù)優(yōu)化運維能力,突破非侵入可觀測、統(tǒng)一監(jiān)控模型、日志/時序異常檢測、基于OpsLLM智能根因診斷等關(guān)鍵技術(shù),實現(xiàn)混合云全棧運維,支持故障1分鐘發(fā)現(xiàn),5分鐘定界,10分鐘恢復(fù)。
-
系統(tǒng)工程
負責華為云批量解決方案創(chuàng)新競爭力構(gòu)建。聚焦模型驅(qū)動站點/云服務(wù)生命周期管理,基于MBSE建模理論,以開發(fā)者集成體驗為中心,持續(xù)沉淀批量交付能力,實現(xiàn)站點數(shù)字孿生技術(shù),支持海量站點信息持續(xù)運營與演進。