研究領域
-
大模型彈性推理與算子優(yōu)化
彈性推理是在動態(tài)環(huán)境中進行推理計算,能夠適應資源的變化和故障,保證推理服務的穩(wěn)定性和可靠性。彈性推理研究聚焦于:動態(tài)成員管理,允許推理節(jié)點加入或離開,保證推理服務的連續(xù)性。狀態(tài)一致性,保證所有節(jié)點共享一致狀態(tài),即使發(fā)生節(jié)點故障/加入。通信算子優(yōu)化,通過拓撲感知、內(nèi)建可觀測能力,充分利用網(wǎng)絡帶寬,提高通信效率。計算算子優(yōu)化,通過Tilling策略優(yōu)化,zero-copy等技術提高計算效率。利用多流、異步下發(fā)機制實現(xiàn)計算與通信重疊,提高推理效率。
-
云網(wǎng)絡系統(tǒng)架構優(yōu)化
圍繞業(yè)務重點需求與核心痛點,對云網(wǎng)絡系統(tǒng)中的局部組件或整體架構進行優(yōu)化重構,涵蓋云網(wǎng)關,虛擬交換機,虛擬網(wǎng)絡控制器等各云網(wǎng)絡組件。當前正在投入云網(wǎng)關平臺化架構的研究探索。
-
網(wǎng)絡云服務創(chuàng)新孵化
設計孵化新網(wǎng)絡服務或原有網(wǎng)絡服務的新特性,以滿足客戶提出或自主識別的大顆粒關鍵功能訴求。
-
網(wǎng)絡測量
研究廣域網(wǎng)QoS的探測、表征以及故障定位和定界;研究方向包括通過主動測量、被動測量以及主動和被動相結合的方式。
-
流量調度和優(yōu)化
通過動態(tài)感知網(wǎng)絡故障,主動繞過擁塞鏈路,降低用戶服務中斷時間;通過感知網(wǎng)絡質量變化,主動優(yōu)化用戶公網(wǎng)訪問路徑,解決錯綜復雜的運營商互聯(lián)帶來的網(wǎng)絡路由不優(yōu)和質量惡化問題。
-
網(wǎng)絡異常檢測
對海量的網(wǎng)絡運維KPI、日志等原始數(shù)據(jù),通過大數(shù)據(jù)平臺結合AI算法,實現(xiàn)網(wǎng)絡故障的及時發(fā)現(xiàn),對資源類的指標通過算法預測,做到故障預警,保障網(wǎng)路高可用的達成。
-
網(wǎng)絡決策
通過故障大盤,收集網(wǎng)絡的拓撲、服務關系、告警、事件以及設備狀態(tài)信息,智能的決策故障的影響有多大,根因組件在哪,并根據(jù)歷史知識學習,推薦解決方案,邁出網(wǎng)絡自動駕駛的重要一步。
-
網(wǎng)絡數(shù)字孿生
通過模型和圖數(shù)據(jù)庫,將網(wǎng)絡的拓撲、配置信息、版本信息、服務、指標依賴關系管理起來,并提供多種查詢和知識挖掘的能力,支撐網(wǎng)絡異常判斷、根因分析、自動化變更的實現(xiàn)。
-
Regionless
采用Regionless架構,我們可以讓應用自動地運行在多個地區(qū)數(shù)據(jù)中心中,并利用不同地區(qū)基礎設施的優(yōu)勢來提高應用程序的運行效率。其中,Regionless編程框架支持應用程序的SLA分發(fā);Regionless數(shù)據(jù)服務支持應用狀態(tài)的跨地區(qū)流動;全球網(wǎng)絡基礎設施支持分發(fā)基礎設施的高可靠/高性價比。
-
可編程網(wǎng)絡
圍繞網(wǎng)絡操作系統(tǒng)、接口、協(xié)議、芯片等領域,研究測量、虛擬化、在網(wǎng)加速等分布式網(wǎng)絡系統(tǒng),軟硬協(xié)同,打造業(yè)務定義的可編程網(wǎng)絡,重構云網(wǎng)絡,加速計算與網(wǎng)絡創(chuàng)新,提升網(wǎng)絡性能與性價比。
-
資源智能畫像與應用
對海量云上資源監(jiān)控數(shù)據(jù)進行ML建模分析,通過離線訓練建立云上負載特征模型,提供線上系統(tǒng)基于這些資源使用趨勢和特征做出合理的決策。根據(jù)不同應用場景,對算法進行優(yōu)化,并與業(yè)務方基于智能畫像分析技術進行聯(lián)合創(chuàng)新。
-
資源管理調度系統(tǒng)
針對云上實例多樣、集群龐大、資源共享等特點,構建新一代集群資源管理調度系統(tǒng)。除了關注資源統(tǒng)一、性能問題,更關注資源利用率、實例間干擾、業(yè)務特征等深層次影響資源使用效率的問題,對此進行關鍵技術突破,實現(xiàn)閉環(huán)、高效的資源管理調度系統(tǒng)。
-
軟硬協(xié)同
結合智能網(wǎng)卡、SDI卡等硬件實現(xiàn)性能提升和管理成本節(jié)約,并在此基礎上對OS、虛擬化層在資源開銷、性能、安全等方面的優(yōu)化點。并且考慮異構計算芯片在微架構層面的不同特征,研究其對云上業(yè)務的最佳配置和匹配,最大限度優(yōu)化資源使用。