期待懷揣夢想的你
加入我們,構(gòu)筑華為云計(jì)算與網(wǎng)絡(luò)的極致競爭力
長期開放崗位
社招、高端招聘均可應(yīng)聘下列崗位,不同級(jí)別在年限和技能等級(jí)上有不同要求
崗位名稱
工作地點(diǎn)
崗位職責(zé)
技能要求
云網(wǎng)絡(luò)高級(jí)研發(fā)工程師
北京/上海
1、負(fù)責(zé)大規(guī)模、高可用云網(wǎng)絡(luò)的創(chuàng)新研究工作,如Netwoking for AI、網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)、網(wǎng)絡(luò)性能優(yōu)化、網(wǎng)絡(luò)控制器算法、網(wǎng)絡(luò)智能運(yùn)維算法、網(wǎng)絡(luò)云服務(wù)孵化等工作;
2、具體研究解決云定義自動(dòng)駕駛網(wǎng)絡(luò)中一個(gè)或多個(gè)關(guān)鍵問題:
a、研究基于全網(wǎng)可編程設(shè)備的下一代自治網(wǎng)絡(luò),新型網(wǎng)絡(luò)具備實(shí)時(shí)流感知、無損擁塞控制、在網(wǎng)計(jì)算多租戶共享等核心能力;
b、研究面向AI大模型訓(xùn)練和推理的下一代云網(wǎng)絡(luò)(通信庫、協(xié)議、網(wǎng)絡(luò)功能和光電拓?fù)浼軜?gòu);
c、研究如何利用數(shù)據(jù)和知識(shí)快速感知故障、定位問題和自愈;
d、研究如何基于網(wǎng)絡(luò)意圖和網(wǎng)絡(luò)仿真進(jìn)行事前網(wǎng)絡(luò)驗(yàn)證。
1、具有面向AI大模型訓(xùn)練和推理的下一代云網(wǎng)絡(luò)(通信庫、協(xié)議、網(wǎng)絡(luò)功能和光電拓?fù)浼軜?gòu))的研究經(jīng)驗(yàn);
2、熟悉常見的網(wǎng)絡(luò)協(xié)議和網(wǎng)絡(luò)服務(wù)、產(chǎn)品的工作原理,有相關(guān)的項(xiàng)目研究經(jīng)驗(yàn);
3、在網(wǎng)絡(luò)可擴(kuò)展性、性能、延時(shí)、可靠性、易用性、AI智能運(yùn)維等任意關(guān)鍵特性上有持續(xù)深入的研究經(jīng)驗(yàn);
4、有開闊的視野,能夠快速吸收業(yè)界新技術(shù),有挑戰(zhàn)精神敢于做的更好,腳踏實(shí)地解決現(xiàn)實(shí)問題。
物理網(wǎng)絡(luò)高級(jí)工程師
北京/上海
1、參與數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu)的創(chuàng)新,基于最新技術(shù)重構(gòu),優(yōu)化數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu),實(shí)現(xiàn)物理網(wǎng)絡(luò)和虛擬網(wǎng)絡(luò)解耦,降低數(shù)據(jù)中心網(wǎng)絡(luò)成本,支撐云上不同業(yè)務(wù)對(duì)底層基礎(chǔ)設(shè)施網(wǎng)絡(luò)的各種要求;
2、參與基礎(chǔ)設(shè)施網(wǎng)絡(luò)SDN系統(tǒng)的設(shè)計(jì)和開發(fā),基于最新技術(shù)對(duì)網(wǎng)絡(luò)的SLA進(jìn)行測量和感知,做到基礎(chǔ)設(shè)施網(wǎng)絡(luò)運(yùn)維管理的精細(xì)化,可視化、自動(dòng)化和智能化;
3、同各個(gè)業(yè)務(wù)部門緊密合作,將新技術(shù)進(jìn)行成果轉(zhuǎn)化,幫助業(yè)務(wù)部門提升競爭力。
1、熟悉路由、交換的工作原理,熟悉BGP/OSPF等常見路由協(xié)議,熟悉鏈路聚合、VLAN、二/三層轉(zhuǎn)發(fā)等概念和原理;
2、熟悉SDN相關(guān)技術(shù),最好有SDN相關(guān)系統(tǒng)的開發(fā)經(jīng)驗(yàn),有基礎(chǔ)設(shè)施網(wǎng)絡(luò)管控系統(tǒng)開發(fā)經(jīng)驗(yàn)者優(yōu)先;
3、熟悉數(shù)據(jù)中心網(wǎng)絡(luò)架構(gòu),具備一定的網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)能力,有數(shù)據(jù)中心光網(wǎng)絡(luò)經(jīng)驗(yàn)者優(yōu)先;
4、有網(wǎng)絡(luò)測量、故障診斷,流量調(diào)度經(jīng)驗(yàn)者優(yōu)先。
資源調(diào)度高級(jí)研發(fā)工程師
北京/上海
1、負(fù)責(zé)華為云數(shù)據(jù)中心資源管理調(diào)度的創(chuàng)新研究,為客戶提供極致性價(jià)比、穩(wěn)定、易用的云資源服務(wù);
2、參與資源管理端到端的優(yōu)化設(shè)計(jì),從資源規(guī)劃、資源池配置、資源調(diào)度、動(dòng)態(tài)調(diào)整等各個(gè)階段提升資源利用率;
3、通過數(shù)據(jù)的AI分析,挖掘資源使用的規(guī)律和趨勢,制定對(duì)應(yīng)的調(diào)度策略,實(shí)現(xiàn)削峰填谷;
4、通過軟硬件聯(lián)合優(yōu)化手段,實(shí)現(xiàn)更優(yōu)的性能以及QoS保障;
5、負(fù)責(zé)創(chuàng)新的資源產(chǎn)品和解決方案設(shè)計(jì)開發(fā),跟蹤業(yè)界前沿趨勢,引入創(chuàng)新技術(shù),推動(dòng)產(chǎn)品技術(shù)創(chuàng)新。
1、熟練使用Java/Python/Go語言的一種或多種進(jìn)行開發(fā),熟悉該語言的基礎(chǔ)框架和原理;
2、熟悉linux操作系統(tǒng),以及常用命令,包括虛擬化、容器相關(guān)的cgroup、namespace等;
3、有分布式系統(tǒng)設(shè)計(jì)開發(fā)經(jīng)驗(yàn),熟練掌握并發(fā)編程調(diào)試、緩存、消息中間件等機(jī)制;
4、優(yōu)秀的表達(dá)、溝通能力以及團(tuán)隊(duì)協(xié)作能力;
5、熟悉業(yè)界主要資源管理調(diào)度系統(tǒng)OpenStack/Yarn/Mesos/Kubernetes等的架構(gòu)、關(guān)鍵技術(shù)、使用場景、優(yōu)劣勢等;有大規(guī)模集群資源管理系統(tǒng)架構(gòu)設(shè)計(jì)、開發(fā)實(shí)戰(zhàn)經(jīng)驗(yàn)者優(yōu)先;
6、熟悉數(shù)據(jù)中心集群資源規(guī)劃、部署,了解異構(gòu)硬件和多種計(jì)算業(yè)務(wù)者優(yōu)先。
虛擬化高級(jí)研發(fā)工程師
北京/上海
1、負(fù)責(zé)Linux內(nèi)核、虛擬化、容器等創(chuàng)新研究,構(gòu)建更適合云原生應(yīng)用的OS和虛擬化技術(shù);
2、參與虛擬化平臺(tái)的定制化需求開發(fā),解決在Linux內(nèi)核、虛擬化平臺(tái)上遇到的性能和QoS保障問題;
3、參與新型硬件、異構(gòu)硬件等虛擬化適配;
4、跟蹤業(yè)界前沿趨勢,引入創(chuàng)新技術(shù),推動(dòng)產(chǎn)品技術(shù)創(chuàng)新。
1、3年以上Linux內(nèi)核/虛擬化或相關(guān)開發(fā)經(jīng)驗(yàn),熟悉云計(jì)算基本架構(gòu)和原理,對(duì)云計(jì)算底層技術(shù)架構(gòu)和虛擬化解決方案有較深的研究;
2、深入理解虛擬化的架構(gòu)和工作原理, 熟悉KVM/Xen原理,掌握VirtIO、SRIOV基礎(chǔ)知識(shí),有CPU/Memory/IO等虛擬化開發(fā)及調(diào)試經(jīng)驗(yàn)。至少有一個(gè)虛擬化領(lǐng)域?qū)>?,如設(shè)備直通、VirtIO、熱遷移等;
3、精通編程語言,算法、數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)良好,精通內(nèi)核態(tài)編程, 并參與、主導(dǎo)或獨(dú)立完成過底層模塊研發(fā)。至少有一個(gè)Linux Kernel核心子系統(tǒng)專精,如內(nèi)存管理,文件系統(tǒng),網(wǎng)絡(luò),進(jìn)程調(diào)度,Cgroup等;
4、精通Linux內(nèi)核和虛擬化問題的分析定位,性能持續(xù)調(diào)優(yōu);
5、有新硬件的內(nèi)核/虛擬化適配項(xiàng)目經(jīng)驗(yàn)者優(yōu)先,可以獨(dú)立完成內(nèi)核驅(qū)動(dòng)、虛擬化功能的適配開發(fā)。
網(wǎng)絡(luò)大腦高級(jí)研發(fā)工程師
北京/上海
1、基于華為公有云海量網(wǎng)絡(luò)數(shù)據(jù),利用AI技術(shù)提升華為云運(yùn)維平臺(tái)的智能化、自動(dòng)化運(yùn)行;
2、打通從故障預(yù)警、故障告警、告警聚合到故障處理和用戶極致體驗(yàn)的智能決策系統(tǒng)的全棧開發(fā);
3、基于性能容量的預(yù)警和流量智能調(diào)度,保障用戶LSA。
1、精通常見網(wǎng)絡(luò)協(xié)議,熟悉網(wǎng)絡(luò)路由轉(zhuǎn)發(fā)原理,具備3-5年以上網(wǎng)絡(luò)模塊相關(guān)研發(fā)運(yùn)維經(jīng)驗(yàn);
2、3-5年系統(tǒng)架構(gòu)設(shè)計(jì)、開發(fā)、運(yùn)維的經(jīng)驗(yàn);熟悉Java、C或Go語言及相關(guān)組件和系統(tǒng);
3、有豐富的運(yùn)維開發(fā)經(jīng)驗(yàn),在異常檢測、故障診斷和自愈、網(wǎng)絡(luò)可視化方向有成功實(shí)踐者優(yōu)先;
4、熟悉常見的網(wǎng)絡(luò)監(jiān)控?cái)?shù)據(jù),了解各個(gè)指標(biāo)的影響面,有運(yùn)用多維關(guān)聯(lián)分析經(jīng)驗(yàn)優(yōu)先。
網(wǎng)絡(luò)大腦專家
北京/上海
1、負(fù)責(zé)下一代華為云網(wǎng)絡(luò)智能運(yùn)維系統(tǒng)的規(guī)劃和設(shè)計(jì)工作,用軟件和AI打造極致運(yùn)維效率的公有云網(wǎng)絡(luò),保障客戶實(shí)時(shí)在線;
2、理解內(nèi)部運(yùn)維團(tuán)隊(duì)和云客戶對(duì)網(wǎng)絡(luò)運(yùn)維的需求,設(shè)計(jì)和建設(shè)完善的監(jiān)控/告警/定位/決策/隔離/恢復(fù)等系統(tǒng);
3、與學(xué)術(shù)界和工業(yè)界頂尖人才開展技術(shù)合作,利用業(yè)界的力量攻克關(guān)鍵難題,洞察關(guān)鍵技術(shù)創(chuàng)新機(jī)會(huì)。
1、具備大型網(wǎng)絡(luò)實(shí)際運(yùn)維系統(tǒng)設(shè)計(jì)和研發(fā)經(jīng)驗(yàn);
2、熟悉了解數(shù)據(jù)中心/骨干網(wǎng)/虛擬網(wǎng)絡(luò)架構(gòu)和相關(guān)的網(wǎng)絡(luò)協(xié)議者優(yōu)先;
3、具備較強(qiáng)的AI算法能力,有AI應(yīng)用于網(wǎng)絡(luò)運(yùn)維領(lǐng)域設(shè)計(jì)和研發(fā)經(jīng)驗(yàn)者優(yōu)先;
4、具備業(yè)界Top公有云廠商網(wǎng)絡(luò)AIOps領(lǐng)域經(jīng)驗(yàn)者優(yōu)先。
天才少年、博士后、博士招聘崗位
崗位名稱
工作地點(diǎn)
研究方向
崗位職責(zé)
崗位要求
大模型系統(tǒng)分布式框架研究工程師(博士、天少)
北京/上海
大模型/MOE/AI基礎(chǔ)設(shè)施/AI系統(tǒng)相關(guān)研究
面向?yàn)锳I訓(xùn)推提供高性能云基礎(chǔ)設(shè)施,實(shí)現(xiàn)大模型跨集群/AZ和跨異構(gòu)卡大規(guī)模訓(xùn)練、訓(xùn)推協(xié)同,打破數(shù)據(jù)中心的“資源孤島”,規(guī)劃、設(shè)計(jì)和重構(gòu)下一代云基礎(chǔ)設(shè)施,主要存在以下幾方面挑戰(zhàn):
1、 如何解決異構(gòu)網(wǎng)絡(luò)和異構(gòu)NPU卡聯(lián)合訓(xùn)練時(shí)的異構(gòu)網(wǎng)絡(luò)的通信算子優(yōu)化、異構(gòu)NPU卡的均衡優(yōu)化等問題,實(shí)現(xiàn)算子、通信、系統(tǒng)端到端協(xié)同優(yōu)化,存在挑戰(zhàn)
2、 如何通過軟硬協(xié)同等系統(tǒng)級(jí)優(yōu)化,打造極致性能的矩陣計(jì)算算子、高性能網(wǎng)絡(luò)通信算子、網(wǎng)算融合算子,實(shí)現(xiàn)基于最小的算子原子組成,打造樂高式的編排引擎,多層次的尋優(yōu)實(shí)現(xiàn)高性能的pipeline編排,實(shí)現(xiàn)主流模型的快速適配與性能優(yōu)化,存在挑戰(zhàn)
3、 大規(guī)模的AI訓(xùn)練集群需要跨AZ的低時(shí)延網(wǎng)絡(luò)通信、高速和確定性傳輸,如何通過系統(tǒng)架構(gòu)層面、協(xié)議層面技術(shù)優(yōu)化和突破,減少繞行,減少網(wǎng)關(guān),減少轉(zhuǎn)換,提升性能,降低成本;如何進(jìn)行應(yīng)用與網(wǎng)絡(luò)協(xié)同設(shè)計(jì),結(jié)合模型特征,掩藏長距面臨網(wǎng)絡(luò)時(shí)延等要求,實(shí)現(xiàn)抗弱網(wǎng)、抗擁塞算法等確定性網(wǎng)絡(luò)傳輸技術(shù),存在挑戰(zhàn)
1、計(jì)算機(jī)科學(xué)、人工智能、分布式系統(tǒng)等相關(guān)專業(yè);
2、熟悉大規(guī)模分布式計(jì)算、并行計(jì)算相關(guān)算法及框架;
3、具備扎實(shí)的系統(tǒng)、算法和編程基礎(chǔ);
4、熟悉常見的網(wǎng)絡(luò)協(xié)議和AI高性能網(wǎng)絡(luò)協(xié)議,有相關(guān)的網(wǎng)絡(luò)性能優(yōu)化研究有大規(guī)模AI集群、異構(gòu)網(wǎng)絡(luò)的通信算子優(yōu)化、異構(gòu)NPU卡的均衡優(yōu)化等工程經(jīng)驗(yàn)優(yōu)先;
5、有開闊的視野,能夠快速吸收業(yè)界新技術(shù),有挑戰(zhàn)精神敢于做的更好,腳踏實(shí)地解決現(xiàn)實(shí)問題
大模型基礎(chǔ)設(shè)施研究員(博士后)
上海
大模型/MOE/AI基礎(chǔ)設(shè)施/AI系統(tǒng)相關(guān)研究
1、研究面向大模型訓(xùn)練和推理的下一代云網(wǎng)絡(luò)(通信算子庫、高性能傳輸協(xié)議、網(wǎng)絡(luò)功能和光電拓?fù)洌┫到y(tǒng)架構(gòu)和高性能網(wǎng)絡(luò)傳輸協(xié)議設(shè)計(jì),打造高帶寬、低時(shí)延、確定性的網(wǎng)絡(luò)傳輸?shù)鬃?,?gòu)建跨集群、數(shù)據(jù)中心、地域的超大規(guī)模AI訓(xùn)練集群,構(gòu)筑TOP級(jí)的業(yè)界競爭力;
2、面向下一代云基礎(chǔ)設(shè)施,打造極致性能的矩陣計(jì)算算子、高性能網(wǎng)絡(luò)通信算子、網(wǎng)算融合算子;基于最小的算子原子組成,打造樂高式的編排引擎,多層次的尋優(yōu)實(shí)現(xiàn)高性能的pipeline編排,實(shí)現(xiàn)主流模型的快速適配與性能優(yōu)化
3、識(shí)別彈性無損訓(xùn)練、異構(gòu)網(wǎng)絡(luò)、異構(gòu)NPU卡的聯(lián)合訓(xùn)練的核心問題,并能創(chuàng)新性的提出關(guān)鍵技術(shù)優(yōu)化思路;通過AI技術(shù)趨勢洞察、AI框架與系統(tǒng)優(yōu)化、網(wǎng)算協(xié)同等技術(shù),實(shí)現(xiàn)昇騰云系統(tǒng)端到端協(xié)同優(yōu)化
1、計(jì)算機(jī)科學(xué)、人工智能、分布式系統(tǒng)等相關(guān)專業(yè);
2、熟悉大規(guī)模分布式計(jì)算、并行計(jì)算相關(guān)算法及框架;
3、具備扎實(shí)的系統(tǒng)、算法和編程基礎(chǔ);
4、熟悉常見的網(wǎng)絡(luò)協(xié)議和AI高性能網(wǎng)絡(luò)協(xié)議,有相關(guān)的網(wǎng)絡(luò)性能優(yōu)化研究有大規(guī)模AI集群、異構(gòu)網(wǎng)絡(luò)的通信算子優(yōu)化、異構(gòu)NPU卡的均衡優(yōu)化等工程經(jīng)驗(yàn)優(yōu)先;
5、有開闊的視野,能夠快速吸收業(yè)界新技術(shù),有挑戰(zhàn)精神敢于做的更好,腳踏實(shí)地解決現(xiàn)實(shí)問題
校招、實(shí)習(xí)生招聘崗位
崗位名稱
工作地點(diǎn)
崗位職責(zé)
技能要求
軟件開發(fā)工程師
北京/上海
1、負(fù)責(zé)公有云計(jì)算、網(wǎng)絡(luò)的創(chuàng)新技術(shù)項(xiàng)目研發(fā),完成業(yè)界最新技術(shù)的探索與產(chǎn)品轉(zhuǎn)化,涵蓋新服務(wù)孵化,原有服務(wù)架構(gòu)升級(jí),性能優(yōu)化等多個(gè)方面;
2、跟蹤洞察業(yè)界最新技術(shù)發(fā)展方向,完成技術(shù)分析與原型驗(yàn)證相關(guān)工作。
1、熟練使用Python/Java/C/C++/Go等語言中一種及以上者優(yōu)先;
2、熟悉TCP/IP等常見網(wǎng)絡(luò)協(xié)議,熟悉網(wǎng)絡(luò)路由轉(zhuǎn)發(fā)原理,具備網(wǎng)絡(luò)知識(shí)基礎(chǔ)者優(yōu)先;
3、具有計(jì)算、網(wǎng)絡(luò)、虛擬化、云計(jì)算、資源調(diào)度、Linux內(nèi)核等一種及以上知識(shí)者優(yōu)先;
4、有較強(qiáng)求知欲,具備良好學(xué)習(xí)能力者優(yōu)先。
AI工程師
北京/上海
1、對(duì)海量云上資源監(jiān)控?cái)?shù)據(jù)進(jìn)行ML建模分析,通過離線訓(xùn)練建立云上負(fù)載特征模型,提供線上系統(tǒng)基于這些資源使用趨勢和特征做出合理的決策;
2、通過機(jī)器學(xué)習(xí)方法動(dòng)態(tài)感知網(wǎng)絡(luò)故障和質(zhì)量變化,主動(dòng)繞過擁塞鏈路及優(yōu)化用戶公網(wǎng)訪問路徑;
3、對(duì)海量的網(wǎng)絡(luò)運(yùn)維KPI、日志等原始數(shù)據(jù),通過大數(shù)據(jù)平臺(tái)結(jié)合AI算法,實(shí)現(xiàn)網(wǎng)絡(luò)故障的及時(shí)發(fā)現(xiàn),對(duì)資源類的指標(biāo)通過算法預(yù)測,做到故障預(yù)警,保障網(wǎng)路高可用的達(dá)成;
4、負(fù)責(zé)網(wǎng)絡(luò)數(shù)字孿生化,算法支撐網(wǎng)絡(luò)異常判斷、根因分析、自動(dòng)化變更;
5、從運(yùn)維流程、產(chǎn)品手冊、故障手冊提取運(yùn)維知識(shí);
6、結(jié)合用戶請求數(shù)據(jù)規(guī)律分析,優(yōu)化資源調(diào)度策略,通過分支定界、強(qiáng)化學(xué)習(xí)等技術(shù)能力提升公有云資源利用率。
1、熟悉機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、運(yùn)籌優(yōu)化、AIOps、知識(shí)圖譜、數(shù)據(jù)挖掘、NLP中一種及以上者優(yōu)先;
2、熟悉Hadoop\Spark\Tensorflow\Pytorch中一種及以上者優(yōu)先;
3、有較強(qiáng)求知欲,具備良好學(xué)習(xí)能力者優(yōu)先。