高端招聘
誠邀業(yè)界專家加盟云存儲(chǔ)創(chuàng)新Lab,帶領(lǐng)團(tuán)隊(duì)持續(xù)突破創(chuàng)新,攜手華為云乘風(fēng)破浪,直掛云帆,打造全新一代云技術(shù)生態(tài)系統(tǒng)。
崗位
工作地點(diǎn)
崗位職能
首席技術(shù)專家&技術(shù)規(guī)劃專家
首席技術(shù)專家&技術(shù)規(guī)劃專家
深圳、上海、成都
首席技術(shù)專家&技術(shù)規(guī)劃專家
1、負(fù)責(zé)云存儲(chǔ)創(chuàng)新Lab產(chǎn)品和技術(shù)規(guī)劃,洞察產(chǎn)業(yè)動(dòng)態(tài)和技術(shù)發(fā)展趨勢,制定技術(shù)戰(zhàn)略,負(fù)責(zé)創(chuàng)新項(xiàng)目生命管理周期。
2、負(fù)責(zé)云存儲(chǔ)創(chuàng)新Lab重大技術(shù)項(xiàng)目,核心方案設(shè)計(jì)和關(guān)鍵技術(shù)突破,對項(xiàng)目競爭力和業(yè)務(wù)成功負(fù)責(zé)。
天才少年/博士招聘
天才少年、博士可應(yīng)聘下列崗位,不同級別在技能等級上有不同要求
崗位
工作地點(diǎn)
崗位職能
任職要求
AI Infra高級工程師
AI Infra高級工程師
深圳、上海、成都
AI Infra高級工程師
基于CloudMatrix384超節(jié)點(diǎn),完成下一代跨集群/AZ以及Serverless訓(xùn)推架構(gòu)創(chuàng)新和關(guān)鍵技術(shù)突破,為AI訓(xùn)推提供高性能云基礎(chǔ)設(shè)施,構(gòu)筑華為云全棧AI訓(xùn)練和推理系統(tǒng)競爭力,引領(lǐng)云的技術(shù)發(fā)展,加快普惠AI進(jìn)程。
1、軟硬協(xié)同等系統(tǒng)級優(yōu)化,打造CloudMatrix384超節(jié)點(diǎn)硬件親和極致性能的矩陣計(jì)算算子、高性能網(wǎng)絡(luò)通信算子、網(wǎng)算融合算子,發(fā)揮極致CloudMatrix384超節(jié)點(diǎn)硬件優(yōu)勢;
2、下一代跨集群/AZ以及Serverless訓(xùn)推架構(gòu)創(chuàng)新,基于最小的算子原子組成,打造樂高式的編排引擎,多層次的尋優(yōu)實(shí)現(xiàn)高性能的pipeline編排,實(shí)現(xiàn)主流模型的快速適配與性能優(yōu)化;
3、通過系統(tǒng)架構(gòu)層面、協(xié)議層面技術(shù)優(yōu)化和突破,減少繞行,減少網(wǎng)關(guān),減少轉(zhuǎn)換,提升性能,降低成本;應(yīng)用與網(wǎng)絡(luò)協(xié)同設(shè)計(jì),結(jié)合模型特征,掩藏長距面臨網(wǎng)絡(luò)時(shí)延等要求,實(shí)現(xiàn)抗弱網(wǎng)、抗擁塞算法等確定性網(wǎng)絡(luò)傳輸技術(shù);
4、面向?yàn)锳I訓(xùn)推提供高性能云基礎(chǔ)設(shè)施,實(shí)現(xiàn)大模型跨集群/AZ和跨異構(gòu)卡大規(guī)模訓(xùn)練、訓(xùn)推協(xié)同,打破數(shù)據(jù)中心的“資源孤島”,參與規(guī)劃、設(shè)計(jì)和重構(gòu)下一代云基礎(chǔ)設(shè)施;
5、面向應(yīng)用、租戶需求,研究大模型高速集群網(wǎng)絡(luò)資源調(diào)度系統(tǒng),提供優(yōu)化連接,保證應(yīng)用體驗(yàn);研究方向包括集群內(nèi)/間異構(gòu)資源高性能動(dòng)態(tài)互聯(lián),多租戶隔離;多網(wǎng)元管控復(fù)雜度屏蔽;通過系統(tǒng)級調(diào)度保證整體可靠性、可用性等。
AI Infra高級工程師
1、計(jì)算機(jī)科學(xué)、人工智能、分布式系統(tǒng)等相關(guān)專業(yè);
2、熟悉大規(guī)模分布式計(jì)算、并行計(jì)算相關(guān)算法及框架;具備扎實(shí)的系統(tǒng)、算法和編程基礎(chǔ);
3、具備扎實(shí)的系統(tǒng)、算法和編程基礎(chǔ);
4、熟悉常見的網(wǎng)絡(luò)協(xié)議和AI高性能網(wǎng)絡(luò)協(xié)議,有相關(guān)的網(wǎng)絡(luò)性能優(yōu)化研究有大規(guī)模AI集群、異構(gòu)網(wǎng)絡(luò)的通信算子優(yōu)化、異構(gòu)NPU卡的均衡優(yōu)化等工程經(jīng)驗(yàn)優(yōu)先;
5、有開闊的視野,能夠快速吸收業(yè)界新技術(shù),有挑戰(zhàn)精神敢于做的更好,腳踏實(shí)地解決現(xiàn)實(shí)問題。
AI Infra高性能研發(fā)高級工程師
AI Infra高性能研發(fā)高級工程師
深圳、上海、成都
AI Infra高性能研發(fā)高級工程師
1、設(shè)計(jì)并落地大模型推理集群調(diào)度、彈性伸縮與資源隔離方案;
2、設(shè)計(jì)并優(yōu)化推理框架;
3、設(shè)計(jì)并優(yōu)化推理高階特型比如PD分離、KV-Cache管理、序列并行/專家并行;
4、設(shè)計(jì)并優(yōu)化面向華為CloudMatrix AI超節(jié)點(diǎn)的推理優(yōu)化技術(shù)點(diǎn)。
AI Infra高性能研發(fā)高級工程師
1、計(jì)算機(jī)科學(xué)、人工智能、分布式系統(tǒng)等相關(guān)專業(yè),有頂會(huì)最佳論文,ICPC等頂級競賽金牌優(yōu)先;
2、深度理解CUDA/Ascend kernel、通信協(xié)議(NCCL/HCCl/RDMA)與GPU/NPU內(nèi)存層次結(jié)構(gòu);
3、熟悉vLLM、TensorRT-LLM、Triton或自研推理框架的源碼與調(diào)優(yōu)方法;
4、良好的代碼能力(C++/Python),樂于推進(jìn)跨團(tuán)隊(duì)協(xié)作。
AI算法高級工程師
AI算法高級工程師
深圳、上海、成都
AI算法高級工程師
1、負(fù)責(zé)LLM、SFT、RLHF、DPO等后訓(xùn)練流水線與自動(dòng)化調(diào)參平臺(tái);
2、負(fù)責(zé)分布式加載、梯度累計(jì)、Checkpoint管理的系統(tǒng)優(yōu)化;
3、負(fù)責(zé)設(shè)計(jì)面向華為CloudMatrix AI超節(jié)點(diǎn)的后訓(xùn)練系統(tǒng)方案。
AI算法高級工程師
1、計(jì)算機(jī)科學(xué)、人工智能、分布式系統(tǒng)等相關(guān)專業(yè),有頂會(huì)最佳論文,ICPC等頂級競賽金牌優(yōu)先;
2、熟悉DeepSpeed ZeRO、Megatron-LM、Flash-Attention等核心算法與實(shí)現(xiàn);
3、理解PPO、ReFT、DPO等RL流程,對Reward Model/Actor/Critic有實(shí)戰(zhàn)經(jīng)驗(yàn);
4、良好的代碼能力(C++/Python),樂于推進(jìn)跨團(tuán)隊(duì)協(xié)作。
校園招聘
研究生、本科生、實(shí)習(xí)生均可應(yīng)聘下列崗位,不同級別在技能等級上有不同要求
崗位
工作地點(diǎn)
崗位職能
任職要求
分布式存儲(chǔ)研發(fā)工程師 & 大數(shù)據(jù)開發(fā)工程師
分布式存儲(chǔ)研發(fā)工程師 & 大數(shù)據(jù)開發(fā)工程師
深圳、上海、成都
分布式存儲(chǔ)研發(fā)工程師 & 大數(shù)據(jù)開發(fā)工程師
1、負(fù)責(zé)云計(jì)算分布式存儲(chǔ)領(lǐng)域系統(tǒng)技術(shù)方案的設(shè)計(jì)、開發(fā)等工作。
2、負(fù)責(zé)項(xiàng)目開發(fā)過程中的技術(shù)攻關(guān)及解決運(yùn)行中出現(xiàn)的技術(shù)問題。
3、負(fù)責(zé)產(chǎn)品核心模塊的代碼編寫以及協(xié)助測試人員完成模塊測試。
4、探索云服務(wù)化實(shí)現(xiàn)的前沿技術(shù),并負(fù)責(zé)華為云大數(shù)據(jù)服務(wù)的架構(gòu)設(shè)計(jì)、開發(fā)、測試及運(yùn)維。
分布式存儲(chǔ)研發(fā)工程師 & 大數(shù)據(jù)開發(fā)工程師
1、計(jì)算機(jī)、軟件相關(guān)專業(yè)本科及以上學(xué)歷,熟悉常用算法和數(shù)據(jù)結(jié)構(gòu),熟悉網(wǎng)絡(luò)編程,多線程編程技術(shù)等;
2、有軟件開發(fā)項(xiàng)目經(jīng)驗(yàn),并至少熟練掌握以下語言中的一種:C/C++/Python/等編程語言及腳本語言;
3、熟悉分布式系統(tǒng)設(shè)計(jì)原理,有分布式存儲(chǔ)系統(tǒng)開發(fā)以及應(yīng)用大數(shù)據(jù)組件的實(shí)戰(zhàn)經(jīng)驗(yàn)者優(yōu)先;
4、具備團(tuán)隊(duì)意識(shí),與他人合作良好,最好具有團(tuán)隊(duì)協(xié)作的經(jīng)驗(yàn)。
AI軟件開發(fā)工程師
AI軟件開發(fā)工程師
深圳、上海、成都
AI軟件開發(fā)工程師
1、負(fù)責(zé)AI領(lǐng)域的軟件工程化和產(chǎn)品開發(fā)。
2、負(fù)責(zé)AI算法及系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn),包括但不限于:路徑規(guī)劃、智能決策、推薦系統(tǒng)、大模型、生成式AI等。
3、負(fù)責(zé)產(chǎn)品的集成和調(diào)測,以及各類工具鏈的開發(fā)。
4、負(fù)責(zé)對外洞察AI領(lǐng)域最新趨勢,包括但不限于:大模型,生成式AI,AI for coding等。
AI軟件開發(fā)工程師
1、計(jì)算機(jī)相關(guān)專業(yè),獨(dú)立承擔(dān)過關(guān)鍵子模塊的開發(fā)工作,熟練運(yùn)用至少一門編程語言(C/C++ /Python等)。
2、熟悉Tensorflow/MindSpore/pytorch等主流深度學(xué)習(xí)框架的使用,具備AI算法開發(fā)及應(yīng)用經(jīng)驗(yàn)者優(yōu)先。
3、深入理解計(jì)算機(jī)系統(tǒng)架構(gòu)與操作系統(tǒng),熟練掌握異構(gòu)計(jì)算平臺(tái)原理和典型硬件加速器的使用方法,熟練運(yùn)用并發(fā)編程和底層調(diào)試,熟悉Linux/ROS。
4、針對算法特點(diǎn)與芯片硬件特點(diǎn)設(shè)計(jì)最佳算法實(shí)現(xiàn)方式并優(yōu)化部署或者有數(shù)據(jù)分析、挖掘、建模等方面的背景優(yōu)先。