Algorithm Powers Innovation
算法驅(qū)動創(chuàng)新
Algorithm Powers Innovation
算法驅(qū)動創(chuàng)新
校園招聘
華為云業(yè)務(wù)快速增長,算法需求不斷增加,特開放以下崗位,歡迎有識之士加入算法創(chuàng)新Lab。
有意向的同學請發(fā)送簡歷到招聘郵箱AlgInnovLab@huawei.com,我們將盡快聯(lián)系您。
崗位
工作地點
工作職責
技能要求
備注
昇騰算子工程師
上海、西安、深圳、北京
1. 充分利用NPU硬件結(jié)構(gòu)設(shè)計以及網(wǎng)絡(luò)模型結(jié)構(gòu),使用多核流水并行、內(nèi)存管理優(yōu)化、算子融合等關(guān)鍵技術(shù),構(gòu)建高性能、低時延、低消耗cube、vector基礎(chǔ)&融合算子,使能大模型性能提升
2. 參與面向下一代算子相關(guān)自動化工具、自動化平臺等設(shè)計與開發(fā)。
1、計算機、軟件、電子信息類等相關(guān)專業(yè)本科及以上學歷,編程基礎(chǔ)扎實。????????????????????????
2. 具有C/C++編程經(jīng)驗。
2. 了解AI網(wǎng)絡(luò)模型和AI算子基礎(chǔ)知識,如Flashattention、AllToAll、融合算子、量化算子等。
3. 了解昇騰AI處理器基礎(chǔ)知識。
4. 工作認真負責。有偏硬件特別是芯片的編程經(jīng)驗者優(yōu)先。
相關(guān)項目:
大模型訓練工程師
上海、西安、深圳、北京
1.探索新型大模型架構(gòu)及其預(yù)訓練、后訓練、模型微調(diào)等技術(shù),提升大模型在復雜場景下的泛化能力和訓練性能。
2.優(yōu)化訓練吞吐量,通過并行策略、算子融合、通信優(yōu)化、計算-通信重疊、顯存優(yōu)化等方法提升集群利用率,加快模型吞吐,降低訓練成本。
3.持續(xù)跟蹤如MoE架構(gòu)、長序列、混合精度訓練等前沿方向,輸出新算法洞察與創(chuàng)新IDEA。
1、計算機、軟件、人工智能等相關(guān)專業(yè)本科及以上學歷,編程基礎(chǔ)扎實。
2、熟悉常見的AI網(wǎng)絡(luò)模型結(jié)構(gòu)、如Deepseek,Transformer底層原理。
3、熟悉常用的深度學習框架,如Pytorch/DeepSpeed/Megatron/Colossal-AI等分布式框架者優(yōu)先,有實際大模型、AIGC模型落地經(jīng)驗者優(yōu)先。
4、有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。
相關(guān)項目:
大模型推理工程師
上海、西安、深圳、北京
1. 參與全場景AI推理框架的架構(gòu)設(shè)計、技術(shù)選型、關(guān)鍵技術(shù)研究及核心代碼開發(fā)工作
2. 參與并行分布式策略、高性能算子、小型化工具(量化、稀疏、剪枝)、高性能代碼自動生成相關(guān)設(shè)計與開發(fā)工作,提升模型壓縮與推理性能
3. 參與分布式推理、異構(gòu)并行推理的設(shè)計和調(diào)優(yōu)、開發(fā),實現(xiàn)大模型推理的性能和擴展性領(lǐng)先和項目落地
1、計算機、軟件等相關(guān)專業(yè)本科及以上學歷,編程基礎(chǔ)扎實。??????????????????????????????????????
2、掌握常用的深度學習框架,如Pytorch、MindSpore、Tensorflow等優(yōu)先,有CV/NLP/機器學習等落地經(jīng)驗者優(yōu)先。
3、掌握Python/C/C++/Java/Go任意一種編程語言,熟悉分布式、微服務(wù)、數(shù)據(jù)庫等技術(shù)。
4、掌握LLM、AIGC相關(guān)落地經(jīng)驗、有大模型部署、推理、微調(diào)、增訓、評測、量化等經(jīng)驗,熟悉vllm/TGI者優(yōu)先。
5、熟悉deepspeed/tensor-llm/ascendspeed等加速庫者優(yōu)先。
6. 有良好的學習能力和英文文獻閱讀能力,能夠與團隊良好合作溝通,工作積極主動。
相關(guān)項目:
軟件研發(fā)工程師
上海、西安、深圳、北京
1、分布式訓練框架開發(fā):設(shè)計基于GPU/NPU集群的大規(guī)模并行訓練架構(gòu),優(yōu)化數(shù)據(jù)/模型/流水線并行策略,實現(xiàn)千卡級資源利用率突破(如Horovod/DeepSpeed深度定制)。
2、高性能計算優(yōu)化:開發(fā)算子級加速庫(CUDA/TensorRT),突破內(nèi)存墻/通信瓶頸,針對LLM/Vision模型優(yōu)化計算圖編譯與顯存復用策略。
3、推理引擎架構(gòu)設(shè)計:構(gòu)建低延遲服務(wù)框架,實現(xiàn)動態(tài)批處理、模型切片、量化蒸餾等生產(chǎn)級部署方案,支持萬億參數(shù)模型毫秒級響應(yīng)。
1、計算機、軟件等相關(guān)專業(yè)本科及以上學歷,編程基礎(chǔ)扎實。????????????????????????
2、熟練掌握java/python/C/go等編程語言一種或多種,理解并熟練應(yīng)用常見設(shè)計模式。
3、 有分布式訓練框架,推理引擎框架設(shè)計開發(fā)經(jīng)驗者優(yōu)先。
4、對開源社區(qū)廣泛運用的軟件源碼熟悉,或有貢獻者優(yōu)先。
5、ICPC/CCPC競賽獲獎?wù)?,或熟悉AI算法,或熟悉運籌優(yōu)化算法等優(yōu)先。
AI算法工程師
上海、西安、深圳、北京
1、 通過算法技術(shù)創(chuàng)新,不斷突破業(yè)界領(lǐng)先指標,協(xié)同軟件技術(shù)創(chuàng)新,構(gòu)筑算法競爭力。
2、 持續(xù)輸出新算法洞察,創(chuàng)新IDEA,領(lǐng)先算法設(shè)計,突破性算法技術(shù),Clean Code高質(zhì)量代碼等。
3、算法技術(shù)創(chuàng)新領(lǐng)域包括計算機算法與數(shù)據(jù)結(jié)構(gòu)、大模型設(shè)計、大模型訓練推理、機器學習、數(shù)據(jù)挖掘、存儲算法等,通過算法解決云服務(wù)分布式大規(guī)模場景下的各種挑戰(zhàn)。并能與軟件引擎融合創(chuàng)新,構(gòu)筑競爭力。
1、計算機、應(yīng)用數(shù)學、統(tǒng)計、人工智能等相關(guān)專業(yè)本科及以上學歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、精通如下一種或幾種技能,機器學習、強化學習、深度學習、壓縮算法、緩存算法、組合優(yōu)化、整數(shù)/線性規(guī)劃等。
4、ICPC/CCPC/數(shù)模競賽等獲獎?wù)邇?yōu)先,有相關(guān)專利和學術(shù)期刊或會議論文發(fā)表者優(yōu)先。
AI Agent研發(fā)工程師
上海、西安、深圳、北京
1、復雜決策算法設(shè)計:構(gòu)建基于強化學習、規(guī)劃推理的多模態(tài)Agent框架,解決動態(tài)環(huán)境中的長周期任務(wù)分解與協(xié)同優(yōu)化問題,需平衡實時性與泛化性。
2、系統(tǒng)工程化落地:實現(xiàn)大規(guī)模訓練/推理框架的高效部署,解決多模塊(感知、決策、執(zhí)行)的端到端協(xié)同及資源調(diào)度瓶頸,保障低延遲、高可靠生產(chǎn)級運行。
3、未知場景泛化突破:通過元學習、因果推理等技術(shù)提升Agent對未見過業(yè)務(wù)場景的快速適應(yīng)能力,突破數(shù)據(jù)/規(guī)則邊界,需融合領(lǐng)域知識建模與零樣本遷移技術(shù)。
1、計算機、應(yīng)用數(shù)學、統(tǒng)計、人工智能等相關(guān)專業(yè)本科及以上學歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、熟悉掌握業(yè)界AIAgent的開發(fā)框架,如LangChain, llamaindex,AutoGen, QwenAgent等其中一種或多種。
相關(guān)項目:
1、AI智能體
AI編譯器研發(fā)工程師
上海、西安、深圳、北京
1、參與AI編譯器的設(shè)計與開發(fā),優(yōu)化AI模型在昇騰硬件的編譯與部署效率。
2、研究LLVM、MLIR等編譯器框架,構(gòu)建高性能算子自動生成、圖優(yōu)化、內(nèi)存優(yōu)化等技術(shù)方案
3、與算法團隊合作設(shè)計編譯友好的大模型架構(gòu),推動MoE、混合精度訓練等技術(shù)的編譯器級支持
4、探索AI與編譯技術(shù)的結(jié)合方向(如自動并行化、動態(tài)shape優(yōu)化、稀疏計算加速等)
1、計算機/人工智能/電子工程/數(shù)學等相關(guān)專業(yè)本科及以上學歷。
2、熟練掌握Python/C/C++/Java/Go等編程語言一種或多種。
3、深入理解大模型技術(shù)棧(Megatron/DeepSpeed/ColossalAI),熟悉LLM訓練/推理的顯存與算力瓶頸。
4、熟悉GPU/昇騰NPU結(jié)構(gòu),了解LLVM/MLIR/TVM/Triton等AI編譯器經(jīng)驗者優(yōu)先。