大模型應(yīng)用工程師
面議
北京
應(yīng)屆畢業(yè)生
學(xué)歷不限
北京
應(yīng)屆畢業(yè)生
學(xué)歷不限
- 全勤獎(jiǎng)
- 節(jié)日福利
- 不加班
- 周末雙休
職位描述
該職位還未進(jìn)行加V認(rèn)證,請(qǐng)仔細(xì)了解后再進(jìn)行投遞!
1. 碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)、數(shù)據(jù)科學(xué)或相關(guān)專(zhuān)業(yè)背景。
2. 具備扎實(shí)的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)理論基礎(chǔ),熟悉 Transformer 架構(gòu)、注意力機(jī)制和預(yù)訓(xùn)練范式。
3. 至少 2 年以上大規(guī)模模型研發(fā)經(jīng)驗(yàn),熟悉 PyTorch、DeepSpeed、Megatron-LM、vLLM 等主流訓(xùn)練/推理框架。
4. 具備大規(guī)模分布式訓(xùn)練調(diào)優(yōu)經(jīng)驗(yàn),能夠獨(dú)立設(shè)計(jì)高效的分布式訓(xùn)練策略,解決 GPU 集群資源利用與性能瓶頸問(wèn)題。
5. 熟練掌握至少一種大語(yǔ)言模型微調(diào)技術(shù)(LoRA、P-Tuning、RLHF、DPO 等),有實(shí)際落地案例。
6. 具備將復(fù)雜業(yè)務(wù)需求抽象為模型問(wèn)題并提出創(chuàng)新性解決方案的能力。
1、大模型研發(fā)與優(yōu)化:負(fù)責(zé)預(yù)訓(xùn)練語(yǔ)言模型的研發(fā)與優(yōu)化,包括參數(shù)規(guī)模在百億級(jí)以上的 Transformer 類(lèi)模型;探索混合專(zhuān)家(MoE)、長(zhǎng)上下文(Long-Context)、稀疏注意力等前沿架構(gòu)提升推理與訓(xùn)練效率。
2、模型訓(xùn)練與微調(diào):針對(duì)不同業(yè)務(wù)場(chǎng)景,開(kāi)展大規(guī)模語(yǔ)料預(yù)訓(xùn)練、指令微調(diào)(Instruction Tuning)、偏好對(duì)齊(RLHF、DPO 等)和低成本高效微調(diào)(LoRA、QLoRA、P-Tuning 等),提高模型在垂直領(lǐng)域的表現(xiàn)。
3、性能與部署優(yōu)化:研究并實(shí)現(xiàn)分布式訓(xùn)練(如 ZeRO、FSDP、DeepSpeed、Megatron-LM)、模型并行與推理加速(vLLM、TensorRT-LLM、FlashAttention),降低 GPU 內(nèi)存消耗與推理時(shí)延。
4、工程落地:與平臺(tái)團(tuán)隊(duì)協(xié)作,提供模型推理服務(wù) API,封裝高性能 SDK,支持多端調(diào)用(Web/移動(dòng)端);負(fù)責(zé)大模型在知識(shí)圖譜、搜索推薦、對(duì)話系統(tǒng)等場(chǎng)景的落地與優(yōu)化。
5、前沿探索:跟蹤 LLM、Multimodal、RAG(檢索增強(qiáng)生成)、Agent 框架以及模型安全性(安全對(duì)齊、防幻覺(jué))領(lǐng)域的最新進(jìn)展,推動(dòng)大模型與知識(shí)圖譜、圖神經(jīng)網(wǎng)絡(luò)等技術(shù)結(jié)合。
2. 具備扎實(shí)的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)理論基礎(chǔ),熟悉 Transformer 架構(gòu)、注意力機(jī)制和預(yù)訓(xùn)練范式。
3. 至少 2 年以上大規(guī)模模型研發(fā)經(jīng)驗(yàn),熟悉 PyTorch、DeepSpeed、Megatron-LM、vLLM 等主流訓(xùn)練/推理框架。
4. 具備大規(guī)模分布式訓(xùn)練調(diào)優(yōu)經(jīng)驗(yàn),能夠獨(dú)立設(shè)計(jì)高效的分布式訓(xùn)練策略,解決 GPU 集群資源利用與性能瓶頸問(wèn)題。
5. 熟練掌握至少一種大語(yǔ)言模型微調(diào)技術(shù)(LoRA、P-Tuning、RLHF、DPO 等),有實(shí)際落地案例。
6. 具備將復(fù)雜業(yè)務(wù)需求抽象為模型問(wèn)題并提出創(chuàng)新性解決方案的能力。
1、大模型研發(fā)與優(yōu)化:負(fù)責(zé)預(yù)訓(xùn)練語(yǔ)言模型的研發(fā)與優(yōu)化,包括參數(shù)規(guī)模在百億級(jí)以上的 Transformer 類(lèi)模型;探索混合專(zhuān)家(MoE)、長(zhǎng)上下文(Long-Context)、稀疏注意力等前沿架構(gòu)提升推理與訓(xùn)練效率。
2、模型訓(xùn)練與微調(diào):針對(duì)不同業(yè)務(wù)場(chǎng)景,開(kāi)展大規(guī)模語(yǔ)料預(yù)訓(xùn)練、指令微調(diào)(Instruction Tuning)、偏好對(duì)齊(RLHF、DPO 等)和低成本高效微調(diào)(LoRA、QLoRA、P-Tuning 等),提高模型在垂直領(lǐng)域的表現(xiàn)。
3、性能與部署優(yōu)化:研究并實(shí)現(xiàn)分布式訓(xùn)練(如 ZeRO、FSDP、DeepSpeed、Megatron-LM)、模型并行與推理加速(vLLM、TensorRT-LLM、FlashAttention),降低 GPU 內(nèi)存消耗與推理時(shí)延。
4、工程落地:與平臺(tái)團(tuán)隊(duì)協(xié)作,提供模型推理服務(wù) API,封裝高性能 SDK,支持多端調(diào)用(Web/移動(dòng)端);負(fù)責(zé)大模型在知識(shí)圖譜、搜索推薦、對(duì)話系統(tǒng)等場(chǎng)景的落地與優(yōu)化。
5、前沿探索:跟蹤 LLM、Multimodal、RAG(檢索增強(qiáng)生成)、Agent 框架以及模型安全性(安全對(duì)齊、防幻覺(jué))領(lǐng)域的最新進(jìn)展,推動(dòng)大模型與知識(shí)圖譜、圖神經(jīng)網(wǎng)絡(luò)等技術(shù)結(jié)合。
工作地點(diǎn)
地址:北京石景山區(qū)中國(guó)電科智能科技園北京石景山區(qū)中國(guó)電科智能科技園
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請(qǐng)求職者務(wù)必提高警惕。
職位發(fā)布者
Jerr..HR
科銳爾人力資源服務(wù)(蘇州)有限公司
-
零售業(yè)
-
500-999人
-
國(guó)內(nèi)上市公司
-
新理想大廈
相似職位
-
渠道經(jīng)理(政府關(guān)系)——成都 10000-20000元應(yīng)屆畢業(yè)生 本科北京小桔科技有限公司
-
招生顧問(wèn) 4000-6000元2年以上 本科廣州市華美英語(yǔ)實(shí)驗(yàn)學(xué)校
-
部門(mén)調(diào)度/助理 5元以上應(yīng)屆畢業(yè)生 本科成都盟升電子技術(shù)股份有限公司
-
PCBA采購(gòu)開(kāi)發(fā)專(zhuān)家(J15099) 面議應(yīng)屆畢業(yè)生 本科深南電路股份有限公司
-
?行政人事專(zhuān)員(成都) 面議應(yīng)屆畢業(yè)生 不限中國(guó)人壽保險(xiǎn)股份有限公司成都市分公司
-
住院照護(hù)管理(護(hù)理 ) 面議應(yīng)屆畢業(yè)生 不限成都樂(lè)于健康護(hù)理有限公司
2026-01-24 02:49:51
1878人關(guān)注
注:聯(lián)系我時(shí),請(qǐng)說(shuō)是在四川人才網(wǎng)上看到的。
