职位详情
微信扫码分享
投诉
工作内容:
1.负责大模型推理框架的性能调优及相关功能的验证测试,涵盖vLLM、SGLang、TensorRT等主流技术栈
2.针对特定硬件平台,对常用计算与通信算子进行深度性能剖析与优化,包括flashattention、flashmla、flashinfer、megakernel、deepep等关键组件
3.优化多机多卡场景下的并行算法,涉及数据并行(dp)、张量并行(tp)、专家并行(ep)、序列并行(sp)等典型策略
任职要求:
1.掌握cuda编程模型,具备tensorcore相关技术理解能力
2.熟悉主流大语言模型架构,如qwen、deepseek等典型代表
3.具备实际的算子级优化经验或高性能计算(hpc)背景者优先
ps:
1.岗位聚焦工程落地与系统构建,非科研性质
2.不强制坐班打卡,强调目标达成,欢迎有志于AI基础设施建设的同学加入
3.当前仅开放深圳岗位编制
4.非集团直属实习生(属合作方岗位),但所承担工作职责一致

江先生IP:四川成都
今日活跃|
阿里云计算有限公司
相关推荐查看更多 >
深圳
相同职位推荐
企业招聘

