职位详情
微信扫码分享
投诉
岗位描述:
1、智算基础设施部署与优化
-负责AI算力硬件(GPU/NPU集群)及PaaS平台的大规模部署、组网架构设计与性能调优(如RDMA网络优化)
-主导算力交付的可用性评估,建立性能基准指标并提出针对性优化策略
2、大模型算力选型与适配
-根据业务场景需求(如训练/推理延迟、吞吐能力、成本控制),为千亿参数级大模型(如DeepSeek67B/130B)提供算力架构建议(芯片选型/集群配置)及模型精度方案(FP8/BF16/INT8量化)
-针对主流开源模型(LLaMA、ChatGLM、DeepSeek等)开展算力层面的适配与性能提升工作
3、算力使用及性能优化
-负责提升大模型训练与推理效率,主导并参与性能优化方案的落地实施
任职要求:
1、计算机/电子工程/人工智能等相关专业,硕士及以上学历,具备3年以上AI算力基础设施建设或大模型部署调优经验
2、掌握GPU/昇腾910B等AI芯片技术特性,具有实际集群部署经验
3、具备扎实的编程能力、数据结构与算法基础,熟练使用Python或C++
4、熟悉至少一种主流深度学习框架(PyTorch/TensorFlow/Caffe)
5、有常见大模型推理框架的设计与部署经验,如vllm、SGLang、TensorRT-llm等
7、具备较强的自主学习能力、内驱力,良好的沟通协作意识,能适应高强度工作节奏

陈先生IP:宁夏银川
今日活跃|
中电信人工智能科技(北京)有限公司
相关推荐查看更多 >
喷绘设备操作员
4000-7000元/月其他技术职位经验不限高中及以上
机器人现场应用工程师
9000-10000元/月其他技术职位1-3年大专及以上
东城区
相同职位推荐
企业招聘

