职位详情
微信扫码分享
投诉
岗位职责:
1、参与或主导智能计算平台的全栈架构规划与设计。根据多样化芯片架构及集群规模,制定整体技术方案,支撑千卡/万卡级集群在高并发、低延迟、弹性扩展等方面的业务需求。
2、负责系统性能调优与稳定性增强,持续提升集群资源利用率与运行效能,强化技术领先优势。
3、关注前沿科技动态,推进先进技术在实际场景中的落地实施,并积极参与相关行业标准的研讨与制定。
任职要求:
1、具备5年以上云计算、AI基础架构方向的架构设计与开发经验,涵盖大规模集群调度、高性能网络通信、高效存储系统等领域;
2、熟练掌握C/Java/Python/Go中至少一门编程语言;
3、理解GPU架构、网络协议、存储机制、Kubernetes系统原理,熟悉大模型训练与推理的技术基础;
4、具有复杂分布式系统架构设计与工程实现经验者优先,具备大规模智算平台建设经验者优先;
5、具备良好的团队协作、跨部门沟通能力与逻辑分析能力,善于应对复杂问题,富有攻坚克难的热情;
6、熟悉行业主流实践与发展动向,具备一定的技术前瞻性判断力。
备注:持有阿里云ACA/ACP/ACE认证者优先

方先生IP:浙江杭州
3日内活跃|
阿里云计算有限公司
相关推荐查看更多 >
杭州

