职位详情
微信扫码分享
投诉
岗位职责
1、分布式训练框架开发:深度优化分布式训练框架,在性能、内存、并行策略等方面进行研究与开发,确保框架在大规模训练场景下的效率和稳定性;
2、大模型训练解决方案构建与完善:针对大语言模型,视觉生成等场景,构建支持完整训练流程的解决方案。从数据预处理、模型训练、结果评估、训练工具构建等方面进行全方位优化;
3、前沿技术追踪与融合:密切关注业界最新技术动态与发展趋势,对前沿技术进行深度分析与研究,将技术成果融入分布式训练框架,推动框架持续迭代升级。
任职要求
1、本科及以上学历,计算机相关专业,熟悉大模型训练框架Megatron-LM/Deepspeed等;
2、具备良好的编程能力,熟练掌握性能分析工具和方法,熟悉torch的性能分析工具等;
3、逻辑思维清晰,具有良好的沟通能力、抗压能力和责任心;
4、具有相关开发或优化经验者优先;

熊先生IP:广东深圳
2周内活跃|
深圳新财董网络科技有限公司
相关推荐查看更多 >
AI应用工程师
1-1.5万元/月AIGC应用工程师1-3年本科及以上
杭州格物智咨科技有限公司11月28日 14:43
深圳
相同职位推荐
企业招聘

