职位详情
微信扫码分享
举报
3-5年本科SFT++DPO++RLHF++RFT大模型算法后训练强化学习其他RL参加算法相关竞赛/获奖post+training模型加速/性能优化Python算法工程师
1、负责大模型Post-training流程的优化与研发工作,涵盖SFT、RL训练等关键技术环节;
2、深入探索大模型强化学习相关方法,聚焦推理能力Reasoning、智能体Agent等方向的技术创新,持续提升模型在测试与实际应用中的表现;
3、跟踪并研究前沿AGI相关新技术,复现最新学术成果,并推动其在业务场景中的落地与验证。
职位要求
1、具有大模型后训练、Reasoning、Agent等方向的技术实践与项目经验;
2、具备较强的自我驱动力与问题分析能力,善于团队沟通与协作。
职位总结围绕职位描述,归纳工作内容、招聘要求

邓女士IP:上海
上海阿蒲管理咨询...
·人事经理相关推荐查看更多 >
人工智能算法工程师
7000-10000元/月算法工程师1-3年本科
海淀区
相同职位推荐
企业招聘
职位大全
相关搜索

