鱼泡网首页职位公司校园意外险下载APP

登录注册后可以:

直接与老板/牛人联系

更精准匹配求职意向

获取更多的求职信息

大模型微调后训练工程师

2.5-5万元/月
职位详情
微信扫码分享
举报
3-5年本科SFT++DPO++RLHF++RFT大模型算法后训练强化学习其他RL参加算法相关竞赛/获奖post+training模型加速/性能优化Python算法工程师
1、负责大模型Post-training流程的优化与研发工作,涵盖SFT、RL训练等关键技术环节; 2、深入探索大模型强化学习相关方法,聚焦推理能力Reasoning、智能体Agent等方向的技术创新,持续提升模型在测试与实际应用中的表现; 3、跟踪并研究前沿AGI相关新技术,复现最新学术成果,并推动其在业务场景中的落地与验证。 职位要求 1、具有大模型后训练、Reasoning、Agent等方向的技术实践与项目经验; 2、具备较强的自我驱动力与问题分析能力,善于团队沟通与协作。

职位总结围绕职位描述,归纳工作内容、招聘要求

邓女士IP:上海

上海阿蒲管理咨询...

·人事经理
工商信息

法定代表人:

晏庆华

成立日期:

2021-08-17

查看全部

工作地址
北京海淀区中关村东升科技园Al中心
点击查看地图

相关推荐查看更多 >

海淀区

搜索
请选择城市
热门城市ABCDEFGHJKLMNPQRSTWXYZ
全国