深度强化学习控制算法工程师
3-5万元/月岗位职责:
1.开展深度强化学习控制算法的研究与开发,应用于机器人行走运动对抗、飞行器控制等场景下的自主策略学习。
2.构建、训练并优化强化学习智能体,涵盖模仿学习、迁移学习、强化学习及自监督学习等方法,提升智能体在感知与决策中的自主性、学习效率与泛化性能。
3.融合仿真平台与真实硬件系统,持续优化机器人或智能体的控制策略与算法表现。
4.改进强化学习训练架构,加快策略收敛速度,增强模型稳定性与可解释性。
5.参与团队技术研讨,编写相关技术文档,并推进研究成果向实际产品的转化应用。
岗位要求:
1.教育背景:计算机科学、人工智能、机器学习、机器人学或相关专业博士学历,优先考虑国内外重点高校毕业者。
2.研究经历:在深度强化学习、机器人/飞行器控制、模仿学习或多智能体协同学习方向有扎实研究基础,曾在NeurlPS、CORL等顶级会议或期刊发表过相关论文。
3.编程技能:熟练掌握Python,精通PyTorch等主流深度学习框架,具备强化学习常用库的使用经验。
4.理论基础:深入理解强化学习核心理论(如DQN、PPO),熟悉策略梯度、模型预测控制等相关技术。
5.仿真与实机经验:具备在仿真环境中开展算法开发与训练的能力,或拥有真实机器人系统上的调试与部署经验。
6.工程实现:了解高性能计算机制,掌握并行化与分布式训练技术,具备大规模强化学习项目落地实践经验。
7.项目背景:在机器人、具身智能、自动驾驶、飞行器等领域参与过开源项目者优先考虑。
8.创新意识:持续关注强化学习与机器人领域的前沿进展,具备将最新研究成果融入实际应用的能力

欧熠乐科技
点击查看地图