职位详情
微信扫码分享
举报
5-10年本科python大模型训练大模型算法
1.具备5年以上算法开发或平台研发相关工作经验;
2.以下技术能力中至少满足两项:
-熟悉主流大模型训练框架,如DeepSpeed、Llama-factory、ms-swift等,掌握SFT/RLHF/DPO/PT等常见训练方法;具备大模型分布式训练背景,了解RAY等分布式计算框架的应用。
-精通多种大模型推理加速技术,熟悉vLLM、SGLang等推理加速工具的特性,能够通过参数调优提升推理效率;了解网络与硬件配置优化策略,有效提升模型运行性能。
-掌握多模态大模型的训练与推理技术,具备图像视频理解、语音处理、图像生成等相关模型的实际开发与应用经验。
-能够在华为昇腾、沐曦、天数、燧原等国产GPU平台上完成大模型的训练与推理任务,涵盖环境搭建、硬件适配、模型部署及测试验证全流程。
-熟悉大模型数据预处理流程,包括数据清洗、质量优化、数据增强等关键环节的实施方法。
-掌握模型安全防护机制,具备内容过滤、越狱攻击防御、毒性文本识别、内容真实性鉴别等方面的理论知识与实践经验。
3.熟练掌握Python编程语言,具备扎实的编码能力,理解面向对象设计思想及相关开发模式;
4.熟悉Linux系统常用命令和基础操作,了解Docker、K8S、Git等开发运维工具的使用;
5.具有良好的学习能力和问题分析能力,能独立完成问题排查与解决;
6.思维活跃,善于提出产品优化建议并推动落地。
岗位职责:AI产品研发工作
1、承担公司大模型开发平台的后端开发与日常运维,持续推进平台架构优化与功能升级。
2、参与大模型开发平台的售前技术支持及客户定制化二次开发工作。
职位总结围绕职位描述,归纳工作内容、招聘要求

杨先生IP:浙江杭州
半年内活跃|
中电金信
·人事经理相关推荐查看更多 >
海淀区
相同职位推荐
企业招聘
职位大全
相关搜索

