鱼泡网首页职位公司校园意外险下载APP

登录注册后可以:

直接与老板/牛人联系

更精准匹配求职意向

获取更多的求职信息

大模型推理优化工程师

2.7-3.5万元/月
职位详情
微信扫码分享
举报
经验不限本科大模型算法
岗位职责 1、配合模型应用和模型训练同事,上线大模型推理服务,推动大模型相关算法的落地; 2、持续跟进前沿技术,优化大模型推理性能,提升线上模型服务吞吐量,降低模型推理延迟,控制推理机器成本; 3、开发和优化大模型推理系统,提升模型推理系统的性能,稳定性,可观测性,易用性等; 4、使用GPU编程和系统优化手段实现高性能的推理优化算法,并将其落地于大模型推理系统中。 岗位要求 1、计算机科学、人工智能等相关教育背景,本科以上学历; 2、熟悉Python,掌握常见的LLM推理加速框架,如vllm/onnx/TensorRT/TensorRT-LLM/sglang等,能够根据业务需求优化; 3、熟悉CPU/GPU下性能优化基本原理和方式方法,有服务端GPU程序加速经验; 4、熟悉分布式推理常用加速方法,有分布式系统开发经验或大模型分布式部署经验者优先; 5、有国产芯片适配经验优先; 6、具备严谨细致的工作态度,较强的团队协作能力。

职位总结围绕职位描述,归纳工作内容、招聘要求

郝女士IP:北京

百融云创

·人事经理
工商信息

法定代表人:

张韶峰

成立日期:

2014-03-19

查看全部

工作地址
北京朝阳区利星行中心H座
点击查看地图

相关推荐查看更多 >

朝阳区

搜索
请选择城市
热门城市ABCDEFGHJKLMNPQRSTWXYZ
全国