为你推荐浙江杭州西湖区阿里巴巴云谷园区1号楼附近区域的职位信息
VPC虚拟网络开发工程师
3.5-6.5万元/月岗位职责:1. 负责阿里云VPC虚拟网络系统的研发与性能调优,涵盖AI智算场景下的VPC网络接入方案;2. 参与虚拟网络整体架构规划,保障技术路径的合理性和可落地性;3. 将VPC高性能网络能力集成至虚拟机及容器网络环境,提升网络虚拟化效率;4. 通过技术突破驱动VPC网络能力不断升级,构建面向未来的超低延迟、高吞吐VPC网络体系。任职要求:1. 具备扎实的网络基础知识,熟悉虚拟化网络原理并有深入实践经验;2. 具备独立定位和解决问题的能力,具备良好的沟通与协作意识;3. 对前沿技术保持敏感,能快速学习并有效融入实际项目;4. 熟练掌握TCP/IP协议栈、DPDK、OVS等高性能网络传输相关技术;5. 具有数据中心网络、RDMA、用户态协议栈或高性能通信框架开发背景者优先考虑。工作地点:杭州
杭州·西湖区

Java高级开发工程师
3-6万元/月职位描述:1. 承担阿里云网络控制系统的架构与研发任务,涵盖技术可行性评估、方案设计、功能规划及系统架构制定等环节。2. 主导云网络控制器平台的性能调优工作,满足云计算场景下对网络弹性的高标准要求。3. 参与云网络控制器平台的线上维护及内部运营支持工作。任职要求:1. 熟练掌握Java语言,具备3年以上开发经验,理解常用设计模式并能合理运用。2. 掌握Spring、iBatis、Struts等主流开源框架,了解MySQL、Redis、消息队列等中间件的核心原理,并有实际使用经验。3. 理解分布式架构与高并发处理机制,熟练运用JVM性能分析工具,具备高并发服务的架构设计能力。4. 具备AI相关应用开发经验者优先考虑。5. 有网络产品开发背景,或参与过OpenStack、K8S等云平台控制系统的研发工作优先。6. 热爱技术,沟通顺畅,积极主动,具备良好的团队协作意识和问题协调解决能力。
杭州·西湖区

智算安全容器稳定性技术专家
3-6万元/月1. 阿里云安全容器稳定性技术专家,专注打造安全容器在公共云及智算场景下的线上稳定运行体系,确保系统持续可靠;2. 主导安全容器监控、故障诊断与告警系统的后端研发,保障阿里云安全容器在pod、节点、网络和存储层面的高可用能力;3. 运用数据科学与机器学习方法优化运维流程,推动稳定性运维向自动化、智能化方向演进,提升整体运维效率。职位描述1. 具备5年云计算与容器领域研发经验,掌握扎实的计算机系统理论基础,拥有丰富的Java/Golang/Python开发实践;2. 熟悉Linux/Unix系统运维(如CentOS、Ubuntu),精通容器技术(Docker、Kubernetes)及云原生技术栈(Helm、Helm Charts、Operator);3. 掌握主流监控工具(Prometheus、Grafana、Zabbix、Nagios)以及日志分析平台(ELK Stack、Splunk、Datadog);4. 熟悉主流公有云平台(AWS、Azure、阿里云、腾讯云等)核心服务(如EC2、S3、Lambda、EKS、RDS、VPC),具备实际云资源管理经验;5. 对前沿技术保持高度热情,富有创新意识,具备良好的沟通协作能力与团队合作精神。
杭州·西湖区

大数据与AI方案架构师
3-6万元/月1.主导大数据与AI产品解决方案的设计与标准化,承担产品从售前支持到交付落地的全流程技术方案保障;2.深入掌握行业主流的大数据&AI应用模式,归纳典型业务场景,沉淀可复用的行业解决方案并推动规模化复制;3.依托阿里云大数据&AI技术能力,协助客户完成产品部署与落地实施,通过定制化方案应对不同行业的大数据应用场景挑战;4.负责整体解决方案架构文档的编制,统筹技术方案的迭代管理,并结合运营反馈持续优化或设计新的解决方案;5.联动业务、产品研发及交付团队,共同打造标杆案例,作为解决方案竞争力的核心负责人,影响行业客户的重大决策方向;6.为阿里云业务团队提供技术支持与策略赋能,助力市场拓展,并对产品的市场增长成效承担责任;7.挖掘并归集行业共性需求,反向推动云产品在大数据&AI能力上的升级,构建具备行业领先优势的技术产品体系。
杭州

大数据平台架构师
3-6万元/月注: 该岗位为大数据平台产品设计岗位,我们期待你具备扎实的大数据开发能力,同时拥有良好的沟通素养,并有意转向产品方向发展。深厚的技术背景将为你在云计算领域的成长提供强大助力。职位描述-----1) 我们将服务大量大数据与云计算领域的客户,这些客户普遍具备深厚的计算机专业知识及各自行业的领域积累。我们希望你拥有计算机或相关专业本科及以上学历,若非科班出身但具备扎实的计算机基础,我们也热烈欢迎你的加入!我们将重点考察你在计算机科学方面的理论功底。2) 我们正参与中国最前沿的云计算基础设施构建,面对的是极具挑战性的技术场景。因此要求你至少具备两年以上面向企业客户(toB)的产品设计经验,坚信实践积累经验,经验铸就成熟产品与出色设计。期待你能与我们一起,投身于大数据与云计算的创新浪潮中!我们将重点关注你的产品思维与方法论。3) 我们致力于打造中国乃至全球规模领先的大数据计算平台,服务于全国乃至全世界的数据应用开发者与数据工程人员。我们的目标是推动大数据技术走向成熟化、工具化,真正赋能各行业实现数字化变革。期待你具备大数据应用或底层开发经验,用你在大数据领域的深厚积累,助力平台实现更强技术突破、更广业务覆盖与更大市场拓展。职位要求-----我们期待你具备以下经历或背景:1) 曾从事技术工程师岗位,但在实践中发现对产品设计有更强兴趣,有志于向产品方向转型。2) 参与或主导过后台业务系统、大数据类产品的规划与设计工作,例如在电商交易链路中承担产品职责,或曾基于开源大数据引擎(如Flink、Spark、Hadoop等)搭建企业级大数据平台的相关人员,具备丰富的大数据应用实践经验,并对业务逻辑有深入理解。3) 有主流云服务商产品岗位经验,主导或参与过云计算产品的整体规划与设计,涵盖产品架构、界面交互、技术支撑等方面。4) 来自传统企业级软件公司,曾在传统数据库厂商、CRM系统等B端软件领域负责产品设计相关工作。工作地点----杭州、北京
杭州·西湖区

AI加速计算技术产品研发工程师
4-7万元/月职位描述1. 基于公共云统一架构、OpenAPI规范、软件技术栈及交付运维体系,承担公共云异构计算产品的研发与交付工作。全面参与研发流程,保障产品在研发至运维全生命周期中的高效运作与持续优化。2. 持续追踪异构计算领域的最新技术动态与发展趋向,深入研究先进GPU架构设计及相关技术,结合业务战略方向与核心需求,制定高可用、高可靠、高扩展性的技术架构方案,并推动其实际落地实施。3. 与网络团队协同推进网络互联架构设计,面向分布式训练与推理应用场景,在软硬件协同及高性能网络领域探索性能提升路径,打造阿里云加速计算云服务器的关键技术优势。4. 主导系统稳定性与安全性的研发与迭代,制定并执行稳定性保障策略,识别并消除系统潜在风险与性能瓶颈,覆盖线上复杂问题的定位与解决,持续提升平台运行的可靠性与服务品质。职位要求1. 具备计算机科学、电子工程、通信工程、电气工程等相关专业背景;熟练掌握Python、Shell、C/C++等编程语言,具备5年及以上相关领域工作经验。2. 深刻理解GPU芯片与服务器整体架构,熟悉PCIe规范、Linux内核机制及KVM虚拟化技术,具备丰富的GPU驱动开发、系统性能分析与调优实践经验。3. 掌握分布式并行计算原理与集合通信机制,具有GPU驱动开发(如OpenCL、CUDA、RoCM)、GPU编译器优化或AI场景下性能调优经验者优先。4. 具备强烈的责任意识,能与上下游团队高效协作,快速响应并推动问题解决,落实有效技术方案;保持积极主动的学习习惯,对前沿技术充满探索热情。
杭州·西湖区

golang开发
1.1-1.7万元/月岗位职责:1、负责云原生cicd系统编排与调度核心能力开发2、负责cicd系统的自动化部署和devops能力建设3、负责内部构建工具的开发改造工作任职要求:1、计算机大专以上相关专业3年以上工作经验,有工具研发、devops、CICD系统研发和使用经验2、熟悉Linux操作系统、熟练使用golang及其他开发语言,熟悉k8s和docker云原生生态3、熟悉git、helm、docker、buildkit、terraform等工具的开发和使用,熟悉开源cicd系统如gitlabrunner、tekton等的使用4、有新一代构建系统如bazel、buck2等的使用经验,对go语言原理和编译有深入理解,有devops系统开发经验优先
杭州·西湖区

深度学习推理系统研发专家-机器学习平台
3-6万元/月● 设计并构建高效的分布式推理架构,提升多节点、多GPU环境下的推理性能与资源利用效率。研发智能请求调度策略,保障高并发场景下的低延迟响应与高吞吐能力。深度优化推理引擎的运行时环境,降低系统开销,全面提升执行效率。针对多种异构AI加速硬件(如NVIDIA GPU、AMD GPU、NPU等),对关键算子进行精细化调优,充分释放计算能力和内存带宽潜力。● 研究并落地极低bit量化与模型稀疏化技术,在压缩模型体积和降低计算消耗的同时,维持推理精度稳定。探索更高效的生成式解码机制,显著加快生成类任务的推理速度。● 构建可支持海量并发请求的系统架构,确保在极端负载条件下仍具备良好稳定性与性能表现。集成容错设计、自动恢复机制及监控告警体系,保障服务的高可用性。打造具备弹性扩展能力的架构体系,适应未来业务规模扩张与技术迭代需求。● 持续跟踪前沿技术动态,重点关注超长上下文处理、COT思维链、多模态融合等方向。主动探索新型推理优化路径,提出并验证具有创新性的技术方案。职位要求● 具备扎实的工程实现能力,良好的编码规范,熟练掌握Python/C++语言及常见设计模式,拥有复杂系统的设计、开发与调试经验。● 理解深度学习基本理论,熟悉主流模型结构与算法原理,能熟练使用PyTorch、TensorFlow等主流框架。● 具备良好的沟通协作能力与团队合作意识,学习能力强,能够持续深入研究关键技术问题。● 掌握计算机体系结构相关基础知识,具备高性能Kernel开发(CUDA/Triton/ROCM等)、推理引擎优化(vLLM/SGLang等)、模型算法优化(量化/稀疏等)或AI资源调度优化的实际项目经验。加分项:● 拥有优秀的学术成果与科研创新能力,曾在相关领域发表高水平论文或取得专利。● 具备基于cutlass/cute进行高性能Kernel开发与极致性能调优,并成功应用于生产环境的经验。● 在大型语言模型(LLM)等重点应用场景中,具备系统的性能优化或前沿算法落地的实践经验。● 曾作为核心开发者参与大规模AI系统的研发,或贡献于业界主流开源项目,拥有丰富的工程落地案例与实战积累。
杭州·西湖区

云网络开发工程师
3-6万元/月职位描述【团队介绍】阿里云智能事业群网络产品团队专注于云网络产品的规划、研发、设计与运营。飞天洛神云网络平台作为阿里云自研大规模云计算操作系统——飞天平台的核心组成部分,支撑着全球化的网络服务体系。目前,阿里云网络已覆盖全球超200个数据中心、20个地域、58个可用区以及110个接入点,打造了遍布全球的基础设施网络,并为百万级用户提供多样化网络服务,涵盖VPC、负载均衡SLB、NAT网关、云企业网CEN、全球加速GA、VPN网关、智能接入网关SAG、高速通道等。十余年来,云网络实现了从零起步到产品体系不断完善,用户规模从数千跃升至百万量级,并连续八年成功支撑双11核心流量调度,见证了云计算时代的全面兴起。面向下一个十年,云网络将深度融入社会数字化进程,成为关键基础支撑力量。诚邀您的加入,与阿里云智能事业群网络产品团队共同开拓创新,驱动技术未来。1. 承担阿里云虚拟网络产品管理与控制平面相关工作,涵盖NFV平台、VNF产品及SDN类产品在管控层面的设计、实现与开发;2. 参与云网络转发面虚拟化架构的研发与设计,深入参与云端整体网络架构的规划与演进岗位要求1. 具备国家统招本科或以上学历;2. 计算机基础理论扎实,熟练掌握至少一门编程语言(如Java、PHP、Python、Perl、C等);3. 熟悉分布式系统及高并发场景下的服务开发模式;4. 掌握TCP/IP协议体系,具备协议栈开发或高性能网络编程的实践经验;5. 熟悉多核架构开发环境,例如Cavium、DPDK或Tilera平台;6. 具备四层与七层负载均衡相关研发背景者优先;7. 深入理解网络架构设计原理,精通路由、交换、负载均衡及网络运维相关技术
杭州·西湖区

容器平台研发专家-杭州
3-6万元/月1. 负责阿里云容器产品管控平台的架构规划、功能实现与运维支撑,构建稳定高效的容器服务管理能力。2. 保障阿里云容器管控服务在高并发场景下的性能与可用性,确保全球多地域业务系统的持续稳定运行。3. 深度参与产品从需求到上线的全流程研发工作,持续优化系统安全、稳定性、性能表现、功能完整性及用户操作体验,以技术赋能业务发展。4. 主导系统架构升级与技术优化,跟踪前沿技术动态,开展关键技术预研与核心难题攻关。职位描述1. 具备5年以上 Go/Java 领域的架构设计与开发经验,熟悉复杂分布式系统的构建与落地,对云产品API设计、分布式架构、数据库原理、Linux操作系统有深入掌握,具备一定的Linux环境运维实践经验。2. 拥有5年以上控制台类系统的架构与开发经历,主导过PC端中大型前端项目的架构设计与实施,熟练使用至少一种主流前端框架(优先React)及相关组件库与工具链,掌握 Webpack、Vite 等构建工具,具备较强的前端工程化能力。3. 具备云计算或 Kubernetes 等容器类产品研发运维经验者优先,参与过Kubernetes相关开源项目并有贡献者优先考虑。4. 具备优秀的沟通协作与项目推进能力,能独立牵头大型项目并确保按时高质量交付成果。5. 热爱技术,乐于探索,具有良好的技术洞察力、业务理解力与创新意识。
杭州·西湖区

数据库内核开发-计算模块
3-5万元/月1. 参与分析型数据仓库内核的开发工作,主导优化器、计算引擎等关键模块的架构设计与编码实现;2. 深入AI计算引擎研发,构建高性能AI算力平台并支持相关应用方案落地;3. 支持阿里云客户业务需求,定位并解决大规模数据场景中的性能与稳定性挑战;4. 跟踪行业技术发展动态,推动系统架构不断迭代升级。职位描述1. 计算机相关专业硕士及以上学历,具备五年以上数据库或大数据系统研发经历;2. 熟练掌握C/C++/Rust中至少一种编程语言;3. 理解数据库内核机制,熟悉SQL解析、查询优化、执行引擎等核心组件原理;4. 具备良好的沟通协作能力,能够高效配合团队完成目标;5. 了解Greenplum、DuckDB、ClickHouse、Starrocks、Spark、Ray等系统,有开源社区贡献经验者优先;6. 在数据库领域顶会(SIGMOD、VLDB、ICDE)发表过论文者优先考虑;7. 具备AI相关背景者优先,涵盖模型训练、推理优化、大语言模型、RAG、智能Agent等方向;
杭州·西湖区

阿里云无影AI产品品质保障
4-5.5万元/月岗位职责1. 负责阿里云无影AI AgentBay等相关产品的质量保障工作,制定并推动测试策略、测试计划及测试方法的实施,保障产品在高速迭代中的高质量交付;2. 主导中大型AI项目的质量管控,涵盖测试策略规划、流程优化、风险预判与质量回顾,确保关键里程碑的质量达标;3. 设计并研发AI Test Agent,构建基于AI的测试保障能力,加速测试技术向智能化演进,持续提升测试效率与覆盖能力;4. 推动测试方案的有效执行与落地,保障项目进度与交付质量,沉淀AI自动化测试用例,并逐步实现服务化输出,支持开发、运维乃至客户侧使用;5. 持续推进架构设计、技术方案、工具链及研发流程的优化与创新,提升整体研发效能与交付质量;职位要求1. 掌握测试理论体系与实践方法,熟悉多种测试技术,了解标准化测试流程及质量保障手段、目标与常用工具;2. 本科及以上学历,计算机软件或相关专业背景,具备5年以上测试开发或研发领域工作经验;3. 能根据AI Agent类产品特点设计定制化测试方案,并建立匹配的测试评估体系;4. 具备AI类产品(如大模型、AI Agent、AI Coding等)测试开发经验者优先考虑;5. 曾主导复杂系统测试架构设计或测试平台建设,或在自动化测试、性能测试、稳定性保障等专项领域有深入实践经验者优先;6. 具备自动化测试工具开发及测试平台搭建的实际项目经验,拥有自动化用例设计及编码实现能力;
杭州·西湖区

VPC高并发网络架构专家
3-6万元/月职位描述1、负责AI智算场景下VPC网络的接入架构设计,开展低延迟、高吞吐的高速网络技术研发,并推动其在计算、存储、AI、机器学习、推荐等核心业务中的落地应用;2、将高性能VPC网络技术应用于虚拟机与容器网络环境,提升网络虚拟化场景下的传输效率;3、借助DPU、可编程硬件等软硬协同手段,推进高性能VPC技术在阿里云智算体系中的规模化部署;4、通过持续的技术创新,驱动VPC网络架构迭代升级,构建面向未来的超低时延、高带宽VPC网络体系。职位要求1、计算机、网络工程等相关专业优先,具备5年以上网络领域相关工作经验;2、熟练掌握计算机网络原理及网络编程技术,精通至少一种主流编程语言,如C/C++、Python、Go等;3、深入理解TCP/IP协议栈机制,熟悉DPDK、OVS等高性能网络传输关键技术;4、了解DPU/IPU等软硬协同网络架构,关注网络与系统领域的前沿技术发展动态;5、具备数据中心网络、RDMA、用户态协议栈、高性能通信框架等相关开发经验者优先考虑;6、具备良好的沟通能力与团队协作意识,主动积极,善于协调资源并推动问题解决;热爱技术,具备持续学习与自我提升的能力;7、获得阿里云ACA/ACP/ACE认证者优先录用。
杭州·西湖区

java高级工程师
2-4万元/月1.本科及以上学历,计算机相关专业,具备3年以上JAVA开发工作经验;2.熟练掌握Java编程语言,深入理解JVM机制、Java高级特性及常用类库,熟悉网络编程与服务器端开发,精通多线程技术,熟练运用面向对象设计原则,掌握主流Java开发框架;3.熟悉Mysql、Oracle等关系型数据库的设计与开发,具备丰富的数据库性能调优实践经验;4.拥有大型分布式系统开发背景,熟悉常见架构设计方法与模式,了解高并发、高可用网站架构所需核心技术,对分布式缓存、消息中间件、RPC框架等有深入理解和实际应用经验;5.热爱技术研发,工作态度认真细致,具备良好的学习能力与责任意识,能够主动推动任务进展,擅长沟通交流与团队合作;6.具备较强的技术攻关能力与创新思维,能独立分析并解决复杂技术问题,有AI大模型项目开发经验者优先考虑。
杭州

基础平台开发-大数据分布式方向-杭州
3-5万元/月1、参与OLAP系统分布式架构的设计与开发,聚焦集群性能调优,深入排查计算、存储、网络等环节的性能瓶颈,提升资源使用效率。2、规划并落地多实例环境下的资源隔离机制,涵盖CPU、内存及IO维度,协调业务需求与系统负载之间的平衡。3、搭建集中化管理平台,实现集群的一键式部署、配置维护、故障自恢复、弹性伸缩与无感扩缩容等关键能力。4、协同团队推进系统性能提升与成本优化,提高整体运行效能,降低硬件投入,推动资源精细化管理;参与底层内核优化,增强系统在复杂应用场景下的稳定性与可靠性。5、跟踪前沿技术发展,推动新技术在OLAP系统中的落地应用,持续增强系统技术优势。职位要求1、本科及以上学历,计算机科学、软件工程、信息技术等相关专业背景;具备3年以上相关工作经验;2、掌握分布式系统核心原理,熟悉高并发、高可用性系统架构设计,具有实际的分布式系统设计与调优经验;3、拥有大型数据库系统开发经历(如 PostgreSQL, Greenplum, ClickHouse 等),了解K8s为代表的云原生技术体系,熟练使用至少一门主流编程语言,如Java、Python等;具备扎实的系统设计与优化能力,可独立承担模块级设计与编码任务;4、具备较强的业务理解力,能准确把握业务诉求,并输出匹配的技术解决方案;沟通顺畅,团队协作意识强,善于跨团队协作达成目标;5、具备独立开展问题分析与解决的能力,面对复杂场景可提出切实可行的应对策略;工作态度严谨,抗压性强;关注技术趋势,学习能力强,持续精进专业技术水平。
杭州·西湖区

容器SRE平台技术专家
3-6万元/月1、参与阿里云容器服务SRE平台的构建,承担k8s集群从创建到退役的全周期运维任务,保障集群运行稳定并满足SLA要求;2、主导搭建与k8s配套的自动化运维系统,优化运维流程,提升平台化运维能力,支撑集群规模的持续扩展;3、建设和维护k8s集群的oncall机制,具备端到端排查集群功能与性能问题的能力,快速响应并解决生产环境故障;4、主导跨团队重点项目的推进工作,如业务应用向容器化迁移,协同各方推动技术方案和业务目标落地实施。职位描述1、需具备5年以上相关工作经验;有大规模容器平台研发、运维、稳定性保障及技术体系搭建经验者优先考虑;2、精通Golang编程语言,深入理解k8s生态及其核心组件(如apiserver/kcm/Scheduler/etcd等),具备扎实的Operator开发与运维实践能力;3、熟悉Linux操作系统及常用shell操作命令;具备良好的沟通表达能力、团队协作精神以及较强的自我驱动能力;4、具有敏锐的风险识别能力,能够及时发现潜在问题,并有效推动风险闭环处理。
杭州·西湖区

杭州-阿里云-IDC自动化运维工程师
2-4万元/月岗位职责:1、负责数据中心基础设施(电气、暖通、自控系统)的运维管理,制定并推动实施相关运维技术标准与操作流程。2、作为阿里云数据中心运维管理中台团队,承担全球范围内的运维质量监督工作,依托飞检、质量评估、集中化监控及FOC事件响应等手段,保障系统稳定运行目标的实现。3、主导自控系统的技术规划、技术支持与疑难问题解决,提升系统可靠性与自动化水平。任职要求:1、具备3-5年相关领域工作经验。2、本科或以上学历。3、熟练掌握PLC、DDC、动环监控等相关技术。4、具备英语口语交流能力者优先,211院校及以上教育背景者优先。
杭州·西湖区

大数据运维开发工程师
3-4万元/月职位描述:负责大数据类平台(Flink/Spark/EMR/ES/Hadoop)及AI智能计算业务(PAI)的PAAS层软件维护、k8s集群管理、CPU/GPU服务器节点运维以及运维工具平台的开发,保障各系统安全、高效、稳定运行,持续优化服务可用性与运维自动化水平职位要求:1、熟练掌握Unix/Linux操作系统、K8S、高可用架构等相关技术2、具备2年以上开发经验或为优秀应届毕业生,至少掌握一种编程语言:Python、Go、Java3、具备较强的学习能力、沟通能力、服务意识和团队协作精神4、责任心强,积极主动,对所承担的工作有主人翁意识,并能推动自身不断成长5、有自动化运维、监控体系、发布平台、运营支撑系统等开发背景者优先考虑6、具备AI相关项目经验、GPU资源运维经验或大规模分布式系统设计开发经历者优先7、具备良好的协作态度和主动沟通意识,学习能力强,热衷技术探索与知识共享
杭州·西湖区

java服务开发专家
4.5-7.5万元/月1、依托ADBPG向量引擎搭建搜索网关系统2、对搜索流程中的embedding模型进行调优与微调3、掌握Java、Python编程语言,具备SpringBoot开发框架使用经验4、熟悉PostgreSQL、MySQL、Milvus等数据库中的一项或多项5、了解嵌入式模型微调技术者优先【加分项】
杭州·西湖区

云原生平台开发
2-4万元/月1、技术方案设计• 梳理、识别并深入分析客户需求,明确技术方案的目标、边界及交付成果• 结合需求开展技术可行性评估与方案论证,合理选定技术路线、功能设计、技术架构、数据架构及开发流程2、技术实现• 根据技术方案拆解任务,依据目标与规范完成子任务的详细设计、编码开发与系统功能落地• 主导核心模块的架构设计与通用代码模板编写,负责系统共用组件的开发与维护,推进架构优化与重构• 组织阶段性代码讨论与CodeReview,通过调试与调优保障代码质量,推动系统顺利部署上线• 负责开发过程中及上线后系统的持续维护与迭代,包括oncall值班、工单处理、缺陷修复、故障定位、体验优化、性能与成本改进等3、稳定性和性能优化• 制定系统稳定性保障策略,识别并消除系统潜在风险与性能瓶颈,解决线上复杂问题,保障系统高可用与安全• 应用性能优化方法与工具,持续提升系统响应能力与运行效率,增强整体稳定性4、技术预研• 关注前沿技术动态与行业发展趋势,结合业务实际提供创新性技术储备与解决方案建议5、技术规划• 深入理解业务战略方向,围绕核心需求制定高可用、高可靠、易扩展的技术架构规划,并推动实施落地职位要求1. 精通Java/Python/Go中至少一门编程语言,掌握相关基础框架,对所用框架具备原理级理解;2. 理解Linux内核基本机制,熟练使用常用工具与命令,具备较强的系统诊断与调优能力;3. 掌握多线程、高并发编程及优化技术;熟悉分布式系统设计与应用,了解缓存、消息、分布式协调等机制,能合理运用常见技术解决实际问题;4. 熟悉Docker容器化技术及Kubernetes云平台,了解K8S Operator开发,具备实际项目经验或源码研究者优先;5. 具备快速学习能力,良好的团队协作与沟通能力,自我驱动意识强;【加分项】1. 熟悉MySQL/SQLServer/PG等关系型数据库,了解HBase/Cassandra/Kafka/Elasticsearch/Greenplum等开源数据存储与消息系统原理,或具备相关运维经验者优先;2. 具备大规模互联网产品开发背景,或有云服务商IaaS/PaaS平台研发经验者优先;
杭州·西湖区

Python
1-1.2万元/月1.负责使用Python进行应用系统的开发、维护及性能优化工作。2.参与系统架构的规划与升级,撰写结构清晰、易于维护的高质量代码。3.与产品团队、前端工程师及其他相关成员协同配合,保障项目按期上线交付。4.承担数据库结构设计、性能调优以及SQL语句优化任务,保障系统稳定高效运行。5.编写相关技术文档,参与代码审查流程,持续提升代码质量与可维护水平。6.攻克系统运行中的关键技术问题,提供有效的技术支持与解决方案。招聘要求:1、精通Python技术体系,具备扎实的Python编程基础,掌握io、多线程、分布式、缓存、消息队列等核心技术,了解常用中间件组件;2、熟练运用主流PythonWeb框架,熟悉Linux环境下常用操作命令,掌握MySQL、MongoDB、Redis等主流数据库或缓存技术;3、理解常见设计模式,具备良好的面向对象编程思维与实践能力;4、了解云计算平台相关产品及应用。
杭州

大数据计算引擎研发(杭州,C++)
3-5.5万元/月急招P6~P8,2026/4前有效,每天在线可留言交流职责概述:负责阿里集团、阿里云可观测数据处理基础设施建设,打造日增百PB级数据的实时数据分析平台。通过实时采集、索引、存储、压缩等技术,实时处理来自千万设备的海量日志数据,并针对AI应用场景进行特定优化,提供智能、自动化数据分析服务。主要职责:1.参与阿里云战略级产品SLS研发,参与面向AI应用场景的数据采集、处理、查询分析等功能设计、开发。2.负责大数据Pipeline引擎、调度研发,为Agent数据飞轮提供稳定可靠数据基础设施。3.负责实时计算引擎的研发、运维,为阿里云可观测基础设施提供低延时、高性能、高可用的计算服务。职位要求:1.在高性能数据结构、流式计算、OLAP计算、数据编码压缩上有深入研究,熟悉分布式SQL优先。2.熟练使用C++/Golang编程,熟悉异步IO、内存管理、多线程同步等。3.对技术有强烈的进取心,有较强的学习能力,保持对前沿技术的关注和学习。4.具有良好的沟通能力和团队合作精神、优秀的问题分析和解决能力。5.优先:对OLAP引擎、流计算引擎源代码深入研究者;有TB~PB级数据系统开发、运维经验者。6.加分项:熟悉AI领域,对于AI应用数据特征,数据存储和查询需求有理解,有实战经验更佳。
杭州·西湖区

研发流程优化专家
2-4万元/月职位描述1. 负责弹性计算团队重点产研项目的统筹管理,保障项目目标顺利达成。2. 依据组织战略方向,协同相关方开展目标分解与关键战役规划,推动核心干系人形成统一共识。合理调配资源,平衡长期规划、短期任务与资源约束之间的关系。建立战役推进保障机制,强化执行过程管控,确保战略目标有效落地。3. 主导项目从启动筹备、需求梳理、计划制定、执行推进、成果验收、产品上线到运维支持及业务监控的全周期管理。高效协调各方参与方并合理引导期望,保障项目有序进展,及时识别、跟进并解决项目中出现的问题,有效防控风险,整合所需资源,确保项目按既定目标高质量交付。4. 在实现项目结果的同时,通过流程体系建设和可度量、可追踪的数据分析,结合对产研全流程的持续观察,识别所在领域内的流程短板与瓶颈问题,向项目或产研负责人输出切实可行的优化建议;从产品技术竞争力、业务成长性以及客户痛点到研发效率等多个维度,推动团队整体产出效能提升。5. 通过构建过程资产库、沉淀优秀实践案例、开展项目管理能力培训等方式,持续提升团队在项目管理方面的专业水平。职位要求1. 具备计算机相关专业教育背景;2. 拥有5年以上项目管理实战经验,曾独立主导大型跨部门项目及多项目并行管理工作;具备牵头复杂、跨业务线项目的实际经历,能独立完成项目规划,对项目目标、进度与质量具备全面掌控能力,善于整合资源应对挑战;3. 熟悉软硬件开发全生命周期,掌握项目管理专业知识体系,具备端到端项目管理能力;了解互联网企业项目运作模式与方法论;具备较强的需求拆解能力及云计算行业背景,能够将复杂需求转化为可执行的研发任务;4. 具备一定的产品研发实践经验,对研发体系架构与运行环境有系统性认知和判断力,能够持续推动团队在研发质量与效率方面不断改进;5. 具备出色的沟通协作素养,可与产品、研发等多团队成员高效互动,以提升研发质量与效率为核心导向,推动流程机制有效实施与迭代优化;6. 保持持续学习态度与探索精神,关注前沿技术动态与发展趋向,主动拓展自身专业视野与技能储备;7. 具备研发、测试或运维工作背景者优先考虑。
杭州·西湖区

GPU性能优化工程师(海外产品方向)
4-7万元/月职位描述:1. 承担GPU分布式训练系统的设计与实现,持续优化主流训练框架(如PyTorch、TensorFlow)在分布式环境下的通信性能,加速大规模模型(如大语言模型、计算机视觉大模型等)的训练进程。2. 主导高性能计算网络的调优工作,围绕RDMA、NVLink等高速互联技术,突破网络带宽限制,优化通信延迟并解决数据分片难题,确保多节点GPU集群间通信高效稳定。3. 持续监控分布式训练系统的运行状态,及时发现并处理系统异常,涵盖节点故障恢复、任务容错机制、资源调度冲突等问题,有效减少训练中断情况。4. 联合算法团队推进分布式优化策略在实际业务中的应用落地(如大模型预训练、微调等场景),提供关键技术支撑,并根据反馈持续迭代改进方案。职位要求:1. 本科及以上学历,计算机、电子信息、软件工程等相关专业背景,具备3年以上从事GPU分布式训练或高性能计算领域的工作经验。2. 熟悉至少一种深度学习框架的分布式架构(如PyTorch DDP、Horovod),拥有在多节点GPU集群上部署与性能调优的实际项目经历。3. 掌握计算网络协议及体系结构(如RDMA、TCP/IP、Infiniband),能够独立开展网络性能测试、瓶颈分析并实施有效的优化措施。4. 熟练使用C++/Python进行开发,熟悉Linux环境及Shell脚本编程,具备容器化技术(Docker、K8s)部署分布式训练任务者优先考虑。5. 具备较强的系统问题排查能力,可快速定位内存泄漏、网络丢包、节点宕机等故障,有大规模GPU集群运维经验者更具优势。6. 有参与千亿参数以上大模型分布式训练优化,或具备AI加速芯片(如A100/H100)性能调优实践经验者优先录用。
杭州·西湖区

云计算实习生
250-400元/天面向AI场景下数据库资源优化系统研发,具体职责包括:1.构建基于深度强化学习(DRL)的CPU/GPU异构负载调度体系,设计融合负载管理模块与资源调度引擎的动态资源配置模型,实现资源使用效率与服务性能(QoS)的协同提升;2.开发“资源预加载+缓存预载入+计算流程编排”复合架构,结合热点数据识别算法、计算节点池化方案及数据预取机制,解决对象存储(OSS)在横向扩展中的性能限制问题;3.采用Neon分支技术优化动态数据隔离方案,制定多分支环境下的共享数据访问加速策略,在确保无重复存储的基础上满足租户间、branch间的安全隔离要求,同时增强多分支并行场景下的数据读写吞吐能力。
杭州

阿里云智能-容器镜像服务技术专家-杭州
2.5-5万元/月岗位职责:1. 负责阿里云容器镜像服务产品的技术架构规划与核心开发工作。2. 持续优化产品技术架构以匹配业务高速演进的需要,主导中大型版本迭代的架构设计、关键模块编码及技术方案实施保障。3. 承担容器相关技术的前瞻性研究与关键技术难题突破,确保系统具备高可用、高稳定和良好扩展能力。任职要求:1. 精通 Golang 或 Java 开发,具备扎实的编程功底,同时掌握 Rust/Python/Shell 中的一项或多项语言,具有 5 年以上开发经验。2. 熟悉 Linux 操作系统,熟悉 Spring、Dubbo 等主流开源框架,具备高性能系统的设计、实现与性能调优经验。3. 具备较强的学习能力,良好的团队协作与沟通意识,以及主动推进工作的自我驱动力。4. 理解云计算领域的商业模式,有云计算或容器相关技术实践经验者优先考虑。5. 具备 Kubernetes 等容器类产品开发经验者优先,参与过 Docker/Kubernetes 等开源项目贡献者优先。6. 能熟练运用 AI 工具与平台,具备通过智能化手段提升研发效率、改进代码质量、加快问题定位与迭代进程经验者优先。
杭州·西湖区

分布式研发工程师-资源分配
3-6万元/月1. 参与分布式资源与作业调度功能的需求分析、架构设计及开发落地2. 构建基于Kubernetes平台的大规模、高性能、智能化的新一代调度系统3. 承担系统功能的方案设计、编码实现、测试验证及线上运行的数据分析与故障排查4. 推进智能调度能力建设,融合动态运行状态、深度学习与强化学习等方法,打造具备智能决策与可视化能力的先进调度体系5. 支撑计算密集型、大数据处理、机器学习/深度学习训练及在线服务等多种业务形态的混合部署调度,研发高并发、低延迟、可扩展的调度核心技术6. 积极参与开源社区协作,与业界保持技术交流,实现双向赋能与持续优化7. 本岗位包含运维值班要求,需在服务级别协议(SLA)规定时限内完成客户问题响应,推动问题闭环,提升服务质量与用户体验职位要求1. 具备扎实的计算机科学基础,熟练掌握数据结构与算法设计2. 精通Golang、C++、Java其中至少一门编程语言,具备出色的系统调试与性能调优经验3. 熟悉Yarn/Mesos/Hadoop/HBase/Flink/Spark/Storm/docker等相关开源技术栈4. 深入理解Kubernetes/Docker生态体系,掌握容器调度核心技术及主流项目实现原理5. 有实际的大数据场景开发经历,拥有大规模集群运维实践经验者优先考虑6. 在上述技术领域具备开源社区贡献经验者优先
杭州·西湖区

大数据平台技术专家
3.5-6.5万元/月岗位职责:1. 基于Flink与Kubernetes构建实时计算Flink云平台,参与产品核心模块设计、性能调优及编码实现2. 持续优化系统架构,保障服务高可用与弹性扩展,打造稳定高效的实时计算云解决方案3. 支持阿里巴巴集团内部及阿里云外部客户,协助其在阿里云环境落地基于Flink的流式数据处理体系任职要求:1. 计算机、通信、数学等相关专业背景,具备扎实的计算机理论基础2. 精通Java开发,掌握常用数据结构与算法,具备出色的系统问题定位、性能分析与调优经验3. 具备良好的沟通协作意识,工作积极主动,热爱技术,乐于应对挑战并持续学习成长4. 熟悉Spring/Flink/Spark/Kubernetes等主流开源框架者优先,有大规模分布式系统研发经验者优先
杭州·西湖区

python开发
1.2-1.8万元/月大专三年以上职位要求1.计算机、软件、电子科学或相关专业,本科以上学历;2.熟悉Python、C/C++等计算机语言,熟悉Linux或unix操作系统;3.对自动化测试有丰富的经验,有自动化测试、效能工具开发经验者优先;4.熟悉国内外业界主流的GPU以及应用场景,熟悉AI模型(AIGC/CV/NLP/推荐系统)不同场景下的性能评估,有生成式模型(LLM,SD等)测试开发经验者优先;5.熟悉集群化的网络架构与性能评估,熟悉GPU监控与性能分析;6.有Web开发经验(前端+后端),熟悉Django或Flask开发框架。
杭州·西湖区


