职位详情
微信扫码分享
投诉
岗位职责
负责基于 FastAPI 的后端服务架构与开发,保障接口的高性能、稳定性与安全性。
参与 RAG(检索增强生成)系统的整体设计与实现,涵盖文档解析、向量化处理、信息检索、结果召回及大模型集成调用。
承担向量数据库(如 Milvus / Faiss / Weaviate / PostgreSQL+pgvector)的规划、调优与日常维护工作。
持续优化文档分片策略、索引机制与检索逻辑,提升系统在准确率、召回率和响应效率方面的表现。
协同前端、产品以及算法团队高效推进,推动 AI 应用场景的实际落地。
撰写完整的技术文档,确保代码具备良好的可维护性与可扩展性。
任职要求
本科及以上学历,计算机、软件工程、人工智能等相关专业优先考虑。
精通 Python 编程,熟练掌握 FastAPI / Flask / Django 等主流 Web 框架,具备实际项目中使用 FastAPI 的经验。
掌握 RAG 技术体系,包括:
文档提取与预处理(支持 PDF/Word/Markdown 等格式)。
嵌入模型应用(如 HuggingFace Embeddings、OpenAI Embeddings、Qwen Embedding 等)。
检索与召回技术(Faiss / Milvus / pgvector 等工具)。
大模型接口调用(OpenAI API、Qwen、DeepSeek 或本地部署的大模型)。
熟悉关系型与缓存数据库(PostgreSQL / MySQL / Redis),能够设计合理的数据存储方案与索引结构。
具备分布式架构和异步任务处理(Celery / RabbitMQ / Kafka 等)实践经验者优先。
熟悉容器化技术 Docker 及编排系统 Kubernetes,有云平台(AWS / Azure / 阿里云等)部署经验者优先。
具备良好编码规范,熟练使用 Git / CI/CD 工具,能编写高质量且易于测试的代码。
对 AI 应用与 RAG 架构有强烈兴趣,拥有快速学习能力和问题解决能力。
加分项
有真实落地的 RAG 项目经历(如企业知识库、智能问答系统、文档搜索平台等)。
了解 LangChain / LlamaIndex 等典型 RAG 开发框架。
具备学术论文检索、知识图谱构建或多模态检索相关背景者优先。
有开源社区贡献或技术博客输出者优先考虑。

潘先生IP:浙江杭州
杭州泛美学术智能科技
相关推荐查看更多 >
杭州
相同职位推荐
企业招聘
职位大全
相关搜索

