职位详情
微信扫码分享
投诉
岗位职责
负责基于FastAPI的后端服务架构与开发,保障接口的高性能、高可用与安全性。
参与RAG(检索增强生成)系统的整体设计与实现,涵盖文档解析、向量化处理、信息检索、结果召回及大模型集成。
承担向量数据库(如Milvus/Faiss/Weaviate/PostgreSQL+pgvector)的规划、调优与日常维护工作。
持续优化文本分块策略、索引机制与检索逻辑,提升系统在准确率、召回率和响应效率方面的表现。
协同前端、产品及算法团队高效推进,推动AI应用场景的落地实施。
撰写规范的技术文档,确保代码具备良好的可读性、可维护性与扩展能力。
任职要求
本科及以上学历,计算机、软件工程、人工智能等相关专业者优先考虑。
精通Python编程,掌握FastAPI/Flask/Django等主流Web框架,有实际项目中使用FastAPI的经验。
具备RAG技术体系相关经验,熟悉以下环节:
文档提取与预处理(支持PDF/Word/Markdown等格式)。
嵌入模型应用(如HuggingFaceEmbeddings、OpenAIEmbeddings、QwenEmbedding等)。
检索与匹配技术(Faiss/Milvus/pgvector等工具)。
大模型接口对接(OpenAIAPI、Qwen、DeepSeek或本地部署的大模型)。
熟悉关系型与非关系型数据库(PostgreSQL/MySQL/Redis),能够设计合理的存储结构与索引方案。
有分布式架构、异步任务处理(Celery/RabbitMQ/Kafka等)实践经验者优先。
掌握Docker/Kubernetes部署流程,具备云平台(AWS/Azure/阿里云等)使用经验者更佳。
具备良好编码规范,熟练使用Git/CI/CD工具,能编写可测试、高质量的代码。
对AI技术应用与RAG架构有强烈兴趣,具备快速学习能力和问题解决能力。
加分项
拥有真实落地的RAG项目经历(如企业知识库、智能问答系统、文档搜索引擎等)。
熟悉LangChain/LlamaIndex等RAG开发框架。
有学术论文检索、知识图谱构建或多模态检索相关背景。
参与过开源项目贡献或有技术博客输出者优先录用。

潘先生IP:浙江杭州
杭州泛美学术智能科技
相关推荐查看更多 >
杭州
相同职位推荐
企业招聘
职位大全
相关搜索

