职位详情
微信扫码分享
投诉
通过脚本化/平台化手段,提升数据标同学自动化效率与数据质量,为团队快速提高质量训练数据
职责:
1、负责文本/图像/音频等多模态数据的采集、清洗、去重与格式转换;开发维护半自动/全自动标注流水线,包括任务切分、预标注、质检、回流等环节;
2、基于现有标注工具进行二次开发或插件集成;持续监控标注流程的时效,成本与准确率,分析瓶颈并进行脚本服务升级优化;
3、能够与一线标注运营随时沟通,快速响应内部需求迭代工具;保障相关文档、手册培训的工具落地效果。
任职要求:
1、本科及以上学历(计算机/软件/电子信息相关专业)
2、2-3年python开发经验,熟悉常用数据结构、网络与Linux环境‘精通python快速脚本话能力,熟练使用pandas/Numpy/regex等做批量数据处理;熟练掌握至少一种主流Web框架(FastAPI/Django/Flask),掌握、熟悉Git、RESTful,基本掌握CI/CD流程、常见数据库;良好的编码规范与自测意识,有独立交付小型自动化项目的能力优先。
3、能编写前端页面(HTML/CSS/VanillaJS或VUE/React轻度使用)
4、了解LLM推理、Pytorch\RAG\LangChain/OpenALAPL等;熟悉向量数据库(Milvus/FAISS)或文本检索、数据去重等算法者优先。
认证资质
人力资源服务许可证劳务派遣经营许可证

王女士IP:江西鹰潭
3日内活跃|
中服云(北京)企业管理发展有限公司
相关推荐查看更多 >
朝阳区
相同职位推荐
企业招聘
职位大全
相关搜索

