岗位职责:
1、数据全流程管理
设计并实施AI多模态数据采集方案,涵盖图像、视频、文本等类型,保障样本多样性与实际场景的广泛覆盖。
制定数据标注规范(如目标检测、视频理解等),优化标注工具(LabelStudio/CVAT)操作流程,提升标注效率与一致性。
构建自动化数据清洗流程,处理噪声、缺失、重复等问题,确保输出可用于训练的高质量数据集。
2、团队管理与协作
负责5-20人规模的数据采编及标注团队管理,建立绩效考核机制,保障项目按期交付。
对接算法团队,深入理解其数据需求,编写数据采集、清洗与处理脚本;分析数据质量问题对模型性能的影响(如标注偏差造成5%精度下降),推进数据持续迭代优化。
3、成本与质量管控
应用预标注技术(半监督工具如Snorkel)和自动化质检手段(规则引擎结合随机抽样),有效降低人工标注成本。
建立三级质量审查机制(标注员自检→组长复核→算法团队抽检),将数据错误率严格控制在0.5%以内。
任职要求:
1、熟练运用Python/SQL进行数据清洗与分析(熟悉Pandas/OpenCV/正则表达式)。
2、掌握主流数据库系统(MySQL/MongoDB)及常见标注格式(COCO/YOLO/JSON)。
3、了解计算机视觉领域数据需求,具备数据增强(DataAugmentation)和数据版本管理(DVC)实践经验。
4、具有5-20人团队管理经历,擅长SOP(标准操作流程)制定及成本控制(如外包与自有团队协同调度)。
5、具备跨部门沟通能力,能向非技术成员阐明数据质量的重要性,协调算法、法务、外包等多方资源推进工作。
6、主动识别数据中的长尾问题(如罕见场景覆盖不足),推动标注工具的功能优化与二次开发。
7、2年以上AI数据管理经验,有AI项目中数据标注与管理的实际案例;
8、本科及以上学历,计算机科学、数学、统计学等相关专业背景。

今日回复1次|
湖南球秀体育科技有限公司
相关推荐查看更多 >
长沙

