职位详情
微信扫码分享
举报
1-3年硕士发表算法相关优秀论文Java参加算法相关竞赛/获奖优秀开源项目经历PythonSQL自然语言处理算法
AI数据研发工程师
岗位职责:
•参与多源渠道的原始结构化与非结构化数据的采集、处理、清洗及特征提取工作,涵盖网页信息、网络流量、音视频内容等多样化数据类型
•联动模型算法团队与数据采集团队,持续监控数据质量,分析数据对模型性能的影响,推动构建数据系统的迭代机制
•建立并优化数据质量评估体系,提升数据在多样性、覆盖性方面的综合水平
•设计高效的数据存储架构、加载流程与采样策略,支撑模型训练效率提升
要求:
•硕士及以上学历,计算机科学、通信工程、数学或相关专业背景,具备海外学习经历者优先考虑
•精通至少一种编程语言(如Python、Java等)
•熟悉大模型场景下的数据采样方法论
•掌握数据增强与合成相关技术手段
•具备扎实的数据分析能力,能够针对文本或多模态数据提取核心特征(如词频统计、语义分布、数据偏差识别、网络流量特征分析等)
优先条件:
具备网络流量数据清洗实践经验者优先
有数据集构建与数据质量管控经验者优先
参与过开源高质量数据集项目建设者优先
参与过开源微调模型相关的数据治理与评估工作优先
职位总结围绕职位描述,归纳工作内容、招聘要求

李先生IP:北京
新华三
·人事经理相关推荐查看更多 >
海淀区
相同职位推荐
企业招聘

