语音算法工程师
面议【岗位职责】
1.多模态算法研发:负责基于课堂音频的AI分析系统核心算法研发,涵盖语音识别(ASR)、自然语言处理(NLP)等多模态技术,实现对教学内容、课堂提问等维度的自动化识别与量化分析。
2.语音与内容理解:构建高准确率的课堂语音识别(ASR)系统,结合NLP技术进行教学内容主题提取、关键词识别、提问频率统计与知识覆盖分析,支持教学过程的语义化理解。
3.算法工程化落地:推动算法在边缘设备(如Jetson)或云端的部署优化,关注模型轻量化、推理效率与稳定性,确保在真实教室环境中的高效运行。
4.技术调研与前沿探索:跟踪AI+教育领域的最新技术进展(如多模态大模型、行为理解、教育知识图谱),持续推动产品技术升级。
【职位要求】
1.经验背景:
硕士及以上学历,计算机、人工智能、模式识别、自动化等相关专业,3年以上语音算法研发经验。
有语音识别(ASR)或Whisper项目经验者优先。
熟悉NLP、Wav2Vec、BERT、LLM等模型者更佳。
2.专业技能:
精通Python,熟悉PyTorch/TensorFlow等深度学习框架,具备扎实的算法实现与调优能力。
熟悉语音情感识别、声纹分离(SpeakerDiarization)技术。
掌握模型压缩、量化、边缘部署(TensorRT、ONNX)等工程优化技能。
对多模态学习、视觉-语言模型(如CLIP、Qwen-VL)有实际研究或应用经验者优先。
熟悉常用数据处理与分析工具(Pandas、NumPy、SQL),具备良好的工程规范意识。
3.能力素质:
具备强烈的技术自驱力与问题解决能力,能独立完成从算法设计到落地的全流程。
良好的跨团队协作能力,能与产品、前端、后端、硬件团队高效沟通。
对教育行业有热情,理解高校教学场景,具备一定的教育数据敏感度。
具备优秀的文档撰写和技术表达能力,能清晰输出技术方案与设计文档。
【加分项】
有多模态大模型(VL)或VQA项目经验,并在实际场景中落地。
----------------------------------------------------------------------
【公司背景】
我们是一家专注于高等教育大数据领域的咨询服务公司,我们拥有:
1)行业领军地位:成立于2006年,是产业开拓者和领跑者,已深耕高等教育19年
2)超半数的市场占有率:服务了北大、浙大、复旦等超过1600所院校,拥有超50%的市场占有率;
3)权威和公信力的官方认定:中国科协、人社部、司法部、世界经济合作与发展组织等机构的研究合作单位,并是北大、北师大、清华等高校的产学研基地;就业蓝皮书数据及《中国-世界高等教育趋势报告》核心议题得到了权威媒体的广泛报道;
4)数据改变教育,我们的工作价值体现是推动中国高教发展。
【团队介绍】
作为公司核心团队之一,我们是一支年轻、充满活力的团队。在这里,没有森严的等级,只有开放的讨论;没有无意义的加班,只有灵活的工作节奏(灵活上下班时间,拒绝996!)。我们采用扁平化管理。无论是技术探讨还是业务决策,每个人都能参与其中。我们鼓励持续学习,并会提供行业前沿的培训资源、定期的知识分享会,以及充足的试错空间,让你在实战中快速提升。如果你渴望一个轻松但不松懈、自由但有追求的工作环境,与一群聪明、有趣的伙伴共同进步、做有意义的事,欢迎加入我们!
【福利待遇】
1.极具竞争力的薪酬体系
基本工资+绩效奖金+年终奖+餐补,叠加节日福利,让你的努力获得丰厚回报。
2.顶尖团队,快速成长
加入全成都最高配的高等教育+AI研发团队,氛围轻松,拒绝内卷。全程参与高校核心项目,站在更高起点,快速成长,拓宽视野。
3.超Nice的日常福利
•下午茶:工间补给+不定期加餐,吃胖了可不算工伤哦~
•快乐团建:部门聚餐、不定期主题活动,工作也要尽情放飞自我!
•贴心关怀:带薪年假+司龄福利假,年度体检,婚礼&生育礼金,儿童节福利……全方位关注你的生活。

麦可思数据科技(成都)有限公司
点击查看地图