负责为AI模型训练提供高质量结构化数据,对图像、文本、语音、视频、3D点云等多模态数据进行精准标注、清洗与质检,保障数据合规、准确、可用,支撑算法迭代与模型优化。
岗位职责
1. 多模态数据标注:按项目规则执行标注,包括:
- 图像/视频:框选、关键点、语义分割、目标跟踪(如自动驾驶标注行人/车辆);
- 文本:实体识别、情感分类、意图识别、语义标注;
- 语音:转写、情感/语速标注、静音切割;
- 点云:3D框选、障碍物标注(自动驾驶/机器人场景)。
2. 数据预处理与清洗:剔除无效/异常数据,完成格式转换、去重与标准化,保障数据符合模型输入规范。
3. 质量把控与自查:严格执行标注规范,自查标注结果;配合质检团队复核,修正错误,确保准确率达标(常见要求≥97%)。
4. 规则执行与反馈:理解并遵守标注手册;遇规则模糊/数据异常及时反馈,协助优化标注流程与规则。
5. 工具使用与效率达标:熟练操作LabelImg、Label Studio、Prodigy等标注工具;完成每日/每周产量指标,保障交付时效 。
6. 文档整理与协作:按要求归档标注数据与日志;与算法、产品团队同步进度,响应迭代需求。
任职要求
基本条件
- 学历:大专及以上,专业不限;计算机、统计学、信息管理等相关专业优先。
- 经验:不限经验,接受应届生/实习生;有标注经验、熟悉多模态标注者优先。
- 基础能力:熟练电脑操作(Windows+Office),打字≥50字/分钟;