南国早报全媒体记者:巫碧燕/文 杨天雄/图
是谁把给人看的信息翻译给人工智能,让智能音箱能感知情绪、与人聊天,让自动驾驶汽车能识别路障、预知危险,让医疗AI能读懂报告、筛查诊断?
答案是——数据标注员。
4月28日,在南宁的广西残疾人就业创业示范基地,23岁的残障青年、如常集团广西公司员工黄卫东正聚精会神地坐在电脑前,将一张张照片上的车辆、行人、电线杆等物体框出、标注信息。这些标注的数据,将会源源不断地输送到自动驾驶实验室,成为智能汽车大脑运行的“燃料”。
黄卫东在整理数据信息。
数据标注,是将图片、文本等原始数据,转化为机器能理解的“识字卡片”,为人工智能模型的训练提供素材。2020年2月,数据标注员作为人工智能训练师的一个工种,被纳入国家职业分类目录。由于不用频繁外出,数据标注成了许多残疾人就业的新选择。
今年3月,黄卫东参加了残疾人数据标注定向就业培训班,学习了相关课程知识后,顺利上岗。
“标注要求准确具体,准确率要达到85%以上,比如说电线杆不能标注成水泥柱,红绿灯不能标注成交通灯,交通事故用的三角牌不能标注成围挡用的三角锥。”黄卫东说,实在无法分辨照片中的某样物体时,可以打“未知”标签。
现在,黄卫东每天能标注5000个物体,月收入3000元左右。他说:“数据标注能帮助智能汽车变得更聪明,出事故的概率更小,也给我带来了职业成就感。”
残障数据标注师在工作中。
23岁残障青年陈文吉入职仅两个月,就以出色的工作表现晋升为质检员,他对记者说:“数据标注考验的是细心和熟练度,质检员需要将准确率提升到99%以上,才能达到交付标准。”他有着明确的职业规划:“下一步,我要掌握三维、四维的标注任务。四维标注需考虑时间维度的连续性,更加复杂和具有挑战性。”
2025年1月,国家发展改革委等四部门发布的《关于促进数据标注产业高质量发展的实施意见》要求,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。
如常集团广西公司项目主管李振宇表示:“目前,人工智能领域迅速发展,数据标注的市场需求很大,我们希望提升标注产业专业能力,帮助更多残障人士高质量就业。”
人工智能的发展,促进残障人士多元就业。
本文由南国早报原创出品,未经许可,任何渠道、平台请勿转载。违者必究。
编辑 戴昕明
校对 黄立新
责编 谭双梅
审核 李沛