|数据标注员:隐身于人工智能背后的工兵

|数据标注员:隐身于人工智能背后的工兵

文章图片

|数据标注员:隐身于人工智能背后的工兵

文章图片

|数据标注员:隐身于人工智能背后的工兵

文章图片

|数据标注员:隐身于人工智能背后的工兵

文章图片

|数据标注员:隐身于人工智能背后的工兵

文章图片

|数据标注员:隐身于人工智能背后的工兵

当你划动网页推荐界面 , 在谈笑风生中走过门口的人脸识别仪器时 , 你会注意到 , 人工智能已经渗透入我们生活的角角落落 , 成为不可或缺的便利存在
而在高效的智能服务下 , 是庞大到不可思议的数据训练库堆砌起的坚实基石 , 以及隐身于智能背后数量庞大、参差不齐的“人工” 。 他们奠定了算法学习的基础 , 他们将庞大的数据分类、画框 , 教会算法识别;他们让每条数据与我们亲密接触、却又让我们无法触及他们的存在
他们究竟过着怎样的生活?他们的人生规划是什么?他们对人工智能态度又如何?以及 , 随着科技迅速发展 , 他们会有一天沦为人工智能的垫脚石与时代的牺牲品吗?



人工标注帮助AI快速落地
随着人工智能的发展 , 数据的训练量非常大 , 数据标注公司应运而生 , 这些公司以网络方式运作 , 一个平台有产品经理和项目经理 , 接到一个任务就找人来做 , 大家通过网络群组报名后 , 由产品经理来培训 , 之后各自领取自己的任务 , 登录账号进行标注 , 检验经理校验合格后就付钱 , 不合格则需要重新修正

数据标注员工作类型
我们可以这样想一下 , 在上学的时候 , 老师会把列题划分出来教给学生 , 当学生做了大量的测试题后 , 遇到这种题型就知道该怎么做了 , 标注也是同样的道理 , AI训练师是智能的老师 , 帮它去纠正错误 , 认知我们这个世界
因此标注过程中会遇到各种类型的数据 , 简单的可以理解为以下几个:
语音标注:大部分为语音转写 , 包含普通话 , 方言、小语种等 , 听一段音频 , 把文字敲出来;
文本标注:给一段文字 , 把时间、地点、人物标注来 , 然后总结一下这段文字描述的内容;
视频标注:看视频总结这段视频所讲述的事情 , 或者根据视频内容添加字幕等;
人脸标注:在图片上标注眼睛、嘴巴、眉毛、鼻子等器官;
图像语义分割:在图片上标注不同属性的物体 , 如人、车辆、道路、树木、行驶区域等;
2D标注:包含图片类所有标注 , 还包含在图片上拉框标注行人、建筑物及2D地图类标注等;

3D点云标注:通过拍摄车顶部的摄像头及雷达 , 拍摄2D图片和镭射出3D点状云图 , 在点状云图中根据2D图片标出车辆、行人、障碍物等;

数据标注需求持续增加
“现在科研界研究的都是无监督、小样本的深度学习 , 通过三维合成数据 , 用虚实结合的数据生成方式来训练机器 , 尽量减少数据的采集和标注 , 让机器自主学习、自主进化 。 ”但由于缺乏理论上的突破性技术 , 所以虽然技术增长速度很快 , 但整体水平还比较低

相关经验推荐