文章图片
文章图片
文章图片
人工智能深度学习的数据标注已经发展成为一个全新的行业 , 机器学习对于数据的需求不仅仅数量在上升 , 质量和精确度也在不断的增加 。 在这样一个行业背景下 , 对于像数据标注师、质检师和项目经理等专业人才的需求量也大量增加 。 所以 , 想要加入这个行业 , 不仅仅要学习了解什么是数据标注?更要学习数据标注的类型有哪些 , 并且能够在相应的项目标注平台上熟练操作 。
常见的数据标注类型
数据标注有很多类型 , 如分类标注、标框标注、描点标注、区域标注等 。 接下来 , 精数标注研究院带大家学习几种常见的数标注分类 , 希望对大家在学习工作中有所帮助 。
基础的数据标注类型有计算机视觉、语音工程、自然语言处理 。
1、计算机视觉类:
计算机视觉类
拉框标注:用2D框、3D框、多边形框等标注出图像或视频数据中的指定目标对象 。
语义分割:标记图像中存在的内容及位置 , 根据属性进行像素级分割 , 支持单属性、多级属性 。
3D点云标注:将点云数据图像中的多类指定对象使用3D框进行标注 。
关键点标注:对人脸关键点、人体骨骼关键点、人脸五官等进行关键点标注 。
线标注:支持贝塞尔曲线和普通线段标注 , 支持对车道线进行贝塞尔曲线标注 , 使用线段将图像目标的边缘、轮廓用线段标注 。
2D/3D融合标注:对2D平面图与3D点云图映射的数据组进行标注 , 支持自动贴边、跨帧复制、测距、2/3D图片标注分离等多种功能 。
2、自然语言处理类:
自然语言处理
OCR转写:将图像中的文字进行识别 , 并以文本的形式转写 。
文本信息抽取:把文本里包含的信息进行分类和打标签等结构化处理 。
NLU语句泛化:基于特定文本数据进行多角度泛化 , 以不同的描述方式重组语句 。
词性标注:基于特定文本数据进行词性理解标注 , 如动词、名词、形容词等 。
情感判断:针对指定文本数据 , 判断该文本的情感类别并给出相应的标签 , 如积极、消极等 。
意图判断:常使用分类的方法将句子分为相应的意图种类 , 进而判断语义意图 。
3、语音工程类:
语音工程
ASR语音转写:提取语音数据特征 , 转写为对应的文本或命令 。
语音情绪判定:从语音数据中识别说话人的情绪状态 。
声纹识别标注:对音频数据中的说话人进行辨认或确认 。
语音切割:根据需求 , 将语音实现分段切割 。
按照标注的难易程度来划分 , 可以分为常识性标注和专业性标注:
1、常识性标注:比如标注道路标线、路牌、地图等数据 , 语音识别标注等数据都属于常识性标注 。 这种类型的标注因为应用的场景多且复杂 , 所以需要大量的标注训练样本 , 标注员只要认真负责、项目完成效率高、质量好就是一名好的标注师 。
地图标注
2、专业性标注:比如医疗诊断、航空航天、电力系统等专业领域的标注 。 该类型的标注工作需要有领域专业知识的标注员 , 或者称为标注专家 , 标注的工作难度也大 。
智慧医疗
【自然语言处理|数据标注有哪些类型?】
相关经验推荐
- 红米手机|性价比排名第1的手机,搭载天玑8100处理器,如今官方跌至1569元
- 三星Galaxy|手机出货数据出炉,芯片堆积库存,两大美企坐不住了?
- 联想|为什么建议以团队的形式开展数据标注,而非个人
- vivo|AMD发布锐龙7000处理器:真良心厂商?性能大涨价格还降了
- 荣耀|荣耀太疯狂,荣耀80将提前到11月发布,不止处理器会升级
- 小米科技|骁龙8+旗舰处理器,120W+5000mAh大电池,99%好评率
- |iPhoneSE4概念机:刘海全屏+A16处理器,比iPhone14还要香?
- 联想|你的海量隐私数据,交由联想个人云存储X1s替你守护!
- |腾讯云游戏掌机曝光,AMD 7000系发布,看数据很Yes!
- 潘塔|ROG幻142022,AMD处理器独显,14英寸轻薄高端全能本