5种类型的图像注释简介
点击上方蓝字关注我们!
寻找有关不同图像注释类型的信息?在AI和机器学习的世界中,数据为王。没有数据,就不会有数据科学。为了使AI开发人员和研究人员实现其项目的宏伟目标,他们需要访问大量高质量数据。关于图像数据,机器学习的一个主要领域需要计算机视觉中的大量带注释的图像。
目录
- 什么是计算机视觉?
- 什么是图像注释?
- 常用图像注释类型
- 2D边界框
- 3D边界框/长方体
- 多边形
- 线和样条线
- 语义分割
什么是计算机视觉?
计算机视觉是机器学习和AI开发的最大领域之一。简而言之,计算机视觉是AI研究领域,旨在使计算机看到并以视觉方式解释世界。从自动驾驶汽车和无人机到医疗诊断技术和面部识别软件,计算机视觉的应用是巨大而革命性的。
由于计算机视觉处理的是模仿或超越人类视觉功能的正在开发的机器,因此训练此类模型需要大量带注释的图像。
什么是图像注释?
图像批注只是将标签附加到图像的过程。范围可以是整个图像的一个标签,也可以是图像内每组像素的多个标签。一个简单的例子是为人类注释者提供动物图像,并让它们用正确的动物名称标记每个图像。当然,标记方法取决于项目使用的图像注释类型。那些有时被称为地面真实数据的带注释的图像随后将被馈送到计算机视觉算法。通过训练,模型便能够将动物与未注释的图像区分开。
虽然上面的示例非常简单,但要进一步扩展到计算机视觉(如自动驾驶汽车)的更复杂区域,则需要更复杂的图像注释。
最常见的图像注释类型是什么?
想知道哪种图像注释类型最适合您的项目?以下是五种常见的图像批注类型及其一些应用。
1.边界框
对于边界框注释,将为人类注释器提供图像,并负责在图像中的某些对象周围绘制框。该框应尽可能靠近对象的每个边缘。该工作通常在不同公司的自定义平台上完成。如果您的项目有独特的需求,则有些公司可以调整其现有平台来满足您的需求。
包围盒的一种特定应用是自动驾驶汽车的开发。注释者将被告知在交通图像中围绕车辆,行人和骑自行车者等实体绘制边界框。
开发人员将为机器学习模型提供带有边界框注释的图像,以帮助自动驾驶车辆实时区分这些实体并避免与它们接触。
2. 3D长方体
与边界框非常相似,3D长方体注释通过在图像中的对象周围绘制框来对注释器执行任务。边界框仅描绘了长度和宽度,而3D长方体则标记了长度,宽度和近似深度。
使用3D长方体注释,人类注释者可以绘制一个框来封装感兴趣的对象,并将锚点放置在对象的每个边缘上。如果对象的一个边缘不可见或被图像中的另一个对象遮挡,则注释器会根据对象的大小和高度以及图像的角度来估算边缘的位置。
3.多边形
有时,图像中的对象由于其在图像中的形状,大小或方向而无法很好地适合边界框或3D长方体。同样,有时开发人员希望对图像中的对象进行更精确的注释,例如交通图像中的汽车或空中图像中的地标和建筑物。在这些情况下,开发人员可能会选择多边形注释。
使用多边形时,注释器通过在要注释的对象的外边缘周围放置点来绘制线。这个过程就像一个连接点练习,同时放置点。然后,使用一组预定的类别(例如汽车,自行车,卡车)对由点包围的区域内的空间进行注释。当分配了多个类进行注释时,称为多类注释。
4.线和样条线
尽管线和样条线可以用于多种用途,但它们主要用于训练机器以识别车道和边界。顾名思义,注释器将简单地沿着您需要机器学习的边界画线。
线条和样条线可用于训练仓库机器人以准确地将箱子连续放置或将物品放在传送带上。但是,线和样条线注释的最常见应用是自动驾驶汽车。通过注释车道和人行道,可以训练自动驾驶汽车了解边界并停留在一条车道上而不会转向。
5.语义分割
尽管此列表中的先前示例涉及概述对象的外部边缘或边界,但语义分段要更加精确和具体。语义分割是将整个图像中的每个单个像素与标签相关联的过程。对于需要语义分段的项目,通常会为人工注释者提供一系列预定标签,以便从中选择必须标记的内容。
使用多边形注释中使用的类似平台,注释器将在要标记的一组像素周围绘制线条。这也可以在AI辅助平台上完成,例如,程序可以近似汽车的边界,但可能会出错,并且在分割中包括汽车下方的阴影。
在这种情况下,人工注释者将使用单独的工具裁剪不属于您的像素。例如,利用自动驾驶汽车的训练数据,注释者可能会得到以下指示:“请按道路,建筑物,骑自行车的人,行人,障碍物,树木,人行道和车辆对图像中的所有内容进行细分。”
语义分割的另一个常见应用是医学成像设备。对于解剖学和身体部位标签,注释者将获得一个人的照片,并被告知使用正确的身体部位名称标记每个身体部位。语义分割还可以用于难以置信的特殊任务,例如在CT扫描图像中标记脑部病变。
这些只是机器学习和AI开发中使用的五种常见图像注释类型。
如果您有一个具有独特要求的项目或需要自定义AI培训数据,请与Lionbridge AI联系,以了解我们如何为您提供帮助。我们的多语言社区拥有超过一百万的贡献者,可以帮助您在需要时获取所需的数据。
主题:
AI,人工智能, 计算机视觉, 数据注释 数据科学 数据集 机器学习 毫升 训练数据
往期推荐
更多资源请关注公众号或点击下方“阅读原文”,回复关键词获取