计算机视觉图像检测和图像分割有什么区别

来源：条形码时间：2023/7/18

字幕组双语原文：计算机视觉：图像检测和图像分割有什么区别？

英语原文：WhatisthedifferencebetweenObjectDetectionandImageSegmentation?

翻译：雷锋字幕组（明明知道）

人工智能中的图像处理人工智能对于图像处理有不同的任务。在本文中，我将介绍目标检测和图像分割之间的区别。

在这两个任务中，我们都希望找到图像中某些感兴趣的项目的位置。例如，我们可以有一组安全摄像头照片，在每张照片上，我们想要识别照片中所有人的位置。

通常有两种方法可以用于此：目标检测（ObjectDetection）和图像分割（ImageSegmentation）。

目标检测-预测包围盒

当我们说到物体检测时，我们通常会说到边界盒。这意味着我们的图像处理将在我们的图片中识别每个人周围的矩形。

边框通常由左上角的位置（2个坐标）和宽度和高度（以像素为单位）定义。

来自开放图像数据集的注释图像。家庭堆雪人，来自mwvchamber。在CCBY2.0许可下使用的图像。

如何理解目标检测方法?

如果我们回到任务：识别图片上的所有人，则可以理解通过边界框进行对象检测的逻辑。

我们首先想到的解决方案是将图像切成小块，然后在每个子图像上应用图像分类，以区别该图像是否是人类。对单个图像进行分类是一项较容易的任务，并且是对象检测的一项，因此，他们采用了这种分步方法。

当前，YOLO模型（YouOnlyLookOnce）是解决此问题的伟大发明。YOLO模型的开发人员已经构建了一个神经网络，该神经网络能够立即执行整个边界框方法！

当前用于目标检测的最佳模型

YOLOFasterRCNN图像分割-预测掩模

一步一步地扫描图像的逻辑替代方法是远离画框，而是逐像素地注释图像。

如果你这样做，你将会有一个更详细的模型，它基本上是输入图像的一个转换。

如何理解图像分割方法?

这个想法很基本：即使在扫描产品上的条形码时，也可以应用一种算法来转换输入信息（通过应用各种过滤器），这样，除了条形码序列以外的所有信息在最终图像中都不可见。

左图：

下一篇文章：没有了