分割指标

Apr 25, 2024
1 views
Computer Vision

PA

Pixel Accuracy(PA,像素精度):这是最简单的度量,为标记正确的像素占总像素的比例。

\[ PA=\frac{\sum_{i=0}^{k}{p_{ii}}}{\sum_{i=0}^{k}\sum_{j=0}^{k}{p_{ij}}} \]

图像中共有k+1(包含背景)类,\(p_{ii}\) 表示将第i类分成第 \(i\) 类的像素数量(正确分类的像素数量),\(p_{ij}\)表示将第 \(i\) 类分成第 \(j\) 类的像素数量(所有像素数量)

因此该比值表示正确分类的像素数量占总像素数量的比例。

优点:简单

缺点:如果图像中大面积是背景,而目标较小,即使将整个图片预测为背景,也会有很高的PA得分,因此该指标不适用于评价以小目标为主的图像分割效果。

MPA

Mean Pixel Accuracy(MPA,均像素精度):是PA的一种简单提升,计算每个类内被正确分类像素数的比例,之后求所有类的平均。

\[ MPA=\frac{1}{k+1}\sum_{i=0}^{k}{\frac{p_{ii}}{\sum_{j=0}^{k}{p_{ij}}}} \]

MIoU

Mean Intersection over Union(MIoU,均交并比):为语义分割的标准度量。其计算两个集合的交集和并集之比,在语义分割的问题中,这两个集合为真实值(ground truth)和预测值(predicted segmentation)。

\[ MIoU=\frac{1}{k+1}\sum_{i=0}^{k}{\frac{p_{ii}}{\sum_{j=0}^{k}{p_{ij}}+\sum_{j=0}^{k}{p_{ji}}-p_{ii}}} \]

单独考虑第 \(i\) 类:

分子:所有被正确分类为第i类的像素数\(p_{ii}\)

分母:所有标签为第i类的像素数+所有被分类为第i类的像素数-被正确分类为第i类的像素数

即对每一个类别计算IoU,再对各类求均值。

FWIoU

Frequency Weighted Intersection over Union(FWIoU,频权交并比):为MIoU的一种提升,这种方法根据每个类出现的频率为其设置权重。

\[ FWIoU=\frac{1}{\sum_{i=0}^{k}{\sum_{j=0}^{k}{p_{ij}}}}\sum_{i=0}^{k}{\frac{\left(\sum_{j=0}^{k}{p_{ij}}\right)p_{ii}}{\sum_{j=0}^{k}{p_{ij}}+\sum_{j=0}^{k}{p_{ji}}-p_{ii}}} \]

其中,\(∑_{i=0}^k∑_{j=0}^kp_{ij}\)即为所有类的像素总数。\(∑_{j=0}^kp_{ij}\)为真实情况下属于第i类的像素总数。\(∑_{j=0}^kp_{ji}\)即为预测为第 \(i\) 类的像素总数。

在以上所有的度量标准中,MIoU由于其简洁、代表性强而成为最常用的度量标准,大多数研究人员都使用该标准报告其结果。PA对于样本不均衡的情况不适用。

DICE

DICE与IOU很相似,具体两者的区别如下:

$$
\text{DC} = \frac{2 TP}{2 TP + FP + FN} = \frac{2|X \cap Y|}{|X| + |Y|}\\text{IoU} = \frac{TP}{TP + FP + FN} = \frac{|X \cap Y|}{|X| + |Y| - |X \cap Y|}

$$

从中可以看出,\(DC\geq IoU\)(两者相减得到的式子中分子为 \(|X| + |Y| - 2|X \cap Y|\) ,显然分子大于0)。