合并样本和标签IBM在社会场景下为多标签小样本图像分类带来新进展汽车最新资讯CVPR 2019

在当前的图像分类研究中，多数工作集中于单标签小样本场景，即每个训练图片只包含一个对象并且只有一个类别标签。然而，在现实世界中，多标签、小样本的图像分类更加常见，因为它们通常涉及到训练数据较少、图像具有多个标签的情况。IBM 的研究团队致力于解决这个问题，并在2019年的计算机视觉与模式识别（CVPR 2019）大会上发表了相关论文。

他们提出了名为LaSO（Label-Set Operations networks）的新方法，该方法结合了图像样本对和一定的标签集，以合成具有“合并”标签的新样本。这项技术可以将两个或更多不同类别的图片融合成新的训练图片，这些新的图片包括所有原始图片中的所有类别。此外，LaSO还能够执行交叉和减法操作以生成更多样的新样本。

为了测试LaSO网络的有效性，研究人员使用了大量预先训练好的分类器来对这些新的示例进行分类，并且使用这些网络生成特征向量来检索来自留存测试集中的相似图像。实验结果显示LaSO网络在进行数据增强时表现出色，而且有很强的潜力被推广到未知类别上。