合并样本和标签IBM在西安疫情最新资讯社会场景下多标签小样本图像分类取得新进展CVPR 2019

在当前的图像分类研究中，多数工作都是基于单标签小样本场景，即每个训练图片只包含一个对象并且只有一个类别标签。然而，在现实世界中，多标签、小样本的图像分类更加常见，因为它们通常涉及到数据较少和含有多个目标的场景。IBM 的研究团队正致力于解决这个问题，并在2019年的计算机视觉与模式识别（CVPR 2019）大会上展示了他们的最新进展。

为了克服这个挑战，他们提出了名为LaSO（Label-Set Operations networks）的新方法。这项技术通过将图像样本对与特定的标签集结合起来，创造出具有“合并”标签的新的训练样本。在这些操作中，“联合”会生成带有所有相关对象的新标签，而“交叉”和“减法”则会产生分别带有不同组合对象的新示例。

LaSO网络不仅能够直接在深度神经网络学习到的特征空间进行操作，而且还可以适应不同的任务，如使用预先训练过的大规模多标签数据集来共同训练。在测试过程中，它们被用来评估其在处理复杂内容方面的能力，这包括将生成出的示例输入给经过预先训练过的一流分类器以及用于留存测试集上的检索任务。