IBM在CVPR2019上推进多标签少样本图像分类社会领域迎来新技术

在本次文章中，我们将探讨一个关键的研究领域——多标签小样本图像分类。IBM的研究人员已经对这一课题进行了深入的研究，并在CVPR 2019大会上发表了一篇论文。在这篇论文中，提出了名为LaSO（Label-Set Operations networks for multi-label few-shot learning）的网络，它能够合并图像样本和标签，从而产生新的训练样本。

对于多标签小样本图像分类来说，每个类别通常只有少量的训练数据。这使得模型难以学习如何识别这些类别。此外，大部分关于图像小样本分类的研究都是基于单标签场景，即每个训练图片只包含一个对象。但是，在现实世界中，很多场景都涉及到多个对象和相应的多个标签。

为了解决这个问题，LaSO网络通过结合两个或更多相关图片以及它们的一些共同特征来生成新的训练示例。例如，如果我们有两张图片，一张显示一个人抱着狗和猫，而另一张则显示一个人遛羊，这两张图片可以被用来生成一系列新的示例，其中可能包括“人、狗、猫”或者“人、羊”的组合。