IBM在CVPR2019上推进多标签少样本图像分类社会领域迎来新技术

IBM在CVPR2019上推进多标签少样本图像分类社会领域迎来新技术

在本次文章中,我们将探讨一个关键的研究领域——多标签小样本图像分类。IBM的研究人员已经对这一课题进行了深入的研究,并在CVPR 2019大会上发表了一篇论文。在这篇论文中,提出了名为LaSO(Label-Set Operations networks for multi-label few-shot learning)的网络,它能够合并图像样本和标签,从而产生新的训练样本。

对于多标签小样本图像分类来说,每个类别通常只有少量的训练数据。这使得模型难以学习如何识别这些类别。此外,大部分关于图像小样本分类的研究都是基于单标签场景,即每个训练图片只包含一个对象。但是,在现实世界中,很多场景都涉及到多个对象和相应的多个标签。

为了解决这个问题,LaSO网络通过结合两个或更多相关图片以及它们的一些共同特征来生成新的训练示例。例如,如果我们有两张图片,一张显示一个人抱着狗和猫,而另一张则显示一个人遛羊,这两张图片可以被用来生成一系列新的示例,其中可能包括“人、狗、猫”或者“人、羊”的组合。

LaSO网络不需要额外输入来指导操作,因此它可以在没有任何额外干预的情况下泛化到包含未曾见过新类别的图像上。这种能力使得它成为挑战性的多标签小样本分类任务中的强大工具。在我们的评估结果中,我们发现使用LaSO网络进行数据增强具有很强的地应用潜力。

总之,这项工作向人们展示了如何通过创造性地使用神经网络功能来克服传统方法无法处理的小样本问题,同时也激励其他研究者进一步探索这个富有挑战性的领域。