合并样本和标签IBM在社会场景下为多标签小样本图像分类带来新进展汽车最新资讯CVPR 2019
在当前的图像分类研究中,多数工作集中于单标签小样本场景,即每个训练图片只包含一个对象并且只有一个类别标签。然而,在现实世界中,多标签、小样本的图像分类更加常见,因为它们通常涉及到训练数据较少、图像具有多个标签的情况。IBM 的研究团队致力于解决这个问题,并在2019年的计算机视觉与模式识别(CVPR 2019)大会上发表了相关论文。
他们提出了名为LaSO(Label-Set Operations networks)的新方法,该方法结合了图像样本对和一定的标签集,以合成具有“合并”标签的新样本。这项技术可以将两个或更多不同类别的图片融合成新的训练图片,这些新的图片包括所有原始图片中的所有类别。此外,LaSO还能够执行交叉和减法操作以生成更多样的新样本。
为了测试LaSO网络的有效性,研究人员使用了大量预先训练好的分类器来对这些新的示例进行分类,并且使用这些网络生成特征向量来检索来自留存测试集中的相似图像。实验结果显示LaSO网络在进行数据增强时表现出色,而且有很强的潜力被推广到未知类别上。
此次工作不仅提供了一个全新的基准用于评估神经网络在执行多任务操作方面的性能,还展示了通过利用有限数量的小样本学习如何改进AI模型。在汽车最新资讯领域,这种技术对于处理复杂场景中的多目标检测至关重要,如同时检测车辆、行人和交通信号灯等。
总之,本文探讨了一种名为LaSO网络的人工智能工具,它能够将单一输入转换为具有更高信息量和复杂性的输出,从而提高AI模型对于复杂环境下的理解能力。本文也激励其他研究者进一步探索这方面的问题,为实现更高效率、高质量的人工智能系统贡献力量。