计算机视觉理论、技术和现实问题 - bettermorn/IAICourse GitHub Wiki

现实问题

数据增强：对少数类样本进行图像变换，如旋转、缩放、平移、翻转等，生成更多的训练数据，增强模型的鲁棒性。
重采样技术：过采样和欠采样过采样：增加少数类样本的数量，可以通过简单复制或使用合成方法，如SMOTE（Synthetic Minority Over-sampling Technique）生成新的样本。欠采样：减少多数类样本的数量，随机删除部分样本，防止模型过度偏向多数类。
类别加权：样本加权和损失函数加权
生成式模型：SMOTE和GAN 利用GAN生成少数类的合成样本，增加数据多样性。
调整损失函数：

加权损失函数：在损失函数中对少数类赋予更高的权重，如加权交叉熵（Weighted Cross-Entropy）。焦点损失（Focal Loss）：减少对易分类样本的关注，专注于困难样本的学习。

选择方法需要注意：数据分布的特点、模型的复杂度和训练时间等。

自监督预训练方法用来应对标签数据较少的情况 CAE，BEiT（（ViT）），MAE

End-to-End Object Detection with Transformers https://github.com/facebookresearch/detr

迁移学习（Transfer Learning）：

利用在大规模数据集（如ImageNet）上预训练的模型，将其特征提取部分应用于新任务，然后在少量数据上微调模型。数据增强：

对现有的有标签数据进行变换，生成更多样本，缓解数据不足的问题。半监督学习（Semi-Supervised Learning）：

结合大量未标注数据与少量标注数据，通过方法如自训练（Self-Training）、一致性正则化（Consistency Regularization）等提升模型性能。自监督学习（Self-Supervised Learning）：

设计预任务（如图像重建、图像色彩填充），在无标签数据上学习特征，再将其应用于目标任务。主动学习（Active Learning）：

让模型主动选择对其学习最有帮助的样本进行标注，减少标注成本。少样本学习（Few-Shot Learning）：

使用元学习（Meta-Learning）方法，使模型能够从少量样本中学习泛化能力。弱监督学习（Weakly Supervised Learning）：

利用不完整、噪声或粗粒度的标签进行训练，降低对精确标签的依赖。