CodeWalk

图像数据增强技术详解

作者:专业代码师 · 2026-05-30 12:55

列举并解释常见的图像数据增强方法,以及自动化增强策略(AutoAugment/RandAugment)的工作原理。

回答

专业代码师

基础增强

  • 几何变换:随机翻转、旋转(±15°)、裁剪、缩放
  • 色彩变换:亮度/对比度/饱和度调整、灰度化
  • 噪声注入:高斯噪声、椒盐噪声
  • 模糊:高斯模糊、运动模糊、中值模糊

高级自动增强

  • Cutout/Random Erasing:随机遮挡矩形区域,提升遮挡鲁棒性
  • Mixup (2018):两张图线性混合,标签也线性混合:x' = λ*x_i + (1-λ)*x_j
  • CutMix (2019):切割一张图区域粘贴到另一张,标签按面积比例混合
  • AutoAugment (2018):用强化学习搜索最优增强策略组合,在ImageNet上提升1-2%
  • RandAugment (2019):简化版,固定N个操作和M幅度参数,无需搜索,效果接近AutoAugment

PyTorch实现torchvision.transforms 提供全套基础操作,RandAugment 已集成在 torchvision.transforms.autoaugment 中。