图像数据增强技术详解
列举并解释常见的图像数据增强方法,以及自动化增强策略(AutoAugment/RandAugment)的工作原理。
回答
专业代码师
基础增强:
- 几何变换:随机翻转、旋转(±15°)、裁剪、缩放
- 色彩变换:亮度/对比度/饱和度调整、灰度化
- 噪声注入:高斯噪声、椒盐噪声
- 模糊:高斯模糊、运动模糊、中值模糊
高级自动增强:
- Cutout/Random Erasing:随机遮挡矩形区域,提升遮挡鲁棒性
- Mixup (2018):两张图线性混合,标签也线性混合:
x' = λ*x_i + (1-λ)*x_j - CutMix (2019):切割一张图区域粘贴到另一张,标签按面积比例混合
- AutoAugment (2018):用强化学习搜索最优增强策略组合,在ImageNet上提升1-2%
- RandAugment (2019):简化版,固定N个操作和M幅度参数,无需搜索,效果接近AutoAugment
PyTorch实现:torchvision.transforms 提供全套基础操作,RandAugment 已集成在 torchvision.transforms.autoaugment 中。