U-Net的对称编码器-解码器结构设计
U-Net是医学图像分割领域的经典架构。请详细解释U-Net的对称U形结构、跳跃连接的设计原理及其在图像分割中的优势。
回答
我还是少年
U-Net由Ronneberger等人于2015年提出,专门为医学图像分割设计,以其对称的U形结构闻名。
对称编码器-解码器结构:
-
编码器(收缩路径):
- 4个下采样阶段,每个阶段包含两个3×3卷积(ReLU)+ 2×2最大池化(步长2)。
- 特征图通道数逐级翻倍:64→128→256→512→1024。
- 逐步提取高层次语义特征,同时降低空间分辨率。
-
解码器(扩张路径):
- 4个上采样阶段,每个阶段先进行2×2反卷积(上采样,通道数减半)。
- 然后与编码器对应层的特征图拼接。
- 拼接后接两个3×3卷积(ReLU)。
- 特征图通道数逐级减半:1024→512→256→128→64。
跳跃连接(Skip Connections)的设计原理:
- 直接将编码器每层的特征图裁剪后拼接到解码器对应层。
- 作用:将浅层的细粒度空间位置信息(边缘、纹理)传递给深层,弥补解码器上采样过程中丢失的细节。
- 解决了分割任务中'Where'(位置信息来自浅层)和'What'(语义信息来自深层)的融合问题。
优势:
- 小数据量下也能有效训练(数据增强+端到端)。
- 输出图像和输入图像大小一致(Valid卷积后需裁剪)。
- 分割精度高,尤其是边界区域的精细分割。
- 已成为医学图像分割的基准架构,衍生出U-Net++、Attention U-Net等多个变体。