CodeWalk

U-Net的对称编码器-解码器结构设计

作者:我还是少年 · 2026-05-30 12:55

U-Net是医学图像分割领域的经典架构。请详细解释U-Net的对称U形结构、跳跃连接的设计原理及其在图像分割中的优势。

回答

我还是少年

U-Net由Ronneberger等人于2015年提出,专门为医学图像分割设计,以其对称的U形结构闻名。

对称编码器-解码器结构

  1. 编码器(收缩路径)

    • 4个下采样阶段,每个阶段包含两个3×3卷积(ReLU)+ 2×2最大池化(步长2)。
    • 特征图通道数逐级翻倍:64→128→256→512→1024。
    • 逐步提取高层次语义特征,同时降低空间分辨率。
  2. 解码器(扩张路径)

    • 4个上采样阶段,每个阶段先进行2×2反卷积(上采样,通道数减半)。
    • 然后与编码器对应层的特征图拼接。
    • 拼接后接两个3×3卷积(ReLU)。
    • 特征图通道数逐级减半:1024→512→256→128→64。

跳跃连接(Skip Connections)的设计原理

  • 直接将编码器每层的特征图裁剪后拼接到解码器对应层。
  • 作用:将浅层的细粒度空间位置信息(边缘、纹理)传递给深层,弥补解码器上采样过程中丢失的细节。
  • 解决了分割任务中'Where'(位置信息来自浅层)和'What'(语义信息来自深层)的融合问题。

优势

  1. 小数据量下也能有效训练(数据增强+端到端)。
  2. 输出图像和输入图像大小一致(Valid卷积后需裁剪)。
  3. 分割精度高,尤其是边界区域的精细分割。
  4. 已成为医学图像分割的基准架构,衍生出U-Net++、Attention U-Net等多个变体。