CodeWalk

空洞卷积(Dilated Convolution)的原理是什么?

作者:小字辈 · 2026-05-30 12:55

请解释**空洞卷积/扩张卷积(Dilated Convolution)**的工作原理,以及它如何在不增加参数量的情况下扩大感受野。

回答

小字辈

空洞卷积在卷积核元素之间插入空洞(dilation rate r),r=1为普通卷积,r=2时等效于3×3核覆盖5×5区域但只有9个非零参数。公式:等效核大小 = K + (K-1)·(r-1)。优势:(1)不增加参数量和计算量即可扩大感受野。(2)保持特征图空间分辨率(无需下采样)。应用:(1)语义分割(DeepLab系列)——使用不同dilation rate的并行空洞卷积(ASPP)捕获多尺度上下文。(2)语音合成(WaveNet)——堆叠空洞卷积实现长时序依赖建模。注意事项:如果dilation rate设置不当(如r=2重复堆叠),可能导致「棋盘效应」(网格伪影)。建议使用HDC(Hybrid Dilated Convolution)设计。