[转载]卷积,池化操作后的图像尺寸计算

[转载]卷积,池化操作后的图像尺寸计算

原文

一,卷积操作

若图像为正方形:设输入图像尺寸为WxW,卷积核尺寸为FxF,步幅为S,Padding使用P,经过该卷积层后输出的图像尺寸为NxN:

N=\frac {W-F+2P} {S} +1

若图像为矩形:设输入图像尺寸为WxH,卷积核的尺寸为FxF,步幅为S,图像深度(通道数)为C,Padding使用P,则:

卷积后输出图像大小:

W=\frac {W-F+2P}{S}+1 \
H=\frac {H-F+2P}{S}+1

输出图像的通道数=C

注意:Padding的作用用于解决图像边缘信息损失的问题,用于补充

如same:(same模式只有步长为1时,输入和输出的尺度才相同)

输入特征图为5x5,卷积核为3x3,外加padding 为1,则其输出尺寸为

\frac {5-3+2*1} {1} +1=5

二,池化操作

设输入图像尺寸为WxH,其中W:图像宽,H:图像高,D:图像深度(通道数),卷积核的尺寸为FxF,S:步长

池化后输出图像大小:

W=\frac {W-F} {S} +1\
H=\frac {H-F} {S} +1\

池化后输出图像深度为D

当进行池化操作时,步长S就等于池化核的尺寸,如输入为24x24,池化核为4x4,则输出为

W=\frac {24-4} {4}+1=6

若除不尽,则取较小的数,如池化核为7x7,则输出为

W=[\frac {24-7} {7}] =3

,不是用四舍五入,就是取最小的整数,即使为3.9,也是 取3

三,空洞卷积(也称扩张卷积,膨胀卷积)—dilated convolution


W=\frac {W-d(k-1)-2p} {s} +1

其中 d为空洞卷积的空洞率(正常的卷积d=1),p为padding,k为kernel size

举个例子:

下面的空洞卷积核是d=2,k=2的空洞卷积卷积核。

当d=2,k=2时,-d(k-1)-1 = -3,即相当于 一个k=3的正常卷积核。

上次修改时间:2022-05-24 18:16:01

>