卷积层

边界扩充(padding) 扩大输入图像/特征图的尺寸并填充像素防止深度网络中图像被动持续减小强化图像边缘信息

卷积步长(stride) 滑动滤波器时每次移动的像素点个数与pad共同确定输出图像尺寸

## 池化层

Pooling

Max Pooling / Avg Pooling / L2 Pooling 主动减小图片尺寸，从而减少参数的数量和计算量，控制过拟合; 不引入额外参数;

全连接层

Fully Connect 卷积层和池化层构成特征提取器，全连接层则为分类器;

将特征提取得到的高维特征图映射成一维特征向量，该特征向量包含所有特征信息，可转化为各个类别的概率。

Softmax

通常作为网络的最后一层，对输出进行归一化，输出分类概率; 凸显其中最大的值并抑制远低于最大值的其他分量; Softmax层输入、输出数据规模相同;

为何选择“深”而非“广”的网络结构

即使只有一层隐层，只要有足够的神经元，神经网络理论上可以拟合任意连续函数。为什么还要使用深层网络结构?

深度网络可从局部到整体“理解图像”

学习复杂特征时(例如人脸识别)，浅层的卷积层感受野小，学习到局部特征，深层的卷积层感受野大，学习到整体特征。

深度网络可减少权重数量

以宽度换深度，用多个小卷积替代一个大卷积，在获得更多样特征的同时所需权重数量也更少。

希望被人知道，可以用测试集合、和提供平台，比如TensorFlow等。

用更小的卷积，一般是3x3效果就不错。