卷积层
边界扩充(padding) 扩大输入图像/特征图的尺寸并填充像素 防止深度网络中图像被动持续减小 强化图像边缘信息
卷积步长(stride) 滑动滤波器时每次移动的像素点个数 与pad共同确定输出图像尺寸
## 池化层
Pooling
Max Pooling / Avg Pooling / L2 Pooling 主动减小图片尺寸,从而减少参数的数量和计算量,控制过拟合; 不引入额外参数;
全连接层
Fully Connect 卷积层和池化层构成特征提取器,全连接层则为分类器;
将特征提取得到的高维特征图映射成一维特征向量,该特征向量包含 所有特征信息,可转化为各个类别的概率。
Softmax
通常作为网络的最后一层,对输出进行归一化,输出分类概率; 凸显其中最大的值并抑制远低于最大值的其他分量; Softmax层输入、输出数据规模相同;
卷积神经网络结构
为何选择“深”而非“广”的网络结构
即使只有一层隐层,只要有足够的神经元,神经网络理论上可以拟合任意连 续函数。为什么还要使用深层网络结构?
深度网络可从局部到整体“理解图像”
学习复杂特征时(例如人脸识别),浅层的卷积层感受野小,学习到局部特征,深层 的卷积层感受野大,学习到整体特征。
深度网络可减少权重数量
以宽度换深度,用多个小卷积替代一个大卷积,在获得更多样特征的同时所需权重数 量也更少。
基于CNN的图像分类算法
希望被人知道,可以用测试集合、和提供平台,比如TensorFlow等。
VGG
用更小的卷积,一般是3x3效果就不错。