智能计算系统第三章图像处理的卷积神经网络

AICS

Posted by 叉叉敌 on February 7, 2022

卷积层

边界扩充(padding) 扩大输入图像/特征图的尺寸并填充像素 防止深度网络中图像被动持续减小 强化图像边缘信息

卷积步长(stride) 滑动滤波器时每次移动的像素点个数 与pad共同确定输出图像尺寸

## 池化层

Pooling

Max Pooling / Avg Pooling / L2 Pooling 主动减小图片尺寸,从而减少参数的数量和计算量,控制过拟合; 不引入额外参数;

全连接层

Fully Connect 卷积层和池化层构成特征提取器,全连接层则为分类器;

将特征提取得到的高维特征图映射成一维特征向量,该特征向量包含 所有特征信息,可转化为各个类别的概率。

Softmax

通常作为网络的最后一层,对输出进行归一化,输出分类概率; 凸显其中最大的值并抑制远低于最大值的其他分量; Softmax层输入、输出数据规模相同;

卷积神经网络结构

为何选择“深”而非“广”的网络结构

即使只有一层隐层,只要有足够的神经元,神经网络理论上可以拟合任意连 续函数。为什么还要使用深层网络结构?

深度网络可从局部到整体“理解图像”

学习复杂特征时(例如人脸识别),浅层的卷积层感受野小,学习到局部特征,深层 的卷积层感受野大,学习到整体特征。

深度网络可减少权重数量

以宽度换深度,用多个小卷积替代一个大卷积,在获得更多样特征的同时所需权重数 量也更少。

基于CNN的图像分类算法

希望被人知道,可以用测试集合、和提供平台,比如TensorFlow等。

VGG

用更小的卷积,一般是3x3效果就不错。