这样做是因为经过cnn提取得到的特征图,其实包含了原始图片的空间信息(也就是位置信息),如果直接做了由特征图到特征向量的转换,会破坏空间信息,而先做了全局平均池化,再做全连接层,效果会好一些。
这个内容是在看 Class Activate Map的过程了解的。
这个链接里面进一步介绍了CAM中和全局平均池化的关系。
这样做是因为经过cnn提取得到的特征图,其实包含了原始图片的空间信息(也就是位置信息),如果直接做了由特征图到特征向量的转换,会破坏空间信息,而先做了全局平均池化,再做全连接层,效果会好一些。
这个内容是在看 Class Activate Map的过程了解的。
这个链接里面进一步介绍了CAM中和全局平均池化的关系。