相较于RCNN的改进 Fast RCNN仍然使用selective search选取2000个建议框,但是这里不是将这么多建议框都输入卷积网络中,而是将原始图片输入卷积网络中得到特征图,再使用建议框对特征图提取特征框。这样做的好处是,原来建议框重合部分非常多,卷积重复计算严重,而这里每个位置都只计算了一次卷积,大大减少了计算量 由于建议框大小不一,得到的特征框需要转化为相同大小,这一步是通过ROI池化层(region of interest)来实现的 Fast RCNN里没有SVM分类器和回归器了,分类和预测框的位置大小都是通过卷积神经网络输出的 为了提高计算速度,网络最后使用SVD代替全连接层 算法流程 输入一张图片,使用Selective Search获取建议框(region proposal) 将原始图片输入卷积神经网络之中,获取特征图 对每个建议框,从特征图中找到对应位置(按照比例映射),截取出特征框(深度保持不变) 将每个特征框划分为 HxW个网格(论文中是 7×7 ),在每个网格内进行最大池化(即每个网格内取最大值),这就是ROI池化。这样每个特征框就
JJJYmmm
Updating as per fate.