与感受野相关的几种网络结构
迪丽瓦拉
2024-05-26 02:05:41
0

一、Inception

1. Inception v1

  • 目的

  通过设计一个稀疏网络结构,但是能够产生稠密的数据,既能增加神经网络表现,又能保证计算资源的使用效率。

  • 结构

在这里插入图片描述

图1-1 Inception v1结构图
  • 特点

  • 共4个通道,其中3个卷积通道分别使用1×11×11×1、3×33×33×3、5×55×55×5的卷积核,保证了每个通道的感受野大小不同,从而获得不同尺度的特征;1个池化通道采用最大池化操作,以减少空间大小,降低过度拟合。

  • 使用1×11×11×1的卷积核进行降维,减小了特征图的维度。

2. Inception v2

  • 目的

  在不增加过多计算量的同时提高网络的表达能力,因而修改 Inception 的内部计算逻辑,提出了比较特殊的卷积计算结构。

  • 结构

在这里插入图片描述
在这里插入图片描述

图1-2 Inception v2结构图
  • 特点

  • 使用3×33×33×3的卷积核代替5×55×55×5的卷积核(用小卷积核代替大卷积核)。

  • 在保持相同感受野的同时减少参数量。

二、ASPP

1. 结构

在这里插入图片描述

图1-3 ASPP结构图

2. 特点

  • ASPP 本质上由一个1×1的卷积(最左侧绿色) + 池化金字塔(中间三个蓝色) + ASPP Pooling(最右侧三层)组成。而池化金字塔各层的膨胀因子可自定义,从而实现自由的多尺度特征提取。

  • 结合了空洞卷积可在不丢失分辨率(不进行下采样)的情况下扩大卷积核的感受野

三、RFB

1. 结构

在这里插入图片描述

在这里插入图片描述

图1-4 RFB结构图

2. 特点

  • RFB模块分为两部分 多分支的卷积与空洞卷积

  • 多分支的卷积主要是借鉴了Googlenet的思想

  • 空洞卷积的设置主要是借鉴了ASPP的思想

参考文章

大话 CNN 经典模型:GoogLeNet(从 Inception v1 到 v4 的演进)

inception-v1,v2,v3,v4详解

[深度学习]Inception Net (V1-V4)系列论文笔记

SPP,PPM、ASPP和FPN结构理解和总结

ASPP 详解

RFBnet论文及其代码详解

相关内容