EfficientDet是Google Brain于去年11月份公布的目标检测算法族,涵盖轻量级到高精度的多个模型,提出了7种不同的网络结构
根据其复杂度不同,可以适应不同计算能力的平台,COCO数据集上达到 50.9 mAP,在coco榜单上算前无古人了,可以说是直接把YOLOV3,Mask-R CNN按在地上摩擦……..
前两天,Google Brain终于官方开源了,开源地址:(https://github.com/google/automl/tree/master/efficientdet),位于Google新开的automl项目内,看样子以后这个项目还会有其他自动机器学习的算法开源。EfficientDet原出于论文 EfficientDet: Scalable and Efficient Object Detection,开源页面显示,这篇论文已经被CVPR 2020接收
EfficientDet与EfficientNet的第一作者是同一人,可以说Google Brain在EfficientNet的基础上提出了针对于物体检测的可扩展模型架构EfficientDet。EfficientDet主要包括两方面贡献:
双向FPN BiFPN(Bi-directional feature pyramid network,在simplified PANet上引入了lateral shortcut)和weighted-BiFPN(在不同scale的特征进行融合时引入注意力机制对不同来源的feature进行权重调整(per-feature / per-channel / pei-pixel),由实验来看带来的性能提升相比BiFPN较小,看论文总结BiFPN提高了4个百分点)
仿照EfficientNet中的Compound Scaling方法,对检测网络中的各个部分进行Compound Scaling(输入图像大小,backbone的深度、宽度,BiFPN的深度(侧向级联层数),cls/reg head的深度)。个人觉得这是最大的亮点,提出了目标检测网络联合调整复杂度的策略。
除此之外值得一提的是EfficienDet中使用的模型缩放,作者结合BiFPN和特征融合策略设计了与YOLOv3精度相仿的EfficientDet-D0,按照一定的优化规则,在网络的深度、宽度、输入图像的分辨率上进行模型缩放,可在统一架构下得到适合移动端和追求高精度的多个模型,根据其复杂度不同,可以适应不同计算能力的平台。
EfficientDet结构
EfficientDet组合了backbone(使用了EfficientNet)和BiFPN(特征网络)和Box prediction net,上图整个框架就是EfficientDet的基本模型