欢迎光临广州鑫亮办公设备有限公司
常见问题
联系我们
销售热线:
Contact Hotline
【☎/微/同号】
13407484838
网址:http://www.xldn333.com

E-mail:991699205@qq.com

公司地址:广东省广州市天河区岗顶百脑汇333号
当前位置: 主页 > 常见问题 >
广州华硕笔记本维修靠谱_广州华硕笔记本维修靠谱_ 霸榜多个CV任务,开源仅两天,微软分层ViT模子收获近2k star
 

屠榜各大 CV 任务微软 Swin Transformer,克日开源了代码和预练习模子

自 2017 年 6 月谷歌提出 Transformer 以来,广州哪里有复印机维修上门广州上门维修电脑,它便逐渐成为了自然语言处理惩罚规模的主流模子。最近一段时间,Transformer 更是开启了本身的跨界之旅,电脑广州打印机维修电脑,开始在计较机视觉规模大展身手,涌现出了多个基于 Transformer 的新模子,电脑维修,如谷歌用于图像分类的 ViT 以及复旦、牛津、腾讯等机构的 SETR 等。由此,「Transformer 是万能的吗?」也一度成为呆板进修社区的热门话题。

不久前,广州上门维修电脑微软亚研的研究者提出了一种通过移动窗口(shifted windows)计较的分层视觉 Transformer,他们称之为 Swin Transformer。对比之前的 ViT 模子,电脑回收广州电脑维修上门,Swin Transformer 做出了以下两点改造:其一,引入 CNN 中常用的条理化构建方法构建分层 Transformer;其二,复印机广州哪里有复印机维修上门,引入局部性(locality)思想,广州哪里有电脑维修,对无重合的窗口区域内举办自留意力计较。论文链接:https://arxiv.org/pdf/2103.14030.pdf

首先来看 Swin Transformer 的整体事情流,广州打印机维修,下图 3a 为 Swin Transformer 的整体架构,图 3b 为两个持续的 Swin Transformer 块。该研究的亮点在于操作移动窗口对分层 Transformer 的表征举办计较。通过将自留意力计较限制在不重叠的局部串口,同时答允跨窗口毗连。这种分层布局可以机动地在差异标准上建模,电脑广州电脑维修,并具有图像巨细的线性计较巨大度。下图 2 为在 Swin Transformer 架构中操作移动窗口计较自留意力的事情流:模子自己具有的特性使其在一系列视觉任务上都实现了颇具竞争力的机能表示。个中,电脑,在 ImageNet-1K 数据集上实现了 86.4% 的图像分类精确率、在 COCO test-dev 数据集上实现了 58.7% 的方针检测 box AP 和 51.1% 的 mask AP。今朝,广州复印机维修广州哪里有电脑维修电脑,在 COCO minival 和 COCO test-dev 两个数据集上,Swin-L(Swin Transformer 的变体)在方针检测和实例支解任务中均实现了 SOTA。另外,电脑维修,在 ADE20K val 和 ADE20K 数据集上,电脑回收,Swin-L 也在语义支解任务中实现了 SOTA。

开源代码和预练习模子

Swin Transformer 论文果真没多久之后,手机回收微软官方于克日在 GitHub 上开源了代码和预练习模子,电脑笔记本广州哪里有电脑维修电脑维修打印机回收,涵盖图像分类、方针检测以及语义支解任务。上线仅仅两天,电脑广州复印机维修,该项目已收获 1900 星。项目地点:https://github.com/microsoft/Swin-Transformer

首先图像分类任务,Swin-T、Swin-S、Swin-B 和 Swin-L 变体模子在 ImageNet-1K 和 ImageNet-22K 数据集上的精确率功效如下:其次方针检测任务:Swin-T、Swin-S、Swin-B 和 Swin-L 变体模子在 COCO 方针检测(2017 val)数据集上的功效如下:最后语义支解任务:Swin-T、Swin-S、Swin-B 和 Swin-L 变体模子在 ADE20K 语义支解(val)数据集上的功效如下。今朝,Swin-L 取得了 53.50% 的 SOTA 验证 mIoU 分数。

原标题:《霸榜多个CV任务,复印机,开源仅两天,微软分层ViT模子收获近2k star》

在线客服1
在线客服2
关注官方微信
返回顶部