美通社2024-10-19 00:25:23发布:去掉oftmax后Tranformer会更好吗?复旦&华为诺亚提出SOFT:轻松搞定线性近似

⭐发布日期:2024-10-19 00:25:23|来源:美通社

⭐作者:池韵责任编辑:Admin

⭐阅读量:146评论:4人

【2024年新澳门天天开彩大全}】

【新澳门精准四肖期期中特公开】

【新奥门天天开奖资料大全】【澳门王中王100期期准】【新澳天天开奖资料大全最新】【2024澳门天天开好彩大全53期】【新澳天天开奖资料大全最新54期】【2024年澳门特马今晚开码】【2024年新澳门天天彩开彩结果】【新澳2024管家婆资料另先锋诗】
【2004新澳门天天开好彩】【澳门一码一肖100准吗】【2024天天彩正版资料大全】【草原上的小木屋军队来了主要人物是】【澳门六开彩天天开奖结果生肖卡】【2024澳门天天彩期期精准】【澳门最精准免费资料大全旅游团】【新澳门免费资料大全精准版下】

本文介绍了复旦大学&华为诺亚提出的一种新颖的softmax-free的Transformer—SOFT。所提SOFT显著改善了现有ViT方案的计算效率,更为关键的是:SOFT的线性复杂度可以允许更长的token序列,进而取得更佳的精度-复杂度均衡。

论文链接:https://arxiv.org/pdf/2110.11945.pdf代码链接:https://github.com/fudan-zvg/SOFT项目链接:https://fudan-zvg.github.io/SOFT/

本文是复旦大学&华为诺亚关于Transformer中自注意力机制复杂度的深度思考,首次提出了一种新颖的softmax-free 的Transformer 。本文从softmax self-attention局限性出发,分析了其存在的挑战;然后由此提出了线性复杂度的SOFT;再针对线性SOFT存在的训练问题,提出了一种具有理论保证的近似方案。所提SOFT在ImageNet分类任务上取得了比已有CNN、Transformer更佳的精度-复杂度均衡。

一、Abstract

ViT通过图像块序列化+自注意力机制将不同CV任务性能往前推了一把。然而,自注意力机制会带来更高的计算复杂度与内存占用。在NLP领域已有不同的方案尝试采用线性复杂度对自注意力进行近似。然而,本文的深入分析表明:NLP中的近似方案在CV中缺乏理论支撑或者无效。

我们进一步分析了其局限性根因:softmax self-attention 。具体来说,传统自注意力通过计算token之间的点乘并归一化得到自注意力。softmax操作会对后续的线性近似带来极大挑战。基于该发现,本文首次提出了SOFT(softmax-free transformer )。

为移除自注意力中的softmax,我们采用高斯核函数替代点乘相似性且无需进一步的归一化。这就使得自注意力矩阵可以通过低秩矩阵分析近似 。近似的鲁棒性可以通过计算其MP逆(Moore-Penrose Inverse)得到。

ImageNet数据集上的实验结果表明:所提SOFT显著改善了现有ViT方案的计算效率 。更为关键的是:SOFT的线性复杂度可以允许更长的token序列,进而取得更佳的精度-复杂度均衡。

二、Contribution

本文的贡献主要包含以下几点:

· 提出一种新颖的线性空间、时间复杂度的softmax-free Transformer ;

· 所提注意力矩阵近似可以通过具有理论保证的矩阵分解算法计算得到;

· 所提SOFT在ImageNet图像分类任务上取得了比其他ViT方案更佳的精度-复杂度均衡 (见下图a)。

三、Method

Softmax-free self-attention formulation

上图给出了本文所提SOFT架构示意图。我们首先来看一下该注意力模块的设计。给定包含n个token的输入序列 ,自注意力旨在挖掘所有token对之间的相关性 。

具体来说,X首先线性投影为三个 维的query、key以及values

自注意力可以表示为如下广义形式:

自注意力的关键函数 包含一个非线性函数 与一个相关函数 。自注意力的常规配置定义如下:

虽然该softmax自注意力已成为首选且很少受到质疑,但是它并不适合进行线性化。为构建线性自注意力设计,我们引入了一种sfotmax-free自注意力函数:通过高斯核替换点乘操作。定义如下:

为保持注意力矩阵的对称性,我们设置投影矩阵 相同,即 。所提自注意力矩阵定义如下:

为描述的简单性,我们定义为矩阵形式: 。所提自注意力矩阵S具有三个重要属性:

· 对称性

· 所有元素均在[0,1]范围内

· 所有对角元素具有最大值1

我们发现:当采用无线性化的核自注意力矩阵时,transformer的训练难以收敛 。这也就解释了:为何softmax自注意力在transformer中如此流行。

Low-rank regularization via matrix decomposition with linear complxity

为解决收敛于二次复杂度问题,我们利用了矩阵分解作为带低秩正则的统一解,这就使得模型复杂度大幅下降,且无需计算全部的自注意力矩阵。

作出上述选择因为在于:S为半正定矩阵,且无需后接归一化。我们将S表示为块矩阵形式:

其中,。通过上述分解,注意力矩阵可以近似表示为:其中,表示A的MP逆。更多关于MP逆的信息建议查看原文,这里略过。在上述公式,A和B是S通过随机采样m个token得到的子矩阵,可表示为 (我们将其称之为bottleneck token )。然而,我们发现:随机采样对于m非常敏感。因此,我们通过利用结构先验探索两种额外的方案:· 采用一个核尺寸为k、stride为k的卷积学习 · 采用一个核尺寸为k、stride为k的均值池化生成通过实验对比发现:卷积层学习具有更好的精度 。由于K与Q相等,因此 。给定m个token,我们计算A和P:最终,我们得到了SOFT的正则化后的自注意力矩阵:

上图Algorithm1给出所提SOFT流程,它涉及到了MP逆计算。一种精确且常用的计算MP逆的方法是SVD,然而SVD对于GPU训练不友好。为解决该问题,我们采用了Newton-Raphson方法,见上图Algorithm2:一种迭代算法。与此同时,作者还给出了上述迭代可以最终收敛到MP逆的证明。对该证明感兴趣的同时强烈建议查看原文公式。

四、Instantiations

上面主要聚焦于softmax-free self-attention 模块的介绍,接下来我们将介绍如何利用SOFT模块构建Transformer模型。我们以图像分类任务为切入点,以PVT作为基础架构并引入所提SOFT模块构建最终的SOFT模型,同时还在stem部分进行了微小改动。下表给出了本文所提方案在不同容量大小下的配置信息。

五、Experiments

表对比了所提方案与现有线性Transformer模型的性能,从中可以看到:

· 相比基线Transformer,线性Transformer能够大幅降低内存占用与FLOPs,同时保持相当参数量

· 所提SOFT在所有线性方案中取得了最佳分类精度

· 所提SOFT与其他线性方案的推理速度相当,训练速度稍慢

上图给出了不同方案的序列长度与内存占用之间的关系,从中可以看到:所提SOFT确实具有线性复杂度的内存占用 。

上表给出了所提方案与其他CNN、Transformer的性能对比,从中可以看到:

· 总体来说,ViT及其变种具有比CNN更高的分类精度

· 相比ViT、DeiT等Transformer方法以及RegNet等CNN方法,所提SOFT取得了最佳性能

· 相比PVT,所提方案具有更高的分类精度直接验证了所提SOFT模块的有效性

· 相比Twins与Swin,所提SOFT具有相当的精度,甚至更优性能

此外,作者还在NLP任务上进行了对比,见上表,很明显:SOFT又一次胜出

本文来自:公众号【极市平台】

作者:happy

Illustrastionby Lazarus_al from Icons8

-The End-

扫码观看

本周上新!

高质量活动太密集? 我们帮你梳理!

近期活动

11.22(周一)

Talk360期 杜克大学在读博士生李昂

11.23(周二)

「人工智能安全与隐私」第九期

11.23(周二)

MMAI系列Talk①莫纳什大学在读博士余镇

11.24(周三)

淘系技术直播①迈向元宇宙

11.25(周四)

淘系技术直播②算法黑科技

11.28(周日)

「料见」Waymo高级研究科学家祁芮中台

11.30(周二)

NeurIPS 2021 论文解读群星闪耀云际会

11.30(周二)

淘系技术直播③内容新电商

关于我“

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务将门技术社群以及。将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

⤵一键送你进入TechBeat快乐星球

【2004新澳门天天开好彩大全】【一码一肖中特今】
【2024年新澳门天天开彩免费资料】【澳门精准正版资料大全长春老】
【2024年正版免费天天开彩】【澳门王中王结果一下子】
【2024新澳今晚资料】【2O24年澳门正版免费大全】
【2024年新澳门天天彩开彩结果】【2024澳门天天六开彩免费图】
【2024新澳正版免费资料大全】【澳彩资料大全部下载】【2024新澳门天天六开好彩大全】
上一条新闻下一条新闻

推荐文章

发表评论

干村

7秒前:为保持注意力矩阵的对称性,我们设置投影矩阵 相同,即 。

IP:65.85.8.*

Margot

1秒前:将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

IP:98.19.8.*

赵雪

3秒前:所提自注意力矩阵S具有三个重要属性:

IP:81.86.4.*

布施绘里

2秒前:11.

IP:37.46.9.*

美通社APP介绍

APP图标

APP名:美通社

版本:V2.51.846等级:7星

更新时间:2024-10-18 15:18文件格式:apk应用分类:ios-Android

APK大小:86.99MB67%好评

美通社这是一个功能强大的美通社APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:MMAI系列Talk①莫纳什大学在读博士余镇

版本V5.99.750APP介绍

APP图标

APP名:美通社

版本:V9.59.810等级:9星

更新时间:2024-10-18 22:20文件格式:apk应用分类:ios-Android

APK大小:87.99MB15%好评

无论是美通社快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

版本V9.42.503APP介绍

APP图标

APP名:美通社

版本:V7.36.802等级:3星

更新时间:2024-10-18 20:24文件格式:apk应用分类:ios-Android

APK大小:35.33MB78%好评

美通社应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

版本V5.10.725APP介绍

APP图标

APP名:美通社

版本:V4.47.622等级:3星

更新时间:2024-10-18 20:17文件格式:apk应用分类:ios-Android

APK大小:31.15MB68%好评

美通社这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

版本V4.36.666APP介绍

APP图标

APP名:美通社

版本:V7.74.286等级:1星

更新时间:2024-10-18 20:16文件格式:apk应用分类:ios-Android

APK大小:97.47MB54%好评

这是一款功能强大的美通社应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:11.。无论是获取信息还是提升效率,这款APP都是您理想的助手。

版本V8.86.276APP介绍

APP图标

APP名:美通社

版本:V4.10.768等级:9星

更新时间:2024-10-18 19:21文件格式:apk应用分类:ios-Android

APK大小:49.23MB39%好评

这是一款功能强大的美通社应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:11.,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

版本V3.86.975APP介绍

APP图标

APP名:美通社

版本:V7.60.615等级:2星

更新时间:2024-10-18 22:20文件格式:apk应用分类:ios-Android

APK大小:46.26MB39%好评

这是一款功能强大的美通社应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:ViT通过图像块序列化+自注意力机制将不同CV任务性能往前推了一把。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

版本V7.30.504APP介绍

APP图标

APP名:美通社

版本:V3.17.466等级:1星

更新时间:2024-10-18 13:18文件格式:apk应用分类:ios-Android

APK大小:19.79MB36%好评

今天的最新动态包括:为移除自注意力中的softmax,我们采用高斯核函数替代点乘相似性且无需进一步的归一化。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

版本V2.83.763APP介绍

APP图标

APP名:美通社

版本:V9.29.843等级:6星

更新时间:2024-10-18 17:18文件格式:apk应用分类:ios-Android

APK大小:44.34MB62%好评

这是一款功能强大的美通社应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:虽然该softmax自注意力已成为首选且很少受到质疑,但是它并不适合进行线性化。。

版本V1.60.425APP介绍

APP图标

APP名:美通社

版本:V3.21.543等级:2星

更新时间:2024-10-18 24:24文件格式:apk应用分类:ios-Android

APK大小:73.16MB27%好评

这款功能强大的美通社应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

版本V9.52.921APP介绍

APP图标

APP名:美通社

版本:V6.39.109等级:5星

更新时间:2024-10-18 17:21文件格式:apk应用分类:ios-Android

APK大小:69.25MB11%好评

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

版本V8.37.755APP介绍

APP图标

APP名:美通社

版本:V6.14.784等级:6星

更新时间:2024-10-18 18:16文件格式:apk应用分类:ios-Android

APK大小:91.67MB55%好评

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。