尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

LongNet: Scaling Transformers to 1,000,000,000 Tokens

LongNet: Scaling Transformers to 1,000,000,000 Tokens
📅 发布时间:2026/6/20 9:34:47
[arXiv'23] 通过稀疏掩码降低自注意力计算复杂度

LongNet: Scaling Transformers to 1,000,000,000 Tokens

LongNet:通过类似线段树的形式构建自注意力的稀疏掩码,从而降低长序列下的计算复杂度

动机

本文旨在降低注意力的计算复杂度,从而实现对长序列处理的支持。本文方法成功将可处理的序列长度拓展到了十亿(1 billion)。

img

方法

img

本文的核心思路是参考线段树的构造方式,将指数级变化的稀疏掩码组合在一起。

img

多头的情况下会进行一些移位。

假设序列长度为\(N\),特征维度为\(d\),分段尺寸(segment size)为\(r\),空洞率(dilated rate)为\(w\),则计算复杂度为:

\[FLOPs=\frac{2N}{w}(\frac{w}{r})^2d=\frac{2Nwd}{r^2} \]

如果采用多种\((r,w)\)的设置:

\[FLOPs=2Nd\sum^k_{i=1}{\frac{w_i}{r_i^2}} \]

令\((r,w)\)增长的倍率为\(\alpha>1\):

\[FLOPs=2w_0Nd\sum^{k-1}_{i=0}{\frac{1}{\alpha^i}} \leq \frac{2\alpha}{\alpha-1}w_0Nd \]

从计算复杂度估计的角度来看,\(\alpha\)和\(w_0\)的取值通常都比较小且远小于\(N\)和\(d\),可视为常数。所以最终的计算复杂度估计可近似为\(\mathcal{O}(Nd)\)

实验

img

有明显的计算效率改善。

应用

Prov-GigaPath将超高分辨率的病理切片图像切分为若干小块,每块视为一个token,形成一个长序列,由此适配本文方法。

总结

本文的亮点在于对超长序列的支持。这一特点在许多热门领域不算特别有用,毕竟1B长度的token序列还是比较少见,本文似乎也没有在学术刊物上发表。但是其在特定领域还是能够发光发热,最终获得令人瞩目的成果,或许这就是技术积累的意义。

相关新闻

  • 2025口碑好的污水提升器源头厂家TOP5推荐:甄选不锈钢污水提升器服务商,破解排放难题
  • 2025年杭州婚姻家事律师推荐:孙旭权律师免费咨询
  • 2025 年自润滑轴承厂家最新推荐排行榜:聚焦高承载技术、全球客户口碑及协会权威测评的优质品牌榜单无油向心/复合向心/耐磨向心关节轴承公司推荐

最新新闻

  • DNSControl + Debian 10:用Go实现声明式DNS管理
  • FreeBSD深度解析:Linux老手必知的POSIX兼容性与系统哲学差异
  • 双曲共嵌入框架在字体与印象标签关联中的应用
  • 挑小户型功能沙发和全屋软体家具,分享我对比过的靠谱品牌 - 深圳市民HLL
  • DAPI共识算法在微电网多级储能协调控制中的应用与实践
  • 构建韧性信息物理系统:从安全验证到状态估计与协同恢复

日新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号