当前位置: 首页 > news >正文

ITransformer: Inverted Transformers Are Effective for Time Series Forecasting


解释典型的Transformer架构用于时序预测效果差的原因,它们的观点:

由单个时间步长形成的Token,由于过于局部的感受野同时时间点表示的时间不对齐事件而难以显示有益信息。

时间序列预测模型的标准设定:

输入 (历史窗)XXX:包含TTT个时间步,NNN个变量。矩阵维度为RT∗NR^{T*N}RTN;

输出(预测窗)YYY: 预测未来SSS个时间步,同样包含NNN个变量, 矩阵维度为RS∗NR^{S*N}RSN

数据处理的两种视角:

(1)Xt,:X_{t,:}Xt,::ttt时刻所有变量的快照。表示的是Excel表格中的一行,代表“此时此刻所有传感器的读数”。大多数Transformer(如Informer)是将这个Xt:X_{t:}Xt:, 作为一个TokenTokenToken输入模型。

(2)X:,nX_{:,n}X:,n: 第nnn个变量的完整时间序列,Excel中的一列,代表 ”某个传感器在过去一段时间内的所有读数“。

为什么否定Xt,:X_{t,:}Xt,:?

直接处理Xt,:X_{t,:}Xt,:(即把同一时刻的不同变量揉在一起)在物理意义上的两个缺点:

(1)系统性时滞(Systematical Time Lags):在现实世界中,因果关系往往不是瞬时的,如果强制模型只看Xt:X_{t:}Xt:(同时关注ttt时刻的A和B),可能变量在该时刻并不具备直接因果关系的数据点,真正的关联式错位的。

(2)物理量纲与分布的差异:同一时刻的Xt,:X_{t,:}Xt,:包含了性质完全不同的数据。这些数据的语义空间(Semantic Space)完全不同。虽然可以归一化,但是在深度学习,将这些物理意义极不相同的数值映射到同一个特征空间进行交互,难以学习到鲁棒的特征。

为什么拥抱X:nX_{:n}X:n?

单个变量的整条序列具有物理一致性,该变量在ttt时刻和t+1t+1t+1时刻的物理性质不变,它们的统计分布是平稳的。将X:nX_{:n}X:n视为一个Token进行Embedding,模型更容易学习到特征。

层归一化:

在此前Transformer中,层归一化将同一时刻的的多个变量进行归一化,使**每个变量杂糅无法区分**,提高了注意力建模词关联的难度。一旦收集到的数据没有按时间对齐,该操作还将引入延迟过程之间的噪声干扰。

在倒置版本中,层归一化作用于Variate Token内部,让所有变量的特征都**处于相对统一的分布下,减弱测量单位的差异**。这种方式还可以有效处理时间序列的非平稳问题问题。

前馈网络:

基于多层感知机的万能表示定理,前馈网络作用在整条序列上,能够提取序列的内在属性,例如幅值,周期性,频率谱(傅立叶变换可视作在序列上的全连接映射),从而提高在其他的序列上的泛化性。

在原始的Transformer中,模型的预测效果不一定随着输入的历史观测的变长而提升,在使用倒置框架之后,模型随着历史观测长度的增加,呈现明显的预测误差降低趋势。

http://www.rkmt.cn/news/122944.html

相关文章:

  • word2markdown:一款优秀的Word转Markdown工具
  • 10 个降AI率工具,继续教育学生必备!
  • Mistral 3 模型解析与部署实战:从 Large 3 到 Mini-stral
  • 10 个降AI率工具,本科生高效避坑指南
  • Java面试内卷加剧,普通程序员如何破局?
  • 探秘常见机器人控制运动上位机源码:解锁多种运动算法
  • SG-TCP232-620(六通道串口服务器)特点与功能介绍
  • 51单片机温度报警器:从C程序到Proteus仿真全记录
  • 【LangChain4J】流式输出(底层和高级api两种模式)
  • 9个高效降AI率工具,本科生必看!
  • 10个高效降AI率工具,自考学生必备!
  • 计算机专业自学指南:从大一到大四,步步为营!从零基础到精通,收藏这篇就够了!
  • 从零开始的云原生之旅(十八):部署热更新——无需重启服务的幕后
  • 非专业也能看懂的AI大模型工作原理!(非常详细)从零基础到精通,一篇就够了!
  • vulkan中的SSBO
  • 告别频繁校准,效率成本双拿捏!这款MEMS寻北仪刷新行业新体验
  • Java设计模式系列 - 基本概念
  • AI元人文构想:从价值对齐到意义生成的哲学范式革命
  • 探索12bit 100M两级PipeSAR ADC设计之路
  • ARM 汇编指令:MOV
  • Java求职者面试:面试官与水货程序员的搞笑对决
  • 英语_阅读_Noodles_待读
  • 漏洞原理我都懂,为什么就这么难挖?
  • 深入探讨后台摄像头|麦克风采集与轻量级RTSP服务|RTMP推流架构设计
  • 永磁同步电机双闭环在Matlab/Simulink中的数学模型仿真探索
  • 一份来自手机备忘录的AI元人文构想实录与宣言
  • 小程序毕设选题推荐:基于springboot的“智宠”一站式宠物服务小程序的设计与实现 基于微信小程序的宠物一站式服务平台设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 小程序毕设选题推荐:基于springboot的华兴书城微信小程序线上购书、阅读社交化【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 小程序毕设选题推荐:基于springboot+微信小程序的羽球快讯爱好者平台小程序羽球生活app【附源码、mysql、文档、调试+代码讲解+全bao等】
  • string,byte,rune,character?详解Golang编码-UTF-8