尧图网站建设 尧图网络
  • 首页
  • 关于我们
  • 服务项目
  • 案例展示
  • 建站流程
  • 资讯中心
  • 联系我们
首页/资讯中心/详情

无监督通用流数据异常检测新方法SEAD

无监督通用流数据异常检测新方法SEAD
📅 发布时间:2026/6/23 7:07:08
本文介绍了一种名为SEAD的无监督流数据异常检测集成方法。该方法通过为集成模型中的各“基检测器”分配动态权重,无需标注数据即可实时适应数据分布变化,并在多个任务中超越了13个基线模型。

在当今许多工业和在线应用中,实时识别数据流中的异常(罕见的、意外的事件)至关重要。异常可能表明制造缺陷、系统故障、安全漏洞或其他重要事件。典型的基于机器学习的异常检测系统以监督方式使用标记样本进行训练。但在许多在线环境中,数据极其多样化且其分布不断变化,以至于收集和标记数据成本高昂。

此外,没有单一的异常检测(AD)模型在所有数据类型上都表现最佳。例如,某些AD模型对一类客户有效,而其他模型则对另一类客户有效。但对于给定的客户,事先并不清楚应部署哪个模型,因为客户的工作负载经常随时间变化,因此性能最佳的AD模型也随之变化。

在一篇将于2025年国际机器学习大会(ICML)上发表的论文中,我们尝试用我们称为SEAD(流数据异常检测集成)的方法来解决这些问题。SEAD使用一组异常检测模型的集成,因此它总能针对每种数据类型使用最佳模型,并且它以无监督的方式运行,因此在训练期间不需要标记的异常数据。它在在线环境中高效工作,实时处理流入的数据,并能动态适应数据的变化。

为了评估SEAD,我们将其与三个先前的异常检测模型(每个模型有四种超参数设置)以及一个基于规则的方法进行了比较,共计13个基线。在15项不同的任务中,SEAD取得了最高的平均排名(5.07)和最低的方差(6.64)。

奖励“沉默”

SEAD背后的基本见解是异常是罕见的。因此,SEAD为集成中持续产生较低异常分数的模型(或“基检测器”)分配更高的权重。由于不同的基检测器使用不同的评分系统,SEAD通过根据历史分数的分布将它们分配到不同的分位数来标准化这些分数。

为了计算权重,我们使用了乘法权重更新(MWU)机制,这是专家系统中的一种标准方法。使用MWU时,每个基检测器都被初始化一个起始权重。在每一轮结束时,每个基检测器的新权重是其旧权重与学习率乘以该轮输出的标准化异常分数的负指数之积。

所有基检测器以这种方式更新后,它们的权重被归一化,使其总和为1。通过这个过程,持续输出较大分数的检测器将开始获得较低的权重。我们工作的技术洞察是将这一最初为监督环境提出的经典MWU思想,应用于异常检测的无监督环境。

在模型评估期间,我们能够看到算法根据输入数据重新为基检测器分配权重。在一个数据集上,SEAD为两个不同的模型分配了高权重,这两个模型在涉及真正异常数据的测试阶段都持续识别出异常。然而,在该阶段之后,在干净数据上,其中一个模型继续触发警报,SEAD迅速降低了它的权重。

为了进一步研究SEAD适当加权模型的能力,我们在集成中的13个模型之外,增加了13个仅随机生成分数的额外算法。在我们的测试集上,SEAD的准确率仅下降了0.88%,这表明我们的更新算法在快速剔除不可靠模型方面做得很好。

计算效率

像SEAD这样的集成方法的一个缺点是同时运行多个模型会产生计算开销。为了解决这个问题,我们试验了一种名为SEAD++的方法,该方法以与其权重成比例的概率随机抽样集成模型的一个子集。相对于原始SEAD,这带来了大约两倍的加速,而准确性损失极小。因此,在计算资源有限的使用场景中,SEAD++是一个有前景的替代方案。

SEAD代表了流数据异常检测领域的重大进步。通过实时智能地从候选池中选择性能最佳的模型,它确保了可靠且高效的异常检测。其无监督、在线的特性,结合其适应性,使其成为适用于多种应用的宝贵工具,为流环境中的异常检测树立了新标准。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

相关新闻

  • 数论基础学习笔记
  • 喷砂机厂家排名推荐!2025热门喷砂机厂家实力榜单汇总 - 栗子测评
  • AI狂飙时代:我们该学什么,未来在哪?

最新新闻

  • 预制消能井靠谱品牌推荐,南通卓驰值得选吗? - mypinpai
  • 2026年6月专业的遮阳篷直销厂家推荐,固定遮阳篷/阳光板钢制停车棚/电动铝合金折叠天幕/固定遮雨棚,遮阳篷厂家找哪家 - 品牌推荐师
  • 张家口市2026年本地黄金回收+白银回收+铂金回收实力门店TOP5排行榜 K金+金条+银条回收及电话地址推荐 - 盛世金银回收
  • Clock8部署指南:生产环境中的PHP时钟配置与监控终极教程
  • 【古早AI对话记录】关于四波混频与压缩光场的压缩度
  • 长沙市2026年本地黄金回收靠谱门店 白银回收+铂金回收优选门店汇总及电话地址指南TOP5排行榜推荐 - 大熊猫898989

日新闻

  • Arduino-ESP32项目深度解析:解锁隐藏芯片支持与架构演进
  • 2026年 系统窗厂家/品牌推荐榜单:隔音系统窗+高端系统门窗的核心优势与选购指南 - 品牌发掘
  • NVBench:首个双语非言语发声语音合成评测基准详解与实践

周新闻

  • Visual C++运行库修复终极指南:5分钟快速解决Windows软件启动错误
  • 手把手教你构建统计局地区经济数据爬虫:从环境搭建到数据持久化全指南
  • 2026多Agent深度解析:用AI团队替代单一模型,四种架构实战落地

月新闻

  • 【总结】入门篇:50句话让你记住架构核心概念
  • WeChatMsg技术方案解析:实现Mac微信数据自主管理的完整解决方案
  • WeChatMsg:革新性微信数据备份方案,打造你的专属数字记忆库

关于尧图

  • 公司简介
  • 团队介绍
  • 企业文化
  • 荣誉资质

服务项目

  • 定制开发
  • 电商建站
  • UI 设计
  • 运维服务

快速链接

  • 案例展示
  • 建站流程
  • 常见问题
  • 资讯中心

联系方式

  • 📍北京市朝阳区互联网产业园 A 座 10 层
  • 📞400-888-8888
  • ✉️contact@rkmt.cn
  • 🕐周一至周日 9:00-21:00

© 2024 北京尧图网络科技有限公司 版权所有 | 京 ICP 备 XXXXXXXX 号