比思論壇

標題: 多维时间序列驱动的异常点检测技术研究 [打印本頁]

作者: 雷克儿 時間: 5 天前
標題: 多维时间序列驱动的异常点检测技术研究
异常检测技术已经在多个研究领域内有了较为成熟的应用，例如系统运维、欺诈检测、网络入侵检测以及医学异常检测，多数异常检测领域内的数据实体均为时间序列数据。随着科学技术的发展以及工业系统的日益复杂化，能够通过传感器等媒介实时采集到海量时序数据，此类数据为多维时间序列，是按照时间顺序采集的多组变量，同时具备空间与时间描述能力，是对多个潜在过程进行观测的结果。然而，多维时间序列中存在维数爆炸、数据稀疏等问题，同时包含周期、趋势等复杂的模式特征，此类特性导致基于规则的异常检测方法检测效果较差。在大数据场景下，机器学习、深度学习方法以其覆盖范围广、学习能力强等优点开始被应用于面向多维时间序列的异常检测任务中。本文对该任务的难点进行了总结与分析，主要工作与贡献如下：首先，针对时间序列中存在丰富的语义信息问题，本文提出的时序分解算法New-STL分别对数据中的趋势分量、周期分量以及高频残余分量依次进行提取，利用HP滤波分解方法保证分离出来的趋势分量足够平滑，同时将数据中的变点信息进行保存；采用滑动平均以及双边滤波方法解决周期分量中噪声较大以及存在概念漂移现象两大难点。本文提出的算法在人造数据集上表现较传统算法而言更优，分离误差更小，验证了算法的有效性；其次，针对多维时间序列中存在隐含的维度相关性等问题，本文提出了一种基于多头图注意力时序卷积网络的异常检测方法，对时间序列中的趋势、周期以及高频残余分量分别构建有向连通图，利用图注意力网络对数据中的多维度特征进行建模，学习各维度指标之间的关联性，然后接入时序卷积网络层对下一时刻的序列值进行预测，得到预测误差，最终设定异常阈值以检测序列中存在的异常。实验表明本文提出算法的效果在多个公开数据集上超越基准方法，具有更高的准确率以及更低的误报率；最后，本文提出了一种异常定位方法，根据各维度预测值与真实值的误差大小，通过异常极值理论与构建偏离误差的方法分别对时间方面与空间方面的误差进行建模，以计算数据各个维度的异常分数，对导致异常事件产生的一维或多维指标进行溯源，为异常定位提供一些指导，并通过真实案例分析印证了算法的可用性。

歡迎光臨比思論壇 (http://108.170.5.75/)