《Thegreatmultivariatetimeseriesclassificationbakeoff:ar...
《The great multivariate time series classification bake off: a review and experimental evaluation of recent algorithmic advances》注意,这篇文章是关于多变量多序列时间序列分类的综述,关于单变量的可见:
对于时间序列分类问题,问题的形式必然是多序列的,如果在单序列上做分类,也必然是将单序列转化为多个子序列从而最终仍旧是转化为多序列的问题。对单个序列进行分类没有意义。
多变量时间序列相对于单变量时间序列而言就是每一个timestep不再是一个序列值,即不再是单个特征而是多个feature。那么这个时候数据的形式其实就和时间序列预测中会出现的数据类型完全保持一致了:
关于多变量时序的详细描述可见上。
多变量时间序列分类问题的挑战:
1.多个变量之间存在相互作用而不再仅仅是自相关。
2.数据量相对于单序列要大得多;
文中没有明确对多变量时序分类问题进行具体的分类,看完之后的感觉就是:
基本都是在单变量时序分类算法上的各类扩展,深度学习部分在另一篇里面详细描述,文中深度的部分描述的并不是很完整。
所以感觉没啥好看的了。。
一些细节可以关注一下上面大佬的文章。
这里列举一下文中提到的各类算法,用到的时候再看好了,这两篇论文都很详细的给出了算法的伪代码和详细的思路,非常的nice,需要看原理直接看看论文中的部分描述就可以了。
1.Independent warping (DTWI)
2.Dependent warping (DTWD)
3.Adaptive warping (DTWA)
4. Ensembles of univariate classifiers(思路就是每个维度单独做单变量时序分类然后+集成,提到了hive-cote)
5.Generalized random shapelet forest (gRFS)
6. WEASEL+MUSE
7. Canonical interval forest (CIF)
8.The random convolutional kernel transform (ROCKET)
9. The multiple representation sequence learner (MrSEQL)
值得一提的是,这篇文章的很多实验使用到了sktime,调包党的福音,
其它地方看了一下,感觉也没啥有用的,直接撸sktime就好了。
tslearn(主要单变量),pyts(主要单变量,多变量很少),sktime 传统时序分类(大全),当然也提供了许多其它的功能。
如果认为本文对您有所帮助请赞助本站