【Merlion|Merlion:端到端的时间序列预测利器】量化投资与机器学习微信公众号 , 是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体 。 公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业20W+关注者 , 连续2年被腾讯云+社区评选为“年度最佳作者” 。
时间序列的分析与预测一直是量化策略研究中非常核心的步骤 。 最近在Github上开源的Merlion , 作为端到端的时间序列预测工具 , 在短时间内获得的近2K的star 。
项目地址:https://github.com/salesforce/Merlion
只要有一定机器学习工具包使用经验的小伙伴 , 上手该项目应该是很快的 。 我们先简单介绍一下时间序列任务的类别 , 以及Merlion的功能与其他常用工具包的对比 。
首先时间序列的任务主要包括时间序列异常点检测及时间序列的预测 , 其中时间序列的预测又包括单变量时间序列预测 , 和多变量时间序列预测 。 在时间序列预测的方法论上 , 主要又分为传统的计量方法 , 如ARIMA等;及最近兴起的机器学习的方法 , 如LSTM、树模型(Random Forest , GBDT)及Transformer等 。 对于常用的时序研究工具包的功能对比如下:
文章图片
通过上表对比发现 , Merlion是所有工具中功能最完整的 , 支持时间序列预测及异常点检测 , 在模型优化层面还支持AutoML及模型的组合 , 还有方便的可视化工具 。 看到这里很多小伙伴肯定跃跃欲试了 。
不急 , 我们再从宏观层面了解下Merlion的整个架构 , 如下图所示 , 整个模块分为五个核心层:
1、Data Layer 数据层:在Merlion中 , 所有输入都需要转换为Merlion自有的数据格式TimeSeries;最方便的是从pandas的dataframe格式直接转换为TimeSeries格式;
2、Models 模型层:模型层主要分为两大类 , 时序异常检测和时序预测 。 每个大类下又包含多个模型 。 在时许预测的模型中 , 还支持AutoML自动进行模型优化;
3、Post Processing 后处理模块:这个模块比较简单 , 主要是异常的校准及基于业务规则的噪音判断;
4、Ensembles and Model Selection:对于之前调优后的多个已训练模型 , 可以选择最优的模型 , 也可以对模型进行合并;
5、Evaluation Pipeline:最终对模型以模拟线上部署的方式进行最后的验证 , 线上部署与历史训练最大的区别就是滚动式的模型再训练 , 类似量化策略的Walk Forward回测 。
文章图片
对于Merlion有一个基本的了解后 , 怎么快速入门呢?推荐小伙伴们直接移步:
推荐阅读
- 市场|激斗智能家居,大厂遇到新对手
- Google|谷歌暂缓2021年12月更新推送 调查Pixel 6遇到的掉线断连问题
- Monarch|消息称微软Win11 2022重大更新将在明年夏天到来
- 软件和应用|iOS/iPadOS端Telegram更新:引入隐藏文本、翻译等新功能
- 矩阵|聚焦快递末端痛点 国内首款无人驾驶快递物流车在中通启动应用场景内测
- 电子商务|员工抱怨亚马逊太冷酷:工伤后得不到赔偿 还不让休假
- the|福奇:美国奥密克戎毒株疫情可能在1月底达到顶峰
- 末端|菜鸟发布2022物流科技十大趋势报告
- 技术|悦鲜活高端瓶装鲜奶市占第一 科技驱动营养再升级
- 数字化|70%规模以上制造业企业到2025年将实现数字化、网络化