实例|新入坑的SageMaker Studio Lab和Colab、Kaggle相比,性能如何?

选自benjaminwarner.dev
机器之心编译
编辑:小舟、陈萍

SageMaker Studio Lab 将是免费计算资源领域一个强有力的竞争对手 。
一周前 , 亚马逊启动了 SageMaker Studio 的免费简化版 SageMaker Studio Lab , 提供了一个时限为12小时的 CPU 实例和一个时限为 4 小时的 GPU 实例 。 SageMaker Studio Lab 成为继 Google Colab、Kaggle 和 Paperspace 之后的又一个免费深度学习计算空间 。
Studio Lab 为用户提供了所有入门 AI 所需的基础能力 , 包括 JupyterLab IDE、CPU 和 GPU 模型训练算力以及 15 GB 的永久存储 。
那么 , SageMaker Studio Lab 如何与竞争对手抗衡?它是否值得使用?
现在一位名为 Benjamin Warner 的博主已经申请使用了 SageMaker Studio Lab , 并为大家撰写了一篇博客「开箱测评」 。 以下是博客原文 。
本文我使用图像和 NLP 分类任务 , 比较了在 SageMaker Studio Lab 和 Colab、Colab Pro 以及 Kaggle 上训练神经网络的效果 。
与 Colab 和 Kaggle 的比较
与 Colab 和 Kaggle 一样 , Studio Lab 提供 CPU 和 GPU 实例:运行时间为 12 小时的 T3.xlarge CPU 实例和运行时间为 4 小时的 G4dn.xlarge GPU 实例 。 比较结果如下表所示:

实例|新入坑的SageMaker Studio Lab和Colab、Kaggle相比,性能如何?
文章图片

在测试比较中我发现:
  • SageMaker 只有持久存储 , 但与 Google Drive 不同的是 , 它的速度足以训练;
  • Colab 暂存盘因实例而异;
  • Colab 的持久存储是 Google Drive 免费分配的;
  • Colab Pro 可以分配 Tesla T4 或 Tesla K80;
  • 免费版 Colab 也可以分配 Tesla T4 或 Tesla P100;
  • Kaggle 的持久存储为每个笔记本 20GB;
  • Kaggle 有一个每周 GPU 运行时间上限 , 它根据总使用量而变化 , 每周大约 40 小时 。
启动 SageMaker Studio Lab 后将获得稍有修改的 JupyterLab 实例 , 其中安装了一些扩展 , 例如 Git 。

实例|新入坑的SageMaker Studio Lab和Colab、Kaggle相比,性能如何?
文章图片

SageMaker JupyterLab 环境 。
在我的测试中 , SageMaker Studio Lab 的 JupyterLab 的行为与在自己系统上正常安装 JupyterLab 完全相同 。 甚至之前对 JupyterLab 做的修改和已安装的 python 包都还在 。
例如 , 我能够从 Jupyterlab Awesome List 中安装 python 语言服务器和 markdown 拼写检查器 。 但这也带来了一个问题 , 即亚马逊是否会更新像 PyTorch 这样的预安装包 , 或者维护更新的环境是否完全依赖于用户 。
亚马逊后续可能会销毁我的实例 , 或者将来会升级底层映像 , 删除自定义安装的包和扩展 。 但就目前而言 , 相比于 Colab 和 Kaggle , Studio Lab 是三者中可定制程度最高的服务 。

推荐阅读