速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?( 二 )


此外 , 惠普还提供一款迷你机箱的 Z2 MINI G5 , 采用单路酷睿 10 代处理器 , 1 块 NVIDIA Quadro RTX 3000 移动版、NVIDIA Quadro T2000 或 NVIDIA Quadro T1000 GPU , 尺寸仅有 21.6cm × 21.6cm , 静音设计 , 适用于 Intel X86 架构的边缘计算 。

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?
文章图片

惠普的 Z 系列工作站跑机器学习效率如何?在今年 7 月东北大学软件学院的一次测试中 , Z8 G4 台式工作站展现出了实力 。 首先是这台机器的配置:

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?
文章图片

我们用它与一台 2 × Intel Xeon Platinum 8260 / 64G 内存 / NVIDIA Tesla P100 / 1T SSD 配置的工作站进行对比 。
首先使用目标检测领域最著名深度学习模型 YOLO 分别对吸烟行为和打电话行为进行训练 。 通过测试 , 我们看到使用 HP Z8 G4 能够明显提高训练速度 , 节省大量时间 。

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?
文章图片

在行为识别任务上 , 基于 MiCT 对视频中的行为进行识别实验中 , 原本耗时为 15h 的训练 , 使用 HP Z8 G4 仅需要 5h49min , 节省了将近三分之二的时间 。

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?
文章图片

基于 Faster R-CNN 和 FPN 模型针对 PCB 工业缺陷识别进行训练 , 原本耗时超过 20h 的训练 , 使用 HP Z8 G4 仅需要 11h , 节省了一半的时间 。

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?
文章图片

MobileNet 训练速度如何?在工业铭牌检测深度神经网络模型训练中 , HP Z8 G4 的表现同样速度更快 。

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?
文章图片

由于 HP Z8 G4 电源功率可以高达 1700W , 支持三块双宽 GPU 卡或者四块单宽 GPU 卡 , 能够一次性加载更多视频 / 图片数据 , 搭配双路 CPU 和高速硬盘 , 能够显著提升训练速度 。 另外 , 惠普工作站可以长时间高负荷运行 , 适合实验室环境进行科研工作 。
担心安装环境要调一天?惠普的工作站都预装了最热门的数据科学软件工具 , 可以帮你大幅缩短数据科学环境的配置和维护时间 。
惠普还提出了 HP AI 开发平台 , 这是一款基于 Docker+Kubernetes 的人工智能容器云平台 , 能够实现异构资源的高效管理、调度和监控 。 提供了从模型开发、训练到部署的完整流程和工具 , 能够大幅度降低人工智能的进入门槛 , 提升开发效率 。

速度|全球芯片短缺,显卡价格居高不下,跑深度学习该如何装机?

推荐阅读