如何在Python中编写简单代码,并且速度超越Spark?( 四 )
\n \n
像Spark这样的框架具有异步引擎(Akka) 和内存优化数据布局的优势 , 它们可以将工作分配给不同机器中的多个工作人员 , 从而提高性能和可扩展性 , 并使其成为实际标准 。
\n \nRAPIDS帮助Python开挂
\n \n英伟达想出了绝佳的点子:保留面向Python的API(接口)中受欢迎框架 , 如pandas、Scikit-learn和而在GPU的高性能C代码中处理数据 。 他们采用内存友好型的ApacheArrow 数据格式 , 以加速数据传输和操作 。
\n \nRAPIDS支持数据IO (cuIO) 数据分析(cuDF)和机器学习(cuML).这些不同组成部分共享相同的内存结构 , 因此基本上可以在不将数据来回复制到CPU中的情况下完成数据摄取、分析和机器学习的过程 。
\n \n以下示例演示了读取大型Json文件(1.2GB)的实例 , 其使用pandas API聚合数据 。 可以看到 , 使用RAPIDS运行相同的代码 , 速度如何增快30倍 , 与没有IO的计算相比 , 它快了100倍 , 这意味着还有对数据进行更为复杂计算的余地 。
\n \n \n推荐阅读
- 小鱼人|如何在新赛季稳定上分?善于抓失误的小鱼人,值得认真练上一波
- 真女神转生5|梦幻西游:如何在商会开一个物品储备店
- 甘蔗|如何在Minecraft获得“水下空气”?大佬:一个甘蔗就能搞定!
- gk战队|英雄联盟情怀老玩家如何在手游中再现风采?玩好赵信就能轻松上分
- 热血传奇|热血传奇:如何在传奇中逐步积累优势?这些方法你了解吗?
- 手机游戏|英雄联盟手游:回城买装备的意义何在?浪费时间背后的战略意义
- mmo|mmo游戏再获新生?被判“死刑”的mmo,为何在2021年集体爆发
- ag战队|生存游戏内,危险角色的魅力何在?
- 地下城与勇士|DNF:“有军选军,无军选针!”时空手镯为何在版本末期逆袭?
- 红流|英雄联盟:唯一的版本真神——论红流战士如何在这个时代独占鳌头