英格兰vs伊朗让球RStudio最近发布了一个名为sparklyr的新开源包,它使用一个完整的dplyr后端,并支持Spark的整个MLlib库,促进了R和Spark之间的连接。卡塔尔世界杯欧洲预选赛赛程表由于Spark能够以极低的延迟与分布式数据进行交互,因此它正在成为在交互环境中与大型数据集进行交互的有吸引力的工具。除了处理数据存储之外,Spark还集成了各种其他工具,包括流处理、图形计算和分布式机器学习框架。R程序员可以通过sparklyr包获得其中一些工具。

在这个由四部分组成的系列文章中,我们将讨论如何在现代R环境中利用Spark的功能。sparklyr系列:

  1. 介绍Apache Spark的R接口
  2. 使用sparklyr和R扩展Spark
  3. sparklyr的高级功能
  4. 了解Spark和sparklyr的部署模式

下载资料

标签: 火花 sparklyr

订阅更多鼓舞人心的开源数据科学内容。

我们喜欢庆祝和帮助人们做伟大的数据科学。通过订阅,每当我们发布新内容时,你都会收到通知。