英格兰vs伊朗让球RStudio最近发布了一个名为sparklyr的新开源包,它使用一个完整的dplyr后端,并支持Spark的整个MLlib库,促进了R和Spark之间的连接。卡塔尔世界杯欧洲预选赛赛程表由于Spark能够以极低的延迟与分布式数据进行交互,因此它正在成为在交互环境中与大型数据集进行交互的有吸引力的工具。除了处理数据存储之外,Spark还集成了各种其他工具,包括流处理、图形计算和分布式机器学习框架。R程序员可以通过sparklyr包获得其中一些工具。
在这个由四部分组成的系列文章中,我们将讨论如何在现代R环境中利用Spark的功能。sparklyr系列: