使用熟悉的R接口与Spark交互,例如dplyr,扫帚,DBI.
dplyr
扫帚
DBI
获得Spark分布式访问权限机器学习库,结构流,毫升管道从R。
通过添加扩展您的工具箱XGBoost,MLeap,水而且Graphframes对你的Spark + R分析。
在Spark运行的地方连接R:Hadoop、Mesos、Kubernetes、Stand Alone和Livy.
运行分布式R代码在火花
欢迎新用户!从这里开始学习如何安装和使用sparklyr.
sparklyr
“如何”的文章,以帮助您学习如何做的事情,如:连接AWS S3桶,处理流数据,创建ML管道等。
关于Spark环境的文章。包括AWS EMR, Databricks和Qubole。