云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

域名备案_阿里云学生版_最新活动

小七 141 0

宣布RStudio和Databricks集成

在Databricks,我们很高兴宣布RStudio与Databricks统一分析平台的集成。你现在可以用这个RMarkdown笔记本(Rmd | HTML)来试用它,或者访问我们的网站。对于希望将基于R的高级分析扩展到大数据的R从业者,Databricks提供了一个统一的分析平台,可以在几秒钟内启动和运行,与RStudio集成以提供易用性,并使您能够在单个或多个节点上以前所未有的规模自动运行和执行R工作负载。将Databricks和RStudio集成在一起可以让数据科学家解决许多挑战,包括:提高数据科学团队的生产力:使用R的数据科学家可以使用他们最喜欢的IDE,使用SparkR或sparklyr无缝地在Spark上执行作业,以扩展基于R的分析。同时,您可以让您的环境快速启动并运行,以提供扩展,而无需群集管理。简化访问并提供最好的数据集:R用户可以访问Databricks的完整ETL功能,以提供对相关数据集的访问,包括优化数据格式、清理数据和连接数据集,为您的分析提供完美的数据集将基于R的分析扩展到大数据:通过将当前基于R的分析扩展到基于Databricks上运行的apachespark的分析量,从数据科学转向大数据科学。同时,您可以通过数据块的自动缩放来控制成本,从而根据您的分析需求自动上下扩展使用量。引入Databricks RStudio集成通过Databricks RStudio集成,可以在Databricks上的rstudioide内部使用与apachespark、SparkR或sparklyr交互的两个流行R包。当多个用户使用一个集群时,每个用户都会创建一个单独的SparkR上下文或sparklyr连接,但是他们都在与一个Databricks管理的Spark应用程序对话,从而为用户之间的协作提供了独特的机会。RStudio可以一起利用Databricks的集群管理和apachespark来执行大量的模型选择,如下图所示。您可以使用这个k-最近邻(KNN)RMarkdown回归演示(Rmd | HTML)自己运行这个演示。下一步行动我们的目标是通过RStudio和Databricks使基于R的分析更易于使用和更具伸缩性。要深入了解RStudio集成架构、用户如何访问Databricks集群上的RStudio的技术细节,以及分布式计算的强大功能和RStudio的交互性示例,请访问。免费试用Databricks。今天就开始吧