云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

腾讯云_阿里云邮箱_三重好礼

小七 141 0

用SQL、Python和R一起回答更深层次的数据问题

博客为了了解未来企业如何利用数据创造最大价值,回顾一下之前塑造了这一空间的创新浪潮有助于理解这一点。商业数据的例子让我们可以追溯到70年代,以及数据库的引入,当时数据库非常昂贵,功能极其有限。上世纪80年代,商业智能诞生了,它为公司提供了一种全新的方式来看待信息,即使它仅限于那些数据库中的一小部分特定信息。这种数据库和BI的结合是如此的有价值,以至于在接下来的20年中,它一直保持相对不变。改变的是,电脑在工作场所变得越来越普遍,出现在世界各地公司办公室的每一张桌子上。不久之后,商业智能分析领域的下一波创新浪潮出现了:拖放功能被引入到这个领域,使几乎每个商业用户都可以访问BI在21世纪初,拖放导致了大量的新用户对存储在早期数据库中的简单、有限的信息提出基本问题。这种设置对于那些有静态数据需求的公司来说非常棒,但是互联网的普及带来了一系列的变化,从根本上改变了这个行业。在下一波创新浪潮中,更大的存储空间和极为廉价的计算导致了复杂的新数据集的产生,这些数据集无法使用标准BI和传统数据模型轻松分析。如果你把这些复杂的数据和分析工具升级到了现代数据时代,你就有可能问这些问题。今天有什么可能数据专业人员可以用复杂数据回答的问题是无限的——太大了,仅仅是拖放式的BI是没有效果的。这些团队解决新问题和为其组织增加新价值的能力是可以通过数据成熟度来衡量的。数据成熟度的概念是,通过改进分析中使用的技术、流程和人员,公司可以从数据中获得更多的价值对数据分析不熟悉的组织可以专注于一些简单的任务,比如将所有数据收集到一个单独的真相来源中,并自行更新。从那里,公司可以构建一个BI引擎,使用更民主的拖放方法来转换其复杂的数据。这使数据价值大增。一旦他们的BI设置好,团队可以选择用一系列高级分析选项来补充该功能,这些选项将使他们进入数据成熟的后期阶段在早期阶段,SQL可以为企业解决这些新类型的问题创造奇迹。对于基本报告,您不需要比SQL更高级的技术或语言,您可以一直依赖于这种语言。随着技术的进步,您必须用Python或R来补充SQL,这些语言擅长简化复杂的数据处理过程。这些语言有库和包,允许你用数据提出新问题,更注重预测未来,而不是描述过去。SQL与Python和R理解SQL和Python/R之间区别的一个简单方法是考虑绘制一个空房间的任务。SQL就像滚轴,简化了大部分工作—这就是您将覆盖大部分空间的方式—但它们并不足以满足工作的每一部分。你没有使用滚轮进入角落,完成窗户周围的装饰,或是房间的其他部分需要精确的细节。SQL不是细致入微的,它是一种直截了当、直截了当的语言,为你的分析奠定了基础。它擅长于简单的分析,但在更复杂的分析上却不足。一个好的数据分析员确切地知道SQL要做什么,并将其用于这些事情。Python和R更适合项目的细致入微的部分。如果SQL是油漆辊,Python和R就像一组画笔,为需要精细处理的部分保留。正如画笔有许多大小和形状以适应不同的绘制任务一样,有许多Python库和R包是为您想要运行的任何特定数据分析而构建的理想的工作流使用每种语言来完成它的设计任务。首先在SQL中进行一般的数据准备,然后将数据传递到Python或R中,以便进行您要运行的特定分析。这相当于用滚筒进行大量的数据分析,然后用刷子打磨边缘和更敏感的区域。你将尽可能有效地利用时间和资源完成这项工作。当您绘制更多的房间时,没有一个房间是完全相同的,但是您可以使用相同的方法来复制您的良好效果。创造无限的新事物在SQL分析的基础上使用Python和R的好处在于,一个熟练的数据创建者可以创造出很多新东西。SQL有局限性,R和Python可以将您的数据项目带到无限多个新的方向,包括某些高级统计分析、数据清理、复杂的可视化、自然语言处理、机器学习准备等等。只要您知道何时以及如何使用每种语言,您的分析能力是无限的。这些语言为SQL的基本构建增加了新的维度。Python和R是动态的,它们不断添加新的包和库来解决新问题。一个允许团队使用数据语言组合的平台具有独特的定位,可以为掌舵的数据构建者产生难以置信的价值。标记:data science | SQL