数据库_怎么用mysql创建数据库_免费6个月

小七 2019年10月25日 21:23 141 0

聚光灯应用程序：Qlik

这篇文章是我们在Qlik的朋友们客串撰写的，描述了apachespark如何实现最近在apachespark上认证的QlikView的全部功能，以及它在整个HDFS数据集上的关联体验特性。Qlik的力量Qlik提供的软件和服务有助于使理解数据成为人们决策的自然组成部分。我们的产品QlikView是领先的业务发现平台，它集成了独特的联想体验，使业务用户能够按照自己的方式制定和回答问题，从而做出更好的决策。传统的、基于查询的BI工具迫使用户通过预定义的导航路径，这些路径限制了可以回答的问题的种类，并且需要花费大量时间进行修改以满足不断变化的业务需求。相反，当用户使用QlikView选择数据项时，所有字段和图表都会立即更新，以反映所选项目与业务模型中其他数据项之间的关系。使用QlikView时，关联的数据总是很明显的，因为所选项目以绿色背景显示，所有相关值都有白色背景，而不相关的项目则以灰色背景显示。扩展到更大的数据集认识到许多客户需要QlikView的强大功能来分析无法加载到QlikView内存引擎中的数据量，Qlik通过添加Direct Discovery来扩展其引擎，这是一种混合方法，将内存中的数据与对驻留在外部大数据源中的数据的动态访问结合起来。使用这种混合模型，每当用户选择与外部数据相关联的内存中的数据值时，QlikView引擎就会动态地为外部数据制定和提交查询。使用Direct Discovery，用户可以充分利用QlikView的关联体验，而无需首先将大数据源中的原始数据摄取到QlikView中。当然，在Hadoop上运行直接发现应用程序的能力是Qlik最早预期的用例之一，因此我们与Hadoop合作伙伴密切合作，以确保以最快、最简单的方式访问HDFS数据。我们知道，我们有一些现有客户使用MapReduce聚合HDFS数据以加载到QlikView中，这些客户不仅希望更快的加载时间，而且还可以选择对其预聚合的数据使用直接发现。利用Apache Spark自从有了直接发现之后，我们跟踪了apachespark项目，注意到使用RAM进行阶段间缓存的明显性能优势，而不是传统的MapReduce基于磁盘的延迟更高的方法。Spark不仅为SQL提供了高性能平台，而且还为其他关键的大数据需求（如迭代机器学习算法和流媒体）提供了高性能平台，这给我们留下了特别深刻的印象。Qlik很高兴参加Databricks"Spark认证"计划，因为我们知道Spark正在加速我们客户交付高性能应用程序的能力，这些应用程序可以在其HDFS数据的全谱上运行。首先，使用Shark，QlikView用户现在可以使用directdiscovery，在整个HDFS数据集上充分利用QlikView关联体验的强大功能。使用Spark的rddapi，客户能够构建非常简洁的流水线式流，从而大大减少执行HDFS数据重新加载任务所需的时间，以便批量加载数据。Qlik明白，快速、方便地访问越来越大、越来越多样化的数据源是从数据中获得最大业务价值的最关键因素之一。显然，Spark极大地提高了大数据的可访问性，通过在apachespark上认证QlikView，Qlik向其客户提供了增强的数据可访问性，同时鼓励广泛采用这一关键的大数据平台。免费试用Databricks。今天就开始吧

本文地址： /ziyuan/3584.html