云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

网站建设_数据库表关联_年度促销

小七 141 0

这个博客是关于一些基本的统计方法,有时用于欺诈管理。应用程序非常简单:给出一份f.e.费用清单,大数据都学什么,我们可以证明他们是否可疑。这些测试可用于分析业务规则。我写这篇博客是作为一个博客系列的一部分,在这个系列中我描述了如何在HANA中使用算法,这些算法可以通过ADMP或数据库代理在业务规则中使用。与典型的业务规则不同,它们处理许多行项目。在这个博客系列中,我讨论了预测时间序列和线性优化的基本应用。Benfords定律出现在许多数据集中,什么是软件企业,可以用所谓的卡方检验来检验这个定律。这些统计测试可以在HANA的SQLscript过程中使用,无论是在PAL中,当然是在R中。在我的博客系列中,我将重点放在R上。原因很简单:一旦你学会了R,算法的设计就非常容易,在大多数情况下,你可以在现有的软件包中找到非常好的算法实现。

因此,我将用这篇博客文章对Benfords定律做一个简短的介绍,并展示如何使用它我也将利用这个机会介绍这种编程语言的一些方面。

本福德定律

1881年西蒙纽科姆在美国数学杂志上发表了一篇两页的文章。在这个时候,复杂的科学家使用对数来进行复杂的计算,他观察到那些书在开始时更脏,在结束时更干净。后来这导致了Frank Benford的观察,许多数据集中的第一个数字比其他数字出现的频率更高:第一个数字偏向于较低的数字。他用河流的表面积、人口规模、物理常数等进行了测试。今天,当我们统计Twitter上的关注者时,我们观察到了同样的情况,如下所述:https://www.r-bloggers.com/benfords-law/

如果您对本福德定律的数学背景感兴趣,我建议您阅读以下文章:https://www.stat.auckland.ac.nz/~fewster/RFewster\u Benford.pdf

统计学家在许多领域应用了这一法则区域,学生云服务器,例如采购订单、余额、信用卡交易、库存项目应付账款交易等的分析。通常,返现网,测试Benford定律只是欺诈管理的一个方面,通常需要更多的工作。

R中的Benford对象

正如我之前所说的,R中已经实施了Benford分析:https://cran.r-project.org/web/packages/benford.analysis/benford.analysis.pdf像往常一样,我建议用R实现它在HANA中实现这些算法之前,请先在PC上安装studio。上面提到的文档非常好,大数据精准获客,通过它,尝试对R和R studio进行一点介绍。我希望这将有助于读者熟悉R.

所以首先下载库并使用命令:library加载它(本福德分析公司)。此库附带一些示例数据集。只需键入data()即可获得所有数据集的列表:然后使用数据加载数据集(公司付款)。该数据集包含西海岸公用事业公司某部门2010年付款数据的数据集。当我使用R对象(大多数api都是对象,dataset也是)时,第一件事就是获得结构的概述。有一些命令可以帮助我获得正确的信息:现在我知道这是一个相当大的数据集,有189470行。此外,它是一个数据帧-一个基本的数据结构在R中定义的基本包。它包含一个称为统计变量的值列表。一个变量是"Amount",它包含特定供应商的金额以及其他属性。有头的(公司付款)我得到了第一个值的概述(公司付款$Amount[1:300])我可以大致了解前300个金额:顺便说一下,当我从HANA调用R时,我总是使用数据帧作为结果结构。我不知道还有哪些可能性存在,但数据帧对我来说是个不错的选择。

使用以下命令,我们可以创建一个Benford对象:cp