云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

全站加速_申请网易企业邮箱_新注册优惠

小七 141 0

如果你收听体育谈话电台,你可能已经听到了围绕足球得分上升的激烈辩论。在周一晚上史诗般的拉拉姆队对KC队队长的比赛被淘汰后,许多人怀疑这是否是NFL的新常态。虽然这些讨论是一个很好的娱乐来源,许多人倾向于非常主观,几乎没有数据来支持他们的观点。作为一个数据极客,为了解开这个谜团,我想我会自己做分析,看看我能发现什么趋势。

体育有一个数据问题

正如我在过去写的,像大多数组织一样,体育也不能免受数据问题的影响。体育数据集往往是孤立的和聚合的,有不一致的时间线,主数据问题,并充满了多对多的连接-举几个例子。获得一个完整的画面,美国橄榄球联盟比我原来的想法更困难。对于你们这些数据怪胎,家庭人工智能,这里是我所做的…

了解输赢。我编写了一个快速的python脚本,(1)从Yahoo Sports的不同表中提取数据,(2)标准化为数据格式,以及(3)更改URL以循环所有不同年份的数据。雅虎体育只追溯到2000年。得到过去30年的个人比赛得分和分布。为了得到下注的赔率和看到个人比赛的结果,我去了谷歌体育。与我上面的数据集类似,一个简单的pyhton脚本能够提取所有这些数据并对其进行规范化。这里的挑战是,由于所有不同的星期、不同的季节和不同的页面格式,这涉及到大量的数据处理——事后处理。为了确保我跟踪的是正确的特许经营权。这些年来,许多特许经营权已经转移了地点,最明显的是拉拉姆斯和拉查尔瑟斯。为了避免数据被篡改,我将数据标准化为单个特许经营ID。例如,LAR特许经营可以同时表示LA Rams和St.Louis Rams。像大多数缓慢移动的维度一样,在电子表格中做起来似乎要快得多。

在NFL中得分上升了吗?多少钱?

今年球队平均每场得分23.3分,比去年高7.5%,比过去10年的平均水平高3.1%。事实上,2013年球队每场得分(23.4分)比今年高。

如果我们看看过去30年的趋势,我们可以肯定地看到,随着时间的推移,得分会缓慢上升。在过去的30年里,得分有15%的增长。根据这个趋势,物联网应用,我们可以预测未来的上升趋势。

具体的球队是提高了还是降低了这个平均数?

如果我们深入到各队,你可以很容易地看到得分差距。通过颜色,你可以看到从左上到右下移动时得分的增加。例如,新英格兰队这十年平均每场得分接近30分,而克利夫兰队的平均得分只有17分多一点。你也可以看到,许多得分高的球队总是得分高,反之亦然。

如果你在过去十年里孤立一些特定的球队,你会发现前五名得分最高的球队都比联盟高出10%平均得分

得分最低的球队都比联盟平均水平低10%

得分越多,胜率越高?得分少会导致更多的损失吗?

下面的两个图像显示了每年的每支球队,它比较了得分与胜利(左)和得分与胜利(右)的对比–这两个图形都以球队是否赢得当年的超级碗为颜色。通常,您可以看到以下内容:

*赢得越多的球队得分越多。

*赢得越多的球队放弃的分数越少。

*赢得超级碗的球队都有高于平均水平的进攻和防守?

下面的图片显示了每场比赛的总得分和每场比赛的平均得分。您可以看到这条O/U线与比赛的实际结果非常吻合。

如果您查看O/U下注的次数,你可以看到,在过去30年里,这是一个投币的过程。

如果你每年看一次,你会发现它每年都会变得更精确——一年比一年没有大的波动。

宝石在哪里?

就像所有的分析一样,总是有一些好的异常值。在过去的10年里,一些主队因为覆盖或不覆盖O/U而更加臭名昭著。例如,在家里把"低于"押在KC上是明智的。而印第安纳波利斯在家里是"低于",返利怎么使用,但在路上是"超过"。

这一切意味着什么?

虽然我能够非常轻松地提出和回答数据中的许多问题,但我的回答并不是很让人大开眼界。我发现:

美国橄榄球联盟的得分逐年稳步上升。虽然2018年的得分很高(比去年高7.5%),但还没有达到前所未有的水平。2013年的得分更高。你不能为了赢得一个超级碗就只进很多球,自助建站源码,你需要一个好的进攻和一个好的防守。赌线比我预期的要准确得多。

下一步怎么办?

就像你的组织一样,数据无处不在。然而,返利淘客,真正的分析往往是留给太少。这是另一个有趣的例子,说明如何应用分析来帮助理解是什么推动了NFL的得分。