足球比赛中平局机会的涨缩
用来预测足球比赛得分的主要模型是泊松模型(或者它的变种)。最直接的方法是为每支球队设置预期进球参数,然后相应地预测得分。
泊松模型总结如下:主队参数为联赛平均主场得分率乘以主队进攻因子和客队防守因子。前者根据访问球队的防守评级而对主场得分优势进行相应调整(防守实力越强,进球机会就越低),而后者则评估主队得分能力。客队预期进球得分率的评估方法类似,不过使用了客队得分因子和主队防守因子。
泊松模型的局限性
如同其他任何模型,泊松模型在预测足球比赛得分时也有某些局限性——即。
实际上,经常在比赛中进很多球的球队得到0-0平局的机会要高得多,因为在比赛关键时机过去后仍然没人进球的情况下,他们可能会降低比赛节奏。
泊松模型还假设一旦预期进球参数设置好之后,每支球队的进球数都是互不影响的。尽管使用特定的防守和进攻评级对这一点有所控制,但是如果主队进了五球或者完全没进球,我们真的能预测在这两种情况下客队进五球的概率是一样的吗?
最致命的局限性是假设每支球队的进球得分变动等于预期进球数(泊松分布的功能)。有很多处理这个问题的聪明方法,比如过度离散(或者欠离散)泊松模型以及二元泊松模型,但是这些都不在本文的讨论范围内。
这些局限性的组合效应之一是缺乏评估0-0平局的预测能力,这样的平局可能高于或低于泊松模型产出的结果。我的直觉是泊松模型倾向于低估0-0平局发生在那些有着高预期进球参数的球队身上的可能性。
实际上,经常在比赛中进很多球的球队得到0-0平局的机会要高得多,因为在比赛关键时机过去后仍然没人进球的情况下,他们可能会降低比赛节奏。反之,在比赛中经常得低分的球队在拿到首粒进球之前可能节奏更快。标准泊松模型无法捕捉到这一点,因此过高预测0-0平局的机会。我已经指出这不过是个人直觉,并非基于任何测试的结果——如果任何人愿意对其进行测试,不妨联系我,我非常高兴和任何感兴趣的人进行沟通。
如何缩小或者胀大平局概率
调整0-0平局概率的一种方法是胀大或缩小此类平局的概率,并相应调整其他预测。这可以通过五个步骤来进行解释,我将在此使用一个简单的例子来解释:
第1步:计算每支球队的预期进球参数
除非你已经自动化了这个过程,否则这会是耗费你最多时间的一个步骤。Benjamin Cronin在他的中完美地对此进行了解释。为了不做过多的赘述,我们在此假设最后的平均进球参数分别为主队1.7和客队1.2(这些不过是随机的数字)。
第2步:计算每支球队进球数的概率
这可以通过使用方程式来进行计算,上方链接中也提供了完整的例子。在这里,我们使用方程式来计算进球数的概率分布,如下所示:
足球比赛进球数量的概率分布
- |
- |
进球数量的概率 |
||||
球队 |
预期进球参数 |
0 |
1 |
2 |
3 |
4 |
主队 |
1.7 |
18.30% |
31.10% |
26.40% |
15.00% |
6.40% |
客队 |
1.2 |
30.10% |
36.10% |
21.70% |
8.70% |
2.60% |
第3步:计算比分的概率分布
现在我们可以将概率相乘,得出不同比分的概率。例如,0-0比分为18.3% x 30.1% = 5.5%的可能性。结果如下所示。请注意,这些相加起来不会满100%,因为存在其他比分的可能性(例如5-1)。我们可以补充说明其他比分的概率为3.7%。
计算比分的概率分布
- |
- |
主队进球 |
- |
- |
- |
|
- |
- |
0 |
1 |
2 |
3 |
4 |
客队进球 |
0 |
5.50% |
9.40% |
8.00% |
4.50% |
1.90% |
- |
1 |
6.60% |
11.20% |
9.50% |
5.40% |
2.30% |
- |
2 |
4.00% |
6.70% |
5.70% |
3.20% |
1.40% |
- |
3 |
1.60% |
2.70% |
2.30% |
1.30% |
0.60% |
- |
4 |
0.50% |
0.80% |
0.70% |
0.40% |
0.20% |
第4a步:计算0-0平局的膨胀/收缩参数
这一步中可能会渗入某些主观性。例如,假设过去的统计数据暗示0-0平局应该有10%的概率发生。因此我们需要将5.5%增至10%。
膨胀参数的计算方式:
(0-0的假定概率)/(预测的概率)=(假定的概率)/(概率(0,0))
使用符号α来代表它,我们得到:
α=10/5.5=1.82。
这有力地表示我们增加了82%的零分平局概率。由于这是从5.5%增至10%,因此我们必须降低其他概率累积起来的概率的相同百分比,以使所有结果的总百分比为100%。
第4b步:计算其他比分的膨胀/收缩参数
使用符号β来代表这个因子,我们可以使用等式:
β=(1-α[概率(0,0)])/(1-[概率(0,0)])=(1-假定概率)/(1-预测的概率)
在这里我们得到β=(1-0.1)/(1-0.055)=0.95
第5步:重新填充膨胀的比分表
现在我们终于可以重新计算不同比分的概率,只需将0-0概率乘以α,剩余其他概率乘以β。我们将得到以下结果,而其他比分的概率为3.5%。
重新填充膨胀的比分
- |
- |
主队进球 |
- |
- |
- |
|
- |
- |
0 |
1 |
2 |
3 |
4 |
客队进球 |
0 |
10.00% |
8.90% |
7.60% |
4.30% |
1.80% |
- |
1 |
6.30% |
10.70% |
9.10% |
5.10% |
2.20% |
- |
2 |
3.80% |
6.40% |
5.50% |
3.10% |
1.30% |
- |
3 |
1.50% |
2.60% |
2.20% |
1.20% |
0.50% |
- |
4 |
0.50% |
0.80% |
0.70% |
0.40% |
0.20% |
从调整泊松模型中我们学到了些什么?
我们在本文中通篇讨论了对传统泊松模型的调整,这种调整可以改变零分平局的概率。该模型可以扩展来应对任何比分的调整,只要所有结果的概率也得到调整以满足相加为100%的条件。
这并非改变某些结果概率的唯一方法。例如,Alun Owen博士在去年六月的数学体育大会上解释了一种可能更好的方法,这种方法涉及到了截尾泊松模型。
调整并未最小化泊松模型的局限性,对于某些局限性之前我们作过讨论。这确实增加了其他一些假设——假设的零分平局概率,并且所有其他概率都使用相同比率β作出了调整。尽管如此,它仍然可能是对于倾向低估/高估零分平局的传统模型的优秀改进。