industry information
第22届足球世界杯已落下帷幕,这一届世界杯最大的赢家是阿根廷,是梅西,更是亿万期盼梅西封神的球迷。将近一个月的比赛跌宕起伏、精彩纷呈。球赛开始前和比赛期间,预测结果更是成为球迷们的最大兴趣。世界上的各大媒体,电视台,也纷纷加入到预测中来。我虽然算不上一个具有专业水准的球迷,但也禁不住周边朋友们热闹场面的诱惑,对多场比赛结果进行预测。
预测的最大乐趣是增加了看球的乐趣,本来是一场与自己无关的比赛,因为有了预测,就特别期望自己预测正确。而且一旦结果与预测一致,那种成功的喜悦,很难用语言来形容。
预测足球比赛结果是一门技术活,首先要对球队有比较深入的了解,包括球员构成、综合能力、历史战绩、世界排名、当家球星、球员状态、对手情况等,了解越多,预测似乎就越准确。但实际情况往往出乎意料甚至大相径庭。以牛津大学预测为例,他们用自己的数学模型计算出来的预测结果如图1所示。
图1 牛津大学给出的预测模型
从图1可以看出,尽管引入了非常复杂的数学计算,并对各队的历史数据,交战结果做了详细的分析,但预测结果却不尽人意。小组赛也就有一半预测对了胜负,其中进入决赛的两支队伍都错了。其他很多预测机构也大致相同。
其实,影响比赛结果的因素很多,球队实力固然非常重要,但进入32强的球队大部分实力都不弱,尤其是进入淘汰赛阶段更是如此。这时候,球队的战术安排,球员临场状态、取胜欲望、团队配合等方面就显得尤为重要。此外,运气也是比赛的一部分,并且往往成为左右比赛结果的非常重要的因素。
足球比赛既考验双方的能力,也是对双方队员面对面比拼时心理素质的检验。尽管结果不可预知,但其中却蕴含有严谨的数学原理。今天我们就谈谈这个问题。
大家知道,概率论是解决我们日常生活很多问题的重要数学理论。越来越多的足球预测,都是以概率论作为基础进行的。上述牛津大学的预测也是基于概率论的。但概率论如何运用,却是有很多讲究。
一般来说,在一个非受限空间,一个独立事件发生的概率总是符合正态分布的。其定义是:若随机变量x服从一个位置参数为μ、尺度参数为σ 的概率分布,且其概率密度函数为:
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作x~n(μ,σ2),读作x服从n(μ,σ2),或x服从正态分布。图2是正态分布分布密度函数曲线图。
图2 正态分布函数曲线(来源于网络)
当实际发生概率很小时,我们称其为小概率事件,从标准概率分布图中可以看出,位于区间(-3σ,3σ)以外的概率小于0.2%。所以,在很多场合下,就不予考虑。比如,我们在物流系统中采用称重法来检验图书拣选的准确性时,就是选取了这一标准。在很多工业场合,标准会进一步提高,比如我们常说的6σ检验标准,就要求达到(-4.5σ,4.5σ)范围,其精确度将达到3.44ppm(即百万分之三点四四)。
再回过头来看世界杯。如何运用数学原理进行比赛的预测呢?这是一个比较复杂的问题。如果单就一场球来看,其实就是实力对比说了算,作为一个独立事件,没有参考数据,很难做出准确预测。比如德国对日本,一般情况下,大家预测都认为日本会输。但是要进一步定义输的概率和输的比分,就比较复杂了。这就牵涉到一个概率问题。比如说德国输的概率,其实我们可以让他们踢1000场球,看看比分会如何分布,这样结果就出来了。但实际上做不到。因为即使集中踢1000场,这个结果也是有问题的,它与我们掷1000次硬币的情况有很大不同。因为比赛受到人为的干扰。其结果与自然发生的有出入。而实际上,集中踢1000场在时间上也没有可能。所以,我们在预测一场球时,就显得很困难,事实上因为事件的随机性而变得无法预测。如果我们假设德国和日本踢1000场球的结果是600胜,300平,100负,这一结果对指导预测其实帮助不大,但如果联系到历史的比赛,我们还是会做出比较可信的预测。另一方面,我们把一场球放到一个系统中看,将会又是一番景象。比如我们将德国对日本比赛放到一个大的空间,如世界杯大赛这个环境看,德国属于第一梯队,日本属于第三梯队,这样看的样本空间就大得多。因为有大量的第一梯队与第三梯队比赛的样本可供参考。我们可以从这些历史样本中得出一些有用的结论,如双方历史上的胜率,本届已经完成的比赛的情况等,从而指导预测的结果。
在小组赛期间,我们知道,每个小组内的强弱还是比较分明的。这样大家的预测总体来说准确性要高一些,这是我们应用概率论的基础。但另一方面,我们也要看到,比赛结果还是有一定比例的场次出乎大家的意料之外。比如亚洲球队的爆发,日本连胜德国和西班牙,使得德国最终小组未能出线。开始时,很多中国球迷担心亚太区球队会被剃光头,但事实上,不仅有3支球队(含澳大利亚)顺利出线,而且每支球队都有上佳表现。对此,我开始就大胆提出两个假设:第一是亚洲球队必定会有球队进入第二轮;第二是比赛必定会有冷门产生。通过对各小组进行分析,首先把出线的球队寄托在日本、韩国身上,并将日本对德国、韩国对西班牙、沙特对阿根廷三场比赛定义为最容易爆冷的比赛。其中之所以定义沙特对阿根廷会爆冷,则基于阿根廷是夺冠大热门的假设,并且其此前已经35场不败的记录,已经平了世界纪录。概率论的理念就是:阿根廷即使要破世界纪录,也只会破一点点(小概率事件),也就 是说最多再赢1~2场;阿根廷要想夺冠,就不能在淘汰赛输球,小组赛输球是其唯一机会。因此,其输给沙特的理由最充分(第一场可能性最大)。比赛的结果印证了这一猜想。
到了淘汰赛阶段,大家对预测英国和法国比赛产生分歧。认为两队水平相当,英国更胜一筹。但实际过程看,是英国几乎没有希望。但既然是预测,逻辑上要有一致性才行。很多机构预测法国和巴西争夺冠军,这是有一定道理的,事实上要做到这一点,两队在淘汰赛中,它几乎就不可能会输。要怎么样才会输呢?需要爆冷才会输。我们知道,在世界杯上,爆冷是有其必然性的。从历史数据看,总会有一定比例的比赛会爆冷,有些还是大冷门,这就不是小概率事件了。法国输给英国根本就不算冷门,法国只有输给像澳大利亚这样的队伍才是大冷门。另一边就不同了,巴西对克罗地亚,结果是巴西爆冷出局;西班牙对摩洛哥,同样是西班牙爆冷出局;到了葡萄牙对摩洛哥,其实已经不是爆冷了,葡萄牙队内出现严重问题,才使得摩洛哥一举击败葡萄牙,挺进4强。
其实,后面的4场比赛,结果早就失去悬念。尽管他们的能力差异在毫厘之间,但再爆冷的几率已经很低了。其一是克罗地亚和法国进入决赛,这几乎是不可能的结果,因为这种重复上届比赛结果的可能性微乎其微,历史上只有一次,而且克罗地亚水平本来就有限,打败巴西,进入4强已经是超水平发挥。其二是梅西封王众望所归,4次冲击冠军,无果而终,本届比赛,将是梅西最后的机会。梅西占尽了天时地利人和。人们无法想象没有获得世界杯的梅西,会如何与其球王身份相匹配。第三是法国卫冕也是难上加难。试问,世界上除了巴西卫冕成功过一次外,还有谁能获得这份殊荣?以法国足球的底蕴,根本不可能达到这一高度。
所以,同样是概率论的应用,在临场操作时应该从多方面考虑,而不能仅仅局限于一个维度。比如,预测决赛会不会出现帽子戏法这一事件,有几个因素支持这一预测,第一是全部21届比赛,居然出现了52个帽子戏法,平均每届2.47个,本届比赛还只有1个,这是不正常的;第二,从决赛的氛围来看,从两队的风格来看,从球星的能力和机会看,完全是有可能的,并且可能是大概率事件。
世界上的事情,往往都包含有一定的数学原理,被数学原理所制约。但即使如此,由于未来的不确定性仍然使得预测不可能百分之百准确,预测归根到底是一种猜测,它不代表结果的确定性。我们知道,再小的概率也是可能发生的,但如果我们明白背后的逻辑,将会使得猜测准确性更高。足球比赛尤其如此。因为,每场比赛虽然时间很长,但进攻到禁区并且获得得分的机会却不多。所谓的偶然性就成为左右比赛结果的重要因素。强队如果没有抓住机会,反而被弱队抓住宝贵的机会,结果就会逆转,这也是足球最具有魅力的地方。当然,强弱如果是一边倒的情况,所谓的偶然性基本是不可能发生的。
图片来源于网络
下一篇:要警惕放开后的新问题