马卡:对一休足球传球成功率以及进球期望公式的一些看法
一休的原文:http://bbs.arsenal.com.cn/viewthread.php?tid=124653&extra=&page=1
公式是:Y=E*M[X]*N*V
式中,代表足球队在某场比赛中的进球期望。E是球队在比赛中获得进攻机会的预期,M[X]是M的X次幂,其中M为普通传球的成功率,X是每次进攻的传球次数的预期,N是每次进攻最后一次传球的成功率(该传球的目的为直接形成射门)。V代表射门得分率,即进球数与射门数之比。
首先,说说一休的公式和拟合。
这个公式其实是一个简化了的数学期望,Exp(Y)=Exp(E*M[X]*N*V),Exp表示数学期望算子。一休代入数字的时候,其中数学期望被平均数所近似。E*M[X]*N*V分解了进球的必要过程,有内在逻辑的合理性;而Exp(Y)的相对准确性来自大数定律,即等式右边代入的各个本均值(E,M,X,N,V)会接近它们数学期望。
存在的问题:
1、一休实际上假设各个环节之间是独立的,因此Exp(Y)=Exp(E)*Exp{M[X]}*Exp(N)*Exp(V),把等式右边的期望单独计算。这个假设要求传球的成功概隆镣射门的成功概率互相独立,这是有点问题的,球员状态不好的时候传球不准,射门也会比较臭。
2、一休实际计算的是:Exp(Y)=Exp(E)*Exp(M)[Exp(X)]*Exp(N)*Exp(V),就是假设Exp{M[X]}=Exp(M)[Exp(X)]。作为一个计算期望的近似方法,这是可以接受的,但是从数学上来说,这个假设不成立。
总结以上的分析:一休的数据和分解,有助于量化分析一场比赛中进球很多或者进球不足的原因,但是因为以上两个隐含假设,恐怕会引进一些系统性的误差。
其次,关于更多球队可能达到90%成功率的说法,我并不乐观。
一休的公式属于一种统计上的拟合,属于一种简化的、基于结果数据的模型(reduced form model),真正合适用于分析的结构模型(structural model)应该是博弈论(game theory)。简单说,传球的成功率不仅仅取决于自己的技术,还取决于对手的策略,抛开双方博弈这个重要的因(其他的因包括球员水平等),去单纯谈传球成功率这个果容易陷入误区。
现代足球攻守的两种思想一直都在互相制约和斗争,一方优先想提高成功率(如阿森纳),另一方优先想降低对方的成功率(如穆里尼奥的切尔西),阿森纳过去和未来的成功必然带来防守足球的反思和提高,不会出现永远的赢家。
最后,关于传球成功率上升对进球的影响。
文中的例子,2%对结果有很大影响。这里一休可能忽视了一个问题,M[X]这个公式中,指数X高的时候,M的微小差别就会扩大。用简单的话来说,就是进攻倒脚次数很多的球队,传球成功率的影响非常大。但是提高进球数,不一定需要通过提高传球成功率。
一种非常有效方法是减少传递的次数,也就是以前维埃拉中场断球-->博格坎普/皮雷过渡-->亨利/永贝里/皮雷破门的这种反击模式。实际上这种方式在现代足球中非常有影响,10年前霍顿来中国时候就说,3脚一下传球制造的进球占60%以上,温格观摩过94年世界杯后,也赞同类似的不经过前腰过渡的简洁反击打法。在这种类型的进攻中,传球可以更加冒险一些。如果能够多形成这种快攻的机会,虽然看似传球失误也多,效果上来看破门的次数不会少。这类的进攻中,传球固然重要,也要和跑位等细节有机结合。(阿森纳中国网 www.arsenal.com.cn)