这种pair竞赛的胜率预测,经典的模型是Bradley Terry Model,用于研究各个player之间的实力水平。为了更好的解释各个player的表现,还可以加入其他解释变量,例如发色、场地、主客场等。
不考虑其他解释变量, player i 胜过 player j的概率为:

logit(p_{ij})=\lambda_i-\lambda_j

估计时,会以一个player的\lambda_i为0。
这个模型潜在假设是:如果a比b强,b比c强,那么在相同条件下,a比c强。
如果模型估计出来的参数有显著性的话,也许对应的协变量 或 player 是会导致更大胜率的。一场比赛之间胜负有三个因素决定:天时(随机性)、地利(协变量)、人和(个人实力),全在一个模型中。
——————–补充说明—————-
1. 每个player估计出的能力值和能力值的标准差,如果能力很高,但是标准差也很大,那么说明这个player的表现是不稳定的或可信度低。
2. 参考文献1中列举了模型的各种变体,可以加入各种player specific和 match specific 的变量,guardian的这篇文章里面kick off time、temperature即match specific,formation、fair-haired即为player specific。还可以考虑随时间变化的经验增长问题。
3. 反转问题:心理学中,研究不同个体(subject)对一系列东西(object)的两两优劣评价,把每个个体看做一场match,不研究每个player的特质,而研究match的特质。意义是:研究是什么因素导致subject之间的“评价体系”的差异。

参考文献:
[1] Bates D, Machler M, Bolker B (2011). lme4: Linear Mixed-Effects Models Using S4 Classes. R package
version 0.999375-42, URL http://CRAN.R-project.org/package=lme4.
[2] Agresti A (2002). Categorical Data Analysis. 2nd edition. John Wiley Sons.
[3] Bradley RA (1984)./Paired Comparisons: Some Basic Procedures and Examples.0
In PR Kr- ishnaiah, PK
Sen (eds.), Nonparametric Methods, volume 4 of Handbook of Statistics, pp. 299 õ326. Elsevier.

— 完 —

本文作者:陈文钦

【知乎日报】
你都看到这啦,快来点我嘛 Σ(▼□▼メ)

此问题还有 3 个回答,查看全部。
延伸阅读:
为什么威尔士,苏格兰,英格兰有独立的足球总会,分别单独参加世界杯和奥运会的足球比赛?
在英国,从York开车到苏格兰高地的Inverness,这中间在哪里停留休息顺带观光比较理想?

分享到