um modelo estatístico para campeonatos de futebol · sumário • apresentar um modelo para jogos...
TRANSCRIPT
Um modelo estatístico para
campeonatos de Futebol
Zwinglio Guimarães
IFUSP
Tratamento Estatístico de dados em Física Experimental - 2016
Sumário
• Apresentar um modelo para jogos de Futebol
– Incerteza dos jogos
– Vantagem de ser o mandante
• Caracterizar campeonatos
• Extrapolação (Basquete)
• Simulações Monte-Carlo
– Avaliar a resolução dos campeonatos
– Comparar diferentes sistemas de disputa
• Conclusões
A arte do Futebol
• Alguns conceitos empíricos:
– Os resultados dos jogos são imprevisíveis
• “Futebol é uma caixinha de surpresas”
• “O jogo se define é no campo”
– O mandante tem maior chance de ganhar
• “Empatar fora de casa é um bom resultado”
– No campeonato Brasileiro os times são mais
equilibrados do que nos regionais
• “No Brasileirão não tem jogo fácil”
O jogo como uma medição
Time A GA x GB Time B
Resultado da partida: R = GA - GB
RInterpretação estatística:
Onde ε é um erro aleatório e Δ é o valor médio esperado para
o resultado da partida (relacionado aos times A e B).
Resultados de jogos
RInterpretação estatística:
pdf(ε) ?
Δ ?
Modelo I – p/ copas do mundo
Δ é a diferença entre as qualidades efetivas de A e B Δ = QA - QB
Ajuste pelo Método dos Mínimos Quadrados permite estimar:
• A qualidade efetiva de cada time, Q
• A incerteza, σ, no resultado R de cada jogo
• As características dos erros, ε, pela análise de resíduos
BA QQR
Ajuste pelo MMQ
Modelo para o resultado
dos jogos:
Na forma matricial:
Onde:
𝑅1 = 𝑄𝐴 − 𝑄𝐵
𝑅2 = 𝑄𝐶 − 𝑄𝐷
⋮𝑅𝑁 = 𝑄𝐴 − 𝑄𝐷
𝑌 = X∙ 𝐴𝐗 =
1 −1 0 00 0 1 −1⋮ ⋮ ⋮ ⋮1 0 0 −1
𝑌 =
𝑅1
𝑅2
⋮𝑅𝑁
𝐴 =
𝑄𝐴
𝑄𝐵
𝑄𝐶
𝑄𝐷
Ajuste de funções lineares nos
parâmetros pelo MMQ (revisão)
• Escrevendo a função modelo como:
𝐆(𝑥) = 𝑎1𝑔1 𝑥 + 𝑎2𝑔2 𝑥 + ⋯ + 𝑎𝑀𝑔𝑀(𝑥)
• O sistema linear de equações do MMQ pode ser escrito
de forma matricial: 𝐷 = 𝐌 𝐴
𝐷𝑙 =
𝑖=1
𝑁𝑦𝑖𝑔𝑙(𝑥𝑖)
𝜎𝑖2 𝑀𝑙,𝑐 =
𝑖=1
𝑁𝑔𝑙(𝑥𝑖)𝑔𝑐(𝑥𝑖)
𝜎𝑖2
cuja solução é: 𝐴 =
𝑎1
𝑎2
⋮ 𝑎𝑀
= (𝐌−1)𝐷 com V 𝐴 = 𝐌−1
Ajuste pelo MMQ - II
O modelo para o resultado dos
jogos na forma matricial:
Implica que a matriz X é:
𝐗 =
𝟏 −𝟏 𝟎 𝟎𝟎 𝟎 𝟏 −𝟏⋮ ⋮ ⋮ ⋮𝟏 𝟎 𝟎 −𝟏
Com:
𝑌 =
𝑅1
𝑅2
⋮𝑅𝑁
𝐴 =
𝑄𝐴
𝑄𝐵
𝑄𝐶
𝑄𝐷
𝑌 = 𝐗 ∙ 𝐴
𝐗 = 𝑔1 𝑔2 𝑔3 𝑔4
Possibilitando escrever M e 𝐷
e determinar 𝐴 pelo MMQ.
Exemplo de resultados (Q) 02
Exemplo de resultados (ε) 02
• Desvio-padrão, σε = 1,3(2)
• Curtose, Kε = 4,0 (14)
Quantificando o ε – COPAS
Mais sobre o ε – COPAS (58 a 06)
• Desvio-padrão, σε = 1,53(6)
• Curtose, Kε = 3,5 (4)
Campeonatos Nacionais: BR
MQQ BA Novo modelo
para Δ:
Distribuição
assimétrica:
Mandante tem
vantagem.
Efeito do mando de jogo – BR
Considerando o
efeito do mando:
MQQ BA
Sem considerar o
mando:
BA QQ
σε = 1,58 (2) Kε = 3,5 (2)
Quantificadores de ε - BRσε = 1.58 (2) Kε = 3.5 (2)
Qualidades dos times no BR
σQ = 0,47 (8)
M = 0,58 (8)
σQ = 0,42 (8)
M = 0,47 (8)
σQ = 0,32 (7)
M = 0,47 (7)
Caracterização do Brasileirão
Caracterização de campeonatos
ε em diversos campeonatosσε ~ 1,55 Kε ~ 3,4
Kε ~ 3.4 e as probabilidades
A x B com
QA – QB = 0,45
M = 0,5
B x A
ALGUMAS APLICAÇÕES
Dúvidas Históricas
Final da copa 98
França 3 x 0 Brasil
Δ = 0,2 (1,5)
copa 1978
Argentina 6 x 0 Peru
Δ = 0,7 (1,1)
Mudança de Q devida ao técnico
EXTRAPOLAÇÃO PARA
CAMPEONATOS DE
BASQUETE
Extrapolação: ε no Basquete
σε ~ 11 Kε ~ 3,4
Extrapolação - Campeonatos
Futebol x Basquete
Assimetrias e Curtoses
SIMULAÇÕES MONTE
CARLO PARA AVALIAR
SISTEMAS DE DISPUTA
R
Simulações Monte Carlo
Interpretação estatística:
Características do ε:
R
Simulações Monte Carlo
Interpretação estatística:
Simular os resultados (Saldo de gols) das partidas de um
campeonato e determinar a classificação obtida segundo os
critérios do campeonato.
As qualidades efetivas e os fatores de mando são definidos com
base nos valores típicos dos campeonatos do tipo escolhido.
MQQ BA Modelo para Δ:
σε ~ 1,55 Kε ~ 3,4Características do ε:
R
Simulações Monte Carlo
Interpretação estatística:
Simular os resultados (Saldo de gols) das partidas de um
campeonato e determinar a classificação obtida segundo os
critérios do campeonato.
As qualidades efetivas e os fatores de mando são definidos com
base nos valores típicos dos campeonatos do tipo escolhido.
MQQ BA Modelo para Δ:
σε ~ 1,55 Kε ~ 3,4Características do ε:
Exemplo Monte Carlo – BRCaracterísticas do Campeonato Brasileiro:
σQ = 0,45 M = 0,50
20 times, pontos corridos 2 turnos
BR (pts corridos 2 turnos, 20 times)
Paulistão (com semifinais, 20 times)
copa do BR (mata-mata, 64 times)
Características comuns:
σε = 1,55 Kε = 3,4
σQ = 0,45 M = 0,50
32 times
Comparação Sistemas
Comparação de sistemas c/ 16 times
Discussão
A modelagem proposta permitiu:
– Quantificar alguns conceitos intuitivos:
• Imprevisibilidade (σε ~ 1,55 é maior que o |Δ| típico)
• Vantagem de ser o mandante (M ~ 0,4 em camp. por pontuação)
• Equilíbrio dos campeonatos (σQ ~ 0,5 em camp. nacionais)
– Identificar semelhanças entre o Futebol e Basquete
• Características dos campeonatos (Imprevisibilidade, vantagem do
mandante e equilíbrio dos times)
– Caracterizar campeonatos e avaliar sistemas de disputa
• O melhor time é o campeão em apenas ~50% das vezes
• Grande dificuldade para definir os 4 melhores (e os 4 piores)
• Segunda fase eliminatória não ajuda a identificar o melhor time
Conclusões
• Propriedades gerais do Futebol e do Basquete
foram obtidos com uma modelagem simples
• Quantificação possibilita outras investigações:
– Origem da vantagem de ser o mandante
– Evolução temporal da Qualidade efetiva
– Causas das incertezas dos jogos
– Relação entre qualidade efetiva e índices técnicos
– Avaliar resultados polêmicos / dúvidas históricas
Futebol e Basquete são caixinhas de incertezas
Previsões (modelo intuitivo)
Desvio-padrão
médio: 0,82 (7)
Comparação Bolão x Copas
BOLÃO:
σε = 0,82 (7)
Kε = 3,7 (6)
COPAS (58 a 06):
σε = 1,53 (6)
Kε = 3,5 (4)
Ajuste pelo MMQ
NDAN
DC
BA
QQR
QQR
QQR
22
11
Da tabela de jogos:
AY X
Na forma matricial:
1001
1100
0011
X
NR
R
R
Y
2
1
D
C
B
A
Q
Q
Q
Q
A
Onde:
O ajuste pelo MMQ - II
AY X
YA T
A
1~
~VXV
11~
XVXV
T
A
Solução só depende de Y, X e Vε:
1001
1100
0011
X
NR
R
R
Y
2
1
D
C
B
A
Q
Q
Q
Q
A
~
~
~
~
~
NIV2