Sciam
Clique e assine Sciam
Notícias

Previsões para Copa do Mundo 2014

A probabilidade do Brasil ser campeão varia de 19% a 48% 

Shutterstock
Por Michael Moyer

Os pontos de vista do autor não são, necessariamente, os de Scientific American

A Copa do Mundo voltou, e todo mundo já escolheu um vencedor.

Apostadores preveem o resultado de competições esportivas desde a primeira corrida a pé pela savana mas, em anos recentes, um tipo único de análise estatística dominou o mercado das previsões. Todo mundo, da Goldman Sachs à Bloomberg à FiveThirtyEight de Nate Silver, tem um preditor online para a Copa do Mundo que usa números, e não palpites, para gerar probabilidades precisas para resultados de jogos.

A Goldman Sachs, por exemplo, dá ao Brasil uma chance de 48,5% de vencer o campeonato; a FiveThirtyEight põe as chances em 45%, enquanto a Bloomberg Sports concluiu que só há uma chance de 19,9% de triunfo para a Seleção.

De onde vêm esses números?

Toda análise estatística deve começar com dados, e esses sistemas de previsão futebolística usam resultados de partidas anteriores. Mas um pouco de discernimento se faz necessário aqui.

Grandes torneios internacionais de futebol não acontecem sempre, então os analistas precisam escolher como averiguar o desempenho de um time em eventos menores, como em amistosos internacionais, que não valem nada considerável.

Os modeladores também precisam decidir o período dos dados – será que a poderosa história do futebol brasileiro faz diferença quando seu jogador mais velho tem 34 anos? – e como avaliar o desempenho de jogadores individuais enquanto jogam para clubes como Machester United ou Real Madrid.

Seja qual for a origem dos dados, eles devem ser incorporados a um modelo. Frequentemente o modelador traduz a pergunta “quem vai ganhar?” na forma “quantos gols o time X marcará contra o time Y?”. E, para isso, ele depende de uma estatística variável chamada de regressão bivariada de Poisson.   

Essas são palavras incomuns. Vamos compreendê-las separadamente. Bivariada significa que existem duas variáveis interrelacionadas para as quais estamos tentando prever um único resultado – o desempenho do time X contra o time Y. Regressão significa simplesmente que estamos encaixando um conjunto de dados em um modelo. Poisson é a parte interessante.

Imagine que você esteja sentado na calçada e queira saber quantos carros passam na rua em um minuto. Primeiro você coleta alguns dados. Munido de um cronômetro e um contador, você percebe que passam 15 no primero minuto, 18 no minuto seguinte, e apenas quatro no terceiro minuto. Se fizer isso por tempo suficiente, você começará a ver um padrão, uma distribuição de Poisson, batizada em homenagem ao matemático francês que a inventou para poder estimar a frequência de convicções falsas.

O número de gols em um jogo também tende a ser distribuído de acordo com a distribuição de Poisson.

Um determinado time pode ter uma probabilidade maior de marcar um ou dois gols, às vezes nenhum, às vezes três, e muito menos frequentemente quatro ou cinco (ou mais). Modeladores mapearão os dados do desempenho anterior de um time em uma distribuição de Poisson do número de gols que esse time tem probabilidade de marcar contra o oponente.  

E os apostadores?

Enquanto escrevo isso, a casa de apostas online Betfair tem o Brasil como um favorito de 3-para-1, ou 24,4%.

Se você acreditar nos analistas da Goldman Sachs ou da FiveThirtyEight, que têm o Brasil como favorito em quase 50%, uma oportunidade acabou de se apresentar para você. É claro, supõe-se que todas as pessoas apostando no Brasil com chances de 3-para-1 também leram as análises da Goldman Sachs e da FiveThirtyEight.

Resta a pergunta: O que eles sabem que os estatísticos não sabem?

sciambr12jun2014