XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão.
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
SIMULAÇÕES DE RESULTADO PARA O
CAMPEONATO BRASILEIRO DE 2008
COM BASE EM MODELOS LOGITO
Alessandro Martins Alves (UFF)
[email protected]
Thiago Graça Ramos (UFF)
[email protected]
João Carlos Correia Baptista Soares de Mello (UFF)
[email protected]
Annibal Parracho SantAnna (UFF)
[email protected]
O presente trabalho utiliza o modelo logit ordinal para calcular as
probabilidades de cada um dos resultados possíveis (vitória, empate e
derrota) para cada jogo não realizado no campeonato Brasileiro de
2008, com base nos jogos realizados.. Foi estimado um modelo a cada
rodada, considerando os dados até a rodada e prevendo as rodadas
seguintes. Com base nas probabilidades derivadas de cada modelo,
foram simulados 10.000 resultados possíveis e calculado o percentual
de vezes que cada time aparecia entre os quatro primeiros colocados
(classificados para a copa Libertadores da América do ano seguinte) e
entre os 4 últimos colocados (rebaixados para a série B). O modelo
logit utilizado considera como variáveis preditivas a vantagem de se
jogar em casa (Home Advantage), a força individual de cada time e a
performance recente do time no campeonato.
Palavras-chaves: Home Advantage, Logit ordinal, Previsões em futebol
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
1. INTRODUÇÃO
O planejamento e avaliação do desempenho dos times em um campeonato de futebol são
fundamentais para que se possa aprender com as deficiências e melhorá-las, tornando o time
mais competitivo nas temporadas seguintes.
Segundo Roche (2002) “as organizações – assim como os indivíduos – se vêem
obrigados, cada vez mais, a refletir sobre o caminho a tomar no futuro, sobre o que fazer, qual
direção tomar. Em outras palavras, vêem-se obrigadas a planejar”.
A previsão dos resultados no futebol possui um papel fundamental no planejamento e na
tomada de decisões sobre a postura e evolução do time ao longo do campeonato. Nos últimos
anos, muito se dedicou a previsão de resultados esportivos para o desenvolvimento de
estratégias de apostas, como, por exemplo, Craig e Hall (1994); Lee (1997) que estudou o
futebol inglês e Stefani e Clarke (1992), que estudaram o futebol australiano.
Scarf e Shi (2008) avaliaram a importância dos jogos na liga inglesa de 2001 a 2004; com
base nas previsões, os times poderiam determinar o esforço que deveria ser investido nos
jogos, pois, em campeonatos do tipo round robin, cada jogo é importante para o resultado
final do campeonato e, dependendo da importância desse jogo no resultado final do
campeonato para o time, talvez fosse melhor poupar determinados jogadores chave para
outros campeonatos que o time estivesse disputando. A previsão da importância de cada jogo
é fundamental também para as televisões escolherem quais jogos transmitir.
A previsão dos resultados consiste na tentativa de extrapolar o comportamento futuro a
partir dos dados históricos já observados. Para efeito de previsão, é de suma importância
identificar que variáveis ou informações serão relevantes e fazem-se necessárias nos modelos
preditivos.
Nos últimos anos, diversos trabalhos foram desenvolvidos para verificar a existência do
home advantage, ou vantagem de jogar em casa em diversos esportes. Essa vantagem
impacta no resultado final dos jogos e é defendida por diversos autores, sendo aplicada tanto
no futebol como no beisebol, voleibol, futebol americano, entre outros esportes
(COURNEYA e CARRON, 1992; POLLARD, 2002).
Em estudos anteriores, como em Pollard (1986), observou-se que há um grande
predomínio das equipes mandantes, o que pode ser comprovado através de um
aproveitamento de cerca de 60% a 67% de pontos obtidos em casa.
Acrescenta-se ainda o aspecto de familiaridade com este campo e estádio, sendo afirmado
por Courneya e Carron (1992), Pollard (2002) que há uma maior consciência do atleta da
"casa", o que lhe permite uma orientação mais eficaz nas ações decorrentes e exigidas na
partida.
Segundo Pollard (2006), a grande familiaridade de um time com o seu estádio faz com
que o mesmo leve vantagem, quando enfrenta um adversário em seus domínios, logo, esperase um desempenho melhor em casa do que fora.
Com a mudança do modelo do campeonato Brasileiro para um torneio disputado através
de pontos corridos com formato Round Robin (todos jogando contra todos), para maiores
informações sobre o desenho do campeonato brasileiro, ver Sant’Anna et al (2009)
conseqüente aproveitamento da tabela final do campeonato na classificação para outras
competições, assim como o rebaixamento dos piores times; despertou-se um interesse por
compreender melhor o home advantage na competição e as chances de cada time nos
seguintes objetivos: salvar-se do rebaixamento, estar entre os 4 primeiros colocados (copa
libertadores da América) e ser campeão.
2
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
Em campeonatos do tipo round robin, o resultado de todos os jogos é de suma
importância, pois é necessário acumular o maior número de pontos possíveis, pois o time que
consegue ser mais eficiente nesse quesito, será o campeão. Logo a equipe necessita ser tão
bom fora, quanto dentro de casa.
Nos campeonatos do tipo pontos corridos, ou round robin, a regularidade do time é
considerada fundamental na sua classificação final. No campeonato Brasileiro com o formato
de pontos corridos, cada par de times se enfrenta duas vezes, com cada partida sendo realizada
com o mando de campo de cada time. Logo, a equipe necessita ser tão bom fora, quanto
dentro de casa. Sendo assim, o resultado de todos os jogos é de suma importância, pois o time
mais eficiente ao longo de todo campeonato, será o campeão.
Enquanto isso, nos campeonatos mistos, o resultado da primeira fase só serve como
balizador para o confronto direto entre as equipes. Pois a equipe que tiver melhor desempenho
terá algumas vantagens como decidir em casa e jogar por resultados iguais. Com isso uma
vitória em casa por uma boa diferença de gols tem uma importância muito grande.
Diante desses fatos, tentou-se modelar o campeonato Brasileiro de 2008 objetivando
acompanhar o desempenho de cada time ao longo do campeonato, considerando a importância
do mando de campo (Home Advantage) e a força de cada time nos resultados dos jogos e
calcular chances de rebaixamento e classificação para a Copa Libertadores da América para
os clubes.
O modelo proposto é um modelo Logito Ordinal, também utilizado por Bayo H. et al
(2007) na modelagem com campeonato Inglês (EPL) nos anos de 2002 e 2003.
Bayo H. et al (2007) trabalha com um modelo bastante simples, porém, eficaz, na
previsão do EPL (english premier league). O modelo utilizar a vantagem de jogar em casa e
as forças indivuais de cada time como variáveis preditivas.
Pollard (2002) analisa a redução da vantagem de uma equipe em jogar em casa quando
esta se muda de uma cidade para outra, algo muito comum em esportes onde os times são
franquias particulares ou em casos em que o time perde o mando de campo, por algum
motivo.
Nevill (1996) fez um estudo na liga inglesa e escocesa de futebol para os anos de 19921993 e identificou que a torcida tem um impacto no resultado da partida. Nevill (1996) faz
uma comparação entre as divisões do campeonato, constatando que divisões com maior
público, o time da casa obtinha mais vantagem que o time visitante. O autor tem duas
explicações para isso; o peso da torcida fazia com que os adversários errassem mais os
pênaltis, assim como o árbitro tendia a achar que o time visitante cometia mais infrações que
os times da casa.
No futebol, o momento vivenciado por cada time ou atleta é muito valorizado, tanto que
existe um clichê “futebol é momento”. Tanto que times tidos como excelentes podem perder
para times considerados com um menor nível técnico. Isto foi evidenciado no campeonato de
2002, onde o São Paulo possuía a melhor campanha durante toda a competição e acabou
sendo eliminado pelo Santos, que havia se classificado nos últimos minutos da última rodada.
Outros exemplos são Santo André e Paulista de Jundiaí, que se sagraram campeões da copa
do Brasil ao derrotar Flamengo e Fluminense, que são times considerados de nível técnico
superior aos times citados anteriormente.
Alves et al. (2008) aplicou um modelo de previsão ao campeonato brasileiro com base no
home advantage e na força individual de cada time e teve como deficiência do modelo a
demora na captação de mudanças de comportamento dos times. Isso porque todos os jogos
contribuíam com a mesma importância para o modelo, ou seja, não existia uma maior
importância para os jogos mais recentes do time; toda a história do time no campeonato até a
3
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
rodada era utilizada com a mesma importância.
Com o objetivo de captar o “momento” vivenciado por cada time, será adicionada uma
variável ao modelo com a informação de desempenho recente da equipe, tanto em casa,
quanto fora de casa, de acordo com a partida a ser realizada.
No caso do Brasileirão em particular, temos os casos onde os clássicos entre os times de
uma mesma cidade são “obrigados” a ser realizado num estádio, que pode ser considerado
campo neutro, como, por exemplo, o Maracanã no Rio de Janeiro, onde jogam Flamengo,
Vasco, Botafogo e Fluminense; assim como o Morumbi em São Paulo, onde são jogados os
jogos de São Paulo, Corinthians e Palmeiras e por fim o Mineirão onde são realizados os
clássicos entre Cruzeiro e Atlético-MG.
2. OBJETIVO
O objetivo principal do presente trabalho é avaliar a capacidade preditiva do modelo
logito ordinal estimado ao final de cada rodada, as probabilidades de um time estar
classificado para a copa libertadores da América (encerrar o campeonato entre as 4 maiores
pontuações), assim como ser rebaixado (4 piores pontuações). Isso será feito com a utilização
de dois modelos Logito Ordinal e com o auxílio de simulações baseadas nos resultados desse
modelo.
3. DADOS
Para o presente trabalho foram utilizados os dados do campeonato Brasileiro do ano de
2008, onde havia 20 times e um total de 380 jogos. A pontuação a cada jogo é dada por:
vitória (3 pontos), empate (1 ponto) e derrota (0 ponto). Para mais detalhes sobre a atribuição
de pontos para vitória nesse tipo de campeonato, ver BLOYCE (2008).
Ao final da competição, o time com maior pontuação será o campeão, os quatro times
melhor colocados garantem vaga para a Copa Libertadores da América do ano seguinte e os
quatro times com menor pontuação são automaticamente rebaixados para a série B.
Como mandante de campo foram considerados times identificados desta forma pela
tabela da CBF.
4.TRANSFORMAÇÃO LOGÍSTICA
Apesar de parecer complicado de visualização, o modelo é relativamente simples. A
idéia é descrever a relação entre diversas variáveis independentes e uma variável dependente
dicotômica (0,1); esse processo é diferente do modelo de regressão linear, que possui uma
variável contínua como resposta. Esse processo é feito com base na regressão logística, que é
baseada na função sigmóide f(z), dada por:
Esta função varia entre 0 e 1 e é esse o principal motivo é usada para descrever uma
probabilidade dicotômica (ocorrência ou não ocorrência de um determinado fato).
Através dessa transformação, faz-se com que a variável resposta, antes dicotômica,
assuma valores de uma variável métrica, portanto, o procedimento que calcula os coeficientes
logísticos compara a probabilidade de um evento ocorrer com a probabilidade dele não
ocorrer. A partir dessa função logística f(z), escreve-se um modelo descrevendo z como uma
soma linear de variáveis independentes, ou seja:
Desta forma, a função logística passa a ser trabalhada como uma soma de variáveis
4
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
independentes X e seus parâmetros β. Para transformar essa função em um modelo logístico,
deve-se substituir f(z) por π(x), da seguinte maneira:
Onde E(Y/x) é a esperança de Y dado x.
Como a relação em π(x) é não linear, faz-se necessário a transformação logito, para que
exista uma relação linear entre as variáveis explicativas e a variável transformada da variável
resposta, assumindo
E resolvendo a equação para g(x), tem-se:
Essa função logito g(x) é linear nos seus parâmetros.
Após estimar os valores para os coeficientes β, basta substituí-los nas funções descritas
anteriormente para encontrar o valor estimado de π(x), que será um valor entre 0 e 1 e
denotará a classificação do indivíduo na variável resposta dicotômica
5.MODELO LOGITO ORDINAL UTILIZADO
Um modelo amplamente difundido e utilizado na previsão de resultados é o modelo
Logito Binário, como proposto por Lawal (2002). Esse modelo é descrito como:
Onde:
é a probabilidade do time “i” vencer o time “j” jogando em casa
é o Home Advantage
Esse modelo possui uma restrição em sua variável resposta, que precisa ser Binária.
Com o objetivo de utilizar melhor a informação do resultado dos jogos, optou-se por
trabalhar com um modelo Logito Ordinal proposto por Lawal (2002) e utilizado por Alves
(2008) no campeonato brasileiro, porém, com a inclusão de mais uma variável (desempenho
recente do time) onde é feito um desmembramento dos dados em dois modelos, da seguinte
forma – já adaptado para 20 times:
Onde βi é o desempenho recente do time, que é calculado como o percentual de pontos
atingidos pelo time nos últimos 4 jogos, ou seja, considerando um total de 12 pontos
disponíveis, qual o percentual de pontos que o time adquiriu. O mesmo raciocínio vale para o
time visitante, ou seja, somam-se os pontos dos 4 últimos jogos que o time foi visitante e
divide esse total por 12. A variável utilizada no modelo é a diferença entre os desempenhos
dos times, ou seja, o percentual de pontos atingidos nos 4 últimos jogos do time que detém o
5
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
mando de campo menos o percentual de pontos que o time visitante obteve nos 4 últimos
jogos; ou seja:
Esse modelo está sujeito a:
Ou seja, tanto a força do time “i” jogando contra o time “j”, quanto o desempenho recente
do time, precisam ser os mesmos, independente se a variável resposta é apenas a vitória ou
uma vitória ou empate em casa. Somente se esta condição for satisfeita é que se pode fazer
uso desse modelo.
Considerando a hipótese satisfeita, o modelo final fica:
Através desse modelo, é possível calcular as probabilidades de vitória, empate ou derrota
para um time jogando em casa, isso é feito com base na fórmula:
Foram feitas simulações com base em dois modelos no presente trabalho, uma versão
mais simples (Modelo 1), considerando como variáveis preditivas, o home advantage e a força
individual de cada time (sem considerar o desempenho recente do time); esse modelo foi
utilizado com sucesso por Bayo H. Lawal e Richard A. Sundheim (2007) na modelagem com
campeonato Inglês (EPL) nos anos de 2002 e 2003 e Alves (2008) na previsão dos resultados
do campeonato brasileiro de 2007.
O resultado das simulações do modelo acima citado será comparado com o de outro
modelo (Modelo 2), que, além de considerar as variáveis preditivas do modelo anterior, insere
o desempenho recente do time na competição (momento vivido pelo time).
6.SIMULAÇÕES
Já faz alguns anos que o recurso a técnicas de simulação a utilização de números
aleatórios é utilizado como alternativa aos procedimentos mais convencionalmente utilizados
em estatística para testar hipóteses, Waton e Blacksone (1989). Com o aumento da velocidade
de processamento observado nos computadores hoje em dia, este procedimento ganha cada
vez mais importância, uma vez que a lentidão, que era o principal problema observado no
6
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
passado, se reduz ao mínimo.
A simulação trabalhada no presente trabalho será calculada com base nas probabilidades
estimadas para os jogos não realizados do campeonato derivadas dos modelos estimados com
os jogos realizados até a rodada, isto é, a cada rodada será estimado um modelo e calculada a
probabilidade de cada resultado possível para todos os jogos não realizados do campeonato.
A cada jogo não realizado, será atribuído um número aleatório entre 0 e 1 e, com base na
probabilidade derivada do modelo e desse número aleatório, será atribuído o resultado ao
jogo. Com base nos resultados estimados e nos resultados dos jogos já realizados, serão
calculados os pontos estimados no final do campeonato e, através dessa pontuação estimada,
analisados os times que figuram entre os resultados de interesse (times rebaixados e
classificados para a Copa Libertadores da América) considerando todas as simulações
realizadas.
7. ANÁLISE DOS RESULTADOS
O Home Advantage observado no campeonato Brasileiro de 2008 até a rodada 35 (total
de 350 jogos realizados) foi de 80,57%, ou seja, em 282 de todas as partidas disputadas, o
time da casa pontuou (vitória ou empate). Ao analisar apenas a vitória do time da casa, esse
percentual passa para 55,71%, ou seja, em 195 dos 350 jogos, o time da casa sai vencedor.
Com relação aos modelos, no total, foram feitos 8 modelos (4 estimações para o modelo 1
e mais 4 estimações para o modelo 2), considerando os dados até uma determinada rodada k
(k=20, 25, 30 e 35). Em outras palavras, existem dois modelos com os jogos realizados até a
rodada 20, outros dois modelos considerando os jogos das rodadas 1 até a 25, ..., até dois
modelos considerando todos os jogos desde a rodada 1 até a rodada 35. Em todos os modelos
a restrição
e
foram satisfeitas,
tornando possível a utilização e análise dos mesmos.
A previsão dos times rebaixados e classificados para a copa libertadores da América; para
tal, foram estimados modelos utilizando os dados até a rodada k, e com base nesse modelo
simulava-se 10.000 resultados das rodadas subseqüentes e calculava-se o percentual de vezes
que time figurava entre os quatro primeiros (e quatro últimos) colocados.
A tabela 1 (abaixo) ilustra os percentuais que cada time figurava entre os 4 times com
maior pontuação encontrados após 10.000 simulações de resultados considerando as
probabilidades de resultado derivadas dos modelos de cada rodada (rodada 20, 25, 30 e 35).
As rodadas foram selecionadas de maneira eqüidistante (5 rodadas de diferença entre elas
Rodada 20
Rodada 25
Rodada 30
Rodada 35
Pontuação
Final
Real
São Paulo
75
Grêmio
72
Cruzeiro
67
Palmeiras
65
Flamengo
64
Internacional
54
Botafogo
53
Coritiba
53
Goiás
53
Mod
1
24,6%
99,9%
84,7%
81,3%
7,6%
0,0%
59,3%
32,0%
0,0%
Mod 2
43,7%
100,0%
83,6%
60,8%
7,8%
0,1%
27,7%
14,8%
0,0%
Mod
1
38,7%
98,1%
53,1%
92,1%
30,4%
1,2%
60,5%
10,8%
1,1%
Mod
2
45,0%
99,0%
48,3%
88,6%
28,2%
0,6%
57,8%
13,9%
0,1%
Mod
1
78,7%
95,8%
95,2%
88,4%
38,8%
0,9%
0,9%
0,9%
0,4%
Mod
2
79,5%
96,0%
87,8%
90,9%
37,5%
0,8%
1,5%
5,6%
0,4%
Mod 1
100,0%
99,9%
97,7%
93,2%
9,2%
0,0%
0,0%
0,0%
0,0%
Mod 2
100,0%
99,2%
68,6%
58,1%
74,1%
0,0%
0,0%
0,0%
0,0%
7
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
Sport
Vitória
52
52
0,0% 1,5%
10,6% 59,3%
7,7% 8,2% 0,0%
6,3% 10,3% 0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
0,0%
Tabela 1 - % de vezes que o time figura entre os 4 de maior pontuação após 10.000 simulações
Foram mantidos na tabela apenas os times que apresentaram algum % na classificação
para a copa Libertadores da América. Os quatro primeiros times (em negrito e itálico), foram
os times que se classificaram para a copa libertadores da América e os quatro últimos times
(negrito e itálico) foram os times rebaixados para a série B do campeonato.
Ao comparar as simulações dos modelos 1 e 2, observa-se que o modelo 2 capta mais
rapidamente as mudanças dos times no campeonato que o modelo 1, como por exemplo:
 Até a rodada 10, o São Paulo não deu muita atenção ao campeonato brasileiro, pois
tinha como objetivo principal a copa libertadores da América. Desta forma, o modelo
1 não coloca o São Paulo com grandes chances de se classificar para a libertadores da
América. No modelo 1, o São Paulo aparece com um resultado nas simulações menor
que a metade do último time que estaria classificado para a libertadores; enquanto no
modelo 2, essa diferença é bem menor.
 O Flamengo apresentou um desempenho excelente nas rodadas finais do campeonato
(exceto nas três últimas), entretanto, o modelo 1 não capta essa arrancada, deixando o
flamengo com um baixo número de simulações entre os 4 de maior pontuação. É
verdade que o Flamengo acabou não se classificando para a libertadores da América,
perdendo a vaga para palmeiras e cruzeiro (que possuíam menor probabilidade
segundo o modelo 2). O Flamengo tropeçou nos 3 últimos jogos, desempenho inferior
ao que a equipe vinha apresentando. O time perdeu para o cruzeiro na rodada 36
(disputa direta pela vaga da libertadores), empatou com o Goiás na rodada 37 e perdeu
para o Atlético de MG na rodada 38.
 Assim como no ano de 2007, o Botafogo apresentou um bom desempenho no início do
campeonato, porém, ao longo do campeonato o time veio sofrendo derrotas e
apresentando um desempenho inferior ao apresentado no início do campeonato, por
isso, as chances do time terminar o campeonato entre as quatro maiores pontuações
foram reduzindo ao longo das rodadas. A maior queda foi entre as rodadas 21 e 25,
onde a equipe conseguiu somente uma vitória, um empate e três derrotas.
 Essa queda de desempenho foi captada por ambos os modelos para as equipes do
Curitiba e do Vitória. O inverso ocorreu com o time São Paulo, que foi aumentando
suas chances de estar entre 4 times de maior pontuação em ambos os modelos.
Assim como na análise para os times que poderiam se classificar para a copa libertadores
da América, foram calculados o percentual de vezes que cada time aparecia entre os quatro de
menor pontuação (que seriam rebaixados para a série B do campeonato). A tabela 2 (abaixo)
ilustra o percentual de vezes que o time fica entre os quatro times de menor pontuação.
8
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
Rodada 20
Goiás
Atlético_MG
Atlético_PR
Fluminense
Santos
Náutico
Figueirense
Vasco
Portuguesa
Ipatinga
Pontuação
Final
Real
53
48
45
45
45
44
44
40
38
35
Mod 1
1.3%
1.2%
39.7%
82.8%
66.4%
50.7%
0.1%
27.5%
33.5%
96.5%
Mod 2
14.7%
0.3%
33.0%
97.0%
63.1%
68.0%
0.0%
8.9%
15.9%
98.8%
Rodada 25
Mod 1
0.0%
2.7%
67.1%
52.7%
9.5%
20.1%
6.3%
60.4%
92.9%
88.3%
Mod 2
0.2%
7.2%
40.0%
60.4%
16.3%
34.8%
7.5%
54.2%
87.5%
91.9%
Rodada 30
Mod 1
0.0%
0.4%
90.9%
22.9%
0.7%
31.1%
2.0%
96.6%
62.1%
93.3%
Rodada 35
Mod 2 Mod 1 Mod 2
0.0%
0.0%
0.0%
0.5%
0.0%
0.0%
76.5% 6.8% 14.3%
41.1% 0.3% 12.0%
1.0%
0.0%
0.2%
50.6% 1.2%
9.4%
2.4% 100.0% 90.2%
91.0% 91.9% 86.8%
47.8% 99.8% 87.4%
89.1% 100.0% 99.7%
Tabela 2 - % de vezes que o time figura entre os 4 de menor pontuação após 10.000 simulações
Assim como na análise anterior, o modelo 2 capta as nuances do campeonato mais
rapidamente que o modelo 1.
Vale ressaltar a melhora no desempenho do time do Fluminense ao longo do campeonato,
independente do modelo. A equipe foi se distanciando de figurar entre os 4 de menor
pontuação com o avançar das rodadas. Por outro lado, o time do Vasco foi piorando ao longo
do campeonato.
Um dos problemas observado no modelo 1, que é a demora para que sejam captadas as
mudanças de comportamento dos times; foi resolvido pelo modelo 2, onde a performance
recente do time passa a ser considerada como variável preditiva do modelo.
8. CONCLUSÕES E TRABALHOS FUTUROS
Ambos os modelos apresentaram boas previsões para o resultado do campeonato, tanto
para os times que, se não modificassem seu desempenho no campeonato, tinham as maiores
chances de serem rebaixados, como para os times que, se mantivessem o mesmo desempenho
observado até uma determinada rodada, tinham as maiores chances de serem classificados
para a Libertadores da América. Contudo, o modelo 2 fica mais sensível a uma melhora no
desempenho do time nas últimas rodadas, em função da inclusão da variável performance
recente do time.
O campeonato brasileiro é dividido em dois turnos, onde consideram-se os jogos até a
rodada 19 como sendo o primeiro turno e os demais jogos como segundo turno. Entre essas
rodadas existe uma brecha e diversos jogadores são vendidos a times do exterior, ou seja, o
time que fez parte do primeiro turno possui diferenças em relação ao time do segundo turno.
Essa informação não foi trabalhada diretamente em nenhum dos modelos, entretanto,
poderiam ter sido utilizadas variáveis dummies com o objetivo de verificar se as diferenças no
elenco de jogadores, ou mesmo da troca de técnicos pode influenciar na performance da
equipe.
9. REFERÊNCIAS BIBLIOGRÁFICAS
ALVES, A. M.; RAMOS, T. G.; Sant’Anna, Annibal Parracho; Soares de Mello, João
Carlos Correa Baptista. Uma proposta de previsão de resultados para o campeonato
brasileiro de futebol através do modelo logito. SPLOM 2008.
9
XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO
A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão
Salvador, BA, Brasil, 06 a 09 de outubro de 2009
BLOYCE, D. and P. MURPHY, Sports administration on the hoof: the three points for a
win “experiment” in English soccer. Soccer and Society, 9, 95-113, 2008.
COURNEYA, K. S.; CARRON, A. V. (1992) The home advantage in sport competitions: a
literature review. Journal of Sport and Exercise Psychology; 14:13-27.
CRAIG. L. A.; HALL, A. R. (1994). Trying out for the team: Do exhibitions matter?
Evidence from the National Football League. Journal of the American Statistical Association,
89, 1091-1099
LAWAL, H. BAYO; SUNDHEIM, A. RICHARD (2007). Modeling 2002-2003 English
Premier League Results. IMA Sport 2007, 115-124.
LAWAL, H. BAYO (2002). Modelling the 1984-1993 American League Baseball Results as
dependent categorical data. Math. Scientist, 27, 53-66.
LEE, A. J. (1997). Modeling scores in the premier league: Is Manchester United really the
best? Chance, 10, 15-19
NEVILL, ALAN M; NEWELL, SUE M.; GALE, SALLY. Factors Associated With Home
Advantage in English and Scottish Soccer Matches. Journal of Sports Science, volume 14,
181-186, April 1996.
POLLARD, R. (1986) Home advantage in soccer: a retrospective analysis. Journal of Sports
Sciences, 4, 237-248.
POLLARD, R. (2002). Evidence of a reduced home advantage when a team moves to a new
stadium. Journal of Sports Sciences, 20 (12), pp. 969-973.
POLLARD, R. (2006). Worldwide regional variations in home advantage in association
football. Journal of Sports Sciences, 24 (3), pp. 231-240.
SANT’ANNA, ANNIBAL PARRACHO; BARBOZA, EDUARDO UCHOA; SOARES DE
MELLO, JOÃO CARLOS CORREA BAPTISTA. Classification of the teams in the
Brazilian Soccer Championship by probabilistic criteria composition. Soccer and Society.
2009.
SCARFF, PHILIP A.; SHI XIN (2008). The importance of a match in a tournament.
Computers & Operations Research 35 (2008) 2406-2418
STEFANI, R. T. E CLARKE, S. R. (1992), Predictions and home advantage for Australian
Rules football, Journal of Applied Statistics, 9, 251-261
WATSON, H.J. BLACKSTONE JR, J. H. (1989). Computer simulation, 2nd ed. New York:
John Wiley & Sons
10
Download

enegep2009_TN_STO_096_652_14160