XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUÇÃO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão. Salvador, BA, Brasil, 06 a 09 de outubro de 2009 SIMULAÇÕES DE RESULTADO PARA O CAMPEONATO BRASILEIRO DE 2008 COM BASE EM MODELOS LOGITO Alessandro Martins Alves (UFF) [email protected] Thiago Graça Ramos (UFF) [email protected] João Carlos Correia Baptista Soares de Mello (UFF) [email protected] Annibal Parracho SantAnna (UFF) [email protected] O presente trabalho utiliza o modelo logit ordinal para calcular as probabilidades de cada um dos resultados possíveis (vitória, empate e derrota) para cada jogo não realizado no campeonato Brasileiro de 2008, com base nos jogos realizados.. Foi estimado um modelo a cada rodada, considerando os dados até a rodada e prevendo as rodadas seguintes. Com base nas probabilidades derivadas de cada modelo, foram simulados 10.000 resultados possíveis e calculado o percentual de vezes que cada time aparecia entre os quatro primeiros colocados (classificados para a copa Libertadores da América do ano seguinte) e entre os 4 últimos colocados (rebaixados para a série B). O modelo logit utilizado considera como variáveis preditivas a vantagem de se jogar em casa (Home Advantage), a força individual de cada time e a performance recente do time no campeonato. Palavras-chaves: Home Advantage, Logit ordinal, Previsões em futebol XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 1. INTRODUÇÃO O planejamento e avaliação do desempenho dos times em um campeonato de futebol são fundamentais para que se possa aprender com as deficiências e melhorá-las, tornando o time mais competitivo nas temporadas seguintes. Segundo Roche (2002) “as organizações – assim como os indivíduos – se vêem obrigados, cada vez mais, a refletir sobre o caminho a tomar no futuro, sobre o que fazer, qual direção tomar. Em outras palavras, vêem-se obrigadas a planejar”. A previsão dos resultados no futebol possui um papel fundamental no planejamento e na tomada de decisões sobre a postura e evolução do time ao longo do campeonato. Nos últimos anos, muito se dedicou a previsão de resultados esportivos para o desenvolvimento de estratégias de apostas, como, por exemplo, Craig e Hall (1994); Lee (1997) que estudou o futebol inglês e Stefani e Clarke (1992), que estudaram o futebol australiano. Scarf e Shi (2008) avaliaram a importância dos jogos na liga inglesa de 2001 a 2004; com base nas previsões, os times poderiam determinar o esforço que deveria ser investido nos jogos, pois, em campeonatos do tipo round robin, cada jogo é importante para o resultado final do campeonato e, dependendo da importância desse jogo no resultado final do campeonato para o time, talvez fosse melhor poupar determinados jogadores chave para outros campeonatos que o time estivesse disputando. A previsão da importância de cada jogo é fundamental também para as televisões escolherem quais jogos transmitir. A previsão dos resultados consiste na tentativa de extrapolar o comportamento futuro a partir dos dados históricos já observados. Para efeito de previsão, é de suma importância identificar que variáveis ou informações serão relevantes e fazem-se necessárias nos modelos preditivos. Nos últimos anos, diversos trabalhos foram desenvolvidos para verificar a existência do home advantage, ou vantagem de jogar em casa em diversos esportes. Essa vantagem impacta no resultado final dos jogos e é defendida por diversos autores, sendo aplicada tanto no futebol como no beisebol, voleibol, futebol americano, entre outros esportes (COURNEYA e CARRON, 1992; POLLARD, 2002). Em estudos anteriores, como em Pollard (1986), observou-se que há um grande predomínio das equipes mandantes, o que pode ser comprovado através de um aproveitamento de cerca de 60% a 67% de pontos obtidos em casa. Acrescenta-se ainda o aspecto de familiaridade com este campo e estádio, sendo afirmado por Courneya e Carron (1992), Pollard (2002) que há uma maior consciência do atleta da "casa", o que lhe permite uma orientação mais eficaz nas ações decorrentes e exigidas na partida. Segundo Pollard (2006), a grande familiaridade de um time com o seu estádio faz com que o mesmo leve vantagem, quando enfrenta um adversário em seus domínios, logo, esperase um desempenho melhor em casa do que fora. Com a mudança do modelo do campeonato Brasileiro para um torneio disputado através de pontos corridos com formato Round Robin (todos jogando contra todos), para maiores informações sobre o desenho do campeonato brasileiro, ver Sant’Anna et al (2009) conseqüente aproveitamento da tabela final do campeonato na classificação para outras competições, assim como o rebaixamento dos piores times; despertou-se um interesse por compreender melhor o home advantage na competição e as chances de cada time nos seguintes objetivos: salvar-se do rebaixamento, estar entre os 4 primeiros colocados (copa libertadores da América) e ser campeão. 2 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 Em campeonatos do tipo round robin, o resultado de todos os jogos é de suma importância, pois é necessário acumular o maior número de pontos possíveis, pois o time que consegue ser mais eficiente nesse quesito, será o campeão. Logo a equipe necessita ser tão bom fora, quanto dentro de casa. Nos campeonatos do tipo pontos corridos, ou round robin, a regularidade do time é considerada fundamental na sua classificação final. No campeonato Brasileiro com o formato de pontos corridos, cada par de times se enfrenta duas vezes, com cada partida sendo realizada com o mando de campo de cada time. Logo, a equipe necessita ser tão bom fora, quanto dentro de casa. Sendo assim, o resultado de todos os jogos é de suma importância, pois o time mais eficiente ao longo de todo campeonato, será o campeão. Enquanto isso, nos campeonatos mistos, o resultado da primeira fase só serve como balizador para o confronto direto entre as equipes. Pois a equipe que tiver melhor desempenho terá algumas vantagens como decidir em casa e jogar por resultados iguais. Com isso uma vitória em casa por uma boa diferença de gols tem uma importância muito grande. Diante desses fatos, tentou-se modelar o campeonato Brasileiro de 2008 objetivando acompanhar o desempenho de cada time ao longo do campeonato, considerando a importância do mando de campo (Home Advantage) e a força de cada time nos resultados dos jogos e calcular chances de rebaixamento e classificação para a Copa Libertadores da América para os clubes. O modelo proposto é um modelo Logito Ordinal, também utilizado por Bayo H. et al (2007) na modelagem com campeonato Inglês (EPL) nos anos de 2002 e 2003. Bayo H. et al (2007) trabalha com um modelo bastante simples, porém, eficaz, na previsão do EPL (english premier league). O modelo utilizar a vantagem de jogar em casa e as forças indivuais de cada time como variáveis preditivas. Pollard (2002) analisa a redução da vantagem de uma equipe em jogar em casa quando esta se muda de uma cidade para outra, algo muito comum em esportes onde os times são franquias particulares ou em casos em que o time perde o mando de campo, por algum motivo. Nevill (1996) fez um estudo na liga inglesa e escocesa de futebol para os anos de 19921993 e identificou que a torcida tem um impacto no resultado da partida. Nevill (1996) faz uma comparação entre as divisões do campeonato, constatando que divisões com maior público, o time da casa obtinha mais vantagem que o time visitante. O autor tem duas explicações para isso; o peso da torcida fazia com que os adversários errassem mais os pênaltis, assim como o árbitro tendia a achar que o time visitante cometia mais infrações que os times da casa. No futebol, o momento vivenciado por cada time ou atleta é muito valorizado, tanto que existe um clichê “futebol é momento”. Tanto que times tidos como excelentes podem perder para times considerados com um menor nível técnico. Isto foi evidenciado no campeonato de 2002, onde o São Paulo possuía a melhor campanha durante toda a competição e acabou sendo eliminado pelo Santos, que havia se classificado nos últimos minutos da última rodada. Outros exemplos são Santo André e Paulista de Jundiaí, que se sagraram campeões da copa do Brasil ao derrotar Flamengo e Fluminense, que são times considerados de nível técnico superior aos times citados anteriormente. Alves et al. (2008) aplicou um modelo de previsão ao campeonato brasileiro com base no home advantage e na força individual de cada time e teve como deficiência do modelo a demora na captação de mudanças de comportamento dos times. Isso porque todos os jogos contribuíam com a mesma importância para o modelo, ou seja, não existia uma maior importância para os jogos mais recentes do time; toda a história do time no campeonato até a 3 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 rodada era utilizada com a mesma importância. Com o objetivo de captar o “momento” vivenciado por cada time, será adicionada uma variável ao modelo com a informação de desempenho recente da equipe, tanto em casa, quanto fora de casa, de acordo com a partida a ser realizada. No caso do Brasileirão em particular, temos os casos onde os clássicos entre os times de uma mesma cidade são “obrigados” a ser realizado num estádio, que pode ser considerado campo neutro, como, por exemplo, o Maracanã no Rio de Janeiro, onde jogam Flamengo, Vasco, Botafogo e Fluminense; assim como o Morumbi em São Paulo, onde são jogados os jogos de São Paulo, Corinthians e Palmeiras e por fim o Mineirão onde são realizados os clássicos entre Cruzeiro e Atlético-MG. 2. OBJETIVO O objetivo principal do presente trabalho é avaliar a capacidade preditiva do modelo logito ordinal estimado ao final de cada rodada, as probabilidades de um time estar classificado para a copa libertadores da América (encerrar o campeonato entre as 4 maiores pontuações), assim como ser rebaixado (4 piores pontuações). Isso será feito com a utilização de dois modelos Logito Ordinal e com o auxílio de simulações baseadas nos resultados desse modelo. 3. DADOS Para o presente trabalho foram utilizados os dados do campeonato Brasileiro do ano de 2008, onde havia 20 times e um total de 380 jogos. A pontuação a cada jogo é dada por: vitória (3 pontos), empate (1 ponto) e derrota (0 ponto). Para mais detalhes sobre a atribuição de pontos para vitória nesse tipo de campeonato, ver BLOYCE (2008). Ao final da competição, o time com maior pontuação será o campeão, os quatro times melhor colocados garantem vaga para a Copa Libertadores da América do ano seguinte e os quatro times com menor pontuação são automaticamente rebaixados para a série B. Como mandante de campo foram considerados times identificados desta forma pela tabela da CBF. 4.TRANSFORMAÇÃO LOGÍSTICA Apesar de parecer complicado de visualização, o modelo é relativamente simples. A idéia é descrever a relação entre diversas variáveis independentes e uma variável dependente dicotômica (0,1); esse processo é diferente do modelo de regressão linear, que possui uma variável contínua como resposta. Esse processo é feito com base na regressão logística, que é baseada na função sigmóide f(z), dada por: Esta função varia entre 0 e 1 e é esse o principal motivo é usada para descrever uma probabilidade dicotômica (ocorrência ou não ocorrência de um determinado fato). Através dessa transformação, faz-se com que a variável resposta, antes dicotômica, assuma valores de uma variável métrica, portanto, o procedimento que calcula os coeficientes logísticos compara a probabilidade de um evento ocorrer com a probabilidade dele não ocorrer. A partir dessa função logística f(z), escreve-se um modelo descrevendo z como uma soma linear de variáveis independentes, ou seja: Desta forma, a função logística passa a ser trabalhada como uma soma de variáveis 4 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 independentes X e seus parâmetros β. Para transformar essa função em um modelo logístico, deve-se substituir f(z) por π(x), da seguinte maneira: Onde E(Y/x) é a esperança de Y dado x. Como a relação em π(x) é não linear, faz-se necessário a transformação logito, para que exista uma relação linear entre as variáveis explicativas e a variável transformada da variável resposta, assumindo E resolvendo a equação para g(x), tem-se: Essa função logito g(x) é linear nos seus parâmetros. Após estimar os valores para os coeficientes β, basta substituí-los nas funções descritas anteriormente para encontrar o valor estimado de π(x), que será um valor entre 0 e 1 e denotará a classificação do indivíduo na variável resposta dicotômica 5.MODELO LOGITO ORDINAL UTILIZADO Um modelo amplamente difundido e utilizado na previsão de resultados é o modelo Logito Binário, como proposto por Lawal (2002). Esse modelo é descrito como: Onde: é a probabilidade do time “i” vencer o time “j” jogando em casa é o Home Advantage Esse modelo possui uma restrição em sua variável resposta, que precisa ser Binária. Com o objetivo de utilizar melhor a informação do resultado dos jogos, optou-se por trabalhar com um modelo Logito Ordinal proposto por Lawal (2002) e utilizado por Alves (2008) no campeonato brasileiro, porém, com a inclusão de mais uma variável (desempenho recente do time) onde é feito um desmembramento dos dados em dois modelos, da seguinte forma – já adaptado para 20 times: Onde βi é o desempenho recente do time, que é calculado como o percentual de pontos atingidos pelo time nos últimos 4 jogos, ou seja, considerando um total de 12 pontos disponíveis, qual o percentual de pontos que o time adquiriu. O mesmo raciocínio vale para o time visitante, ou seja, somam-se os pontos dos 4 últimos jogos que o time foi visitante e divide esse total por 12. A variável utilizada no modelo é a diferença entre os desempenhos dos times, ou seja, o percentual de pontos atingidos nos 4 últimos jogos do time que detém o 5 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 mando de campo menos o percentual de pontos que o time visitante obteve nos 4 últimos jogos; ou seja: Esse modelo está sujeito a: Ou seja, tanto a força do time “i” jogando contra o time “j”, quanto o desempenho recente do time, precisam ser os mesmos, independente se a variável resposta é apenas a vitória ou uma vitória ou empate em casa. Somente se esta condição for satisfeita é que se pode fazer uso desse modelo. Considerando a hipótese satisfeita, o modelo final fica: Através desse modelo, é possível calcular as probabilidades de vitória, empate ou derrota para um time jogando em casa, isso é feito com base na fórmula: Foram feitas simulações com base em dois modelos no presente trabalho, uma versão mais simples (Modelo 1), considerando como variáveis preditivas, o home advantage e a força individual de cada time (sem considerar o desempenho recente do time); esse modelo foi utilizado com sucesso por Bayo H. Lawal e Richard A. Sundheim (2007) na modelagem com campeonato Inglês (EPL) nos anos de 2002 e 2003 e Alves (2008) na previsão dos resultados do campeonato brasileiro de 2007. O resultado das simulações do modelo acima citado será comparado com o de outro modelo (Modelo 2), que, além de considerar as variáveis preditivas do modelo anterior, insere o desempenho recente do time na competição (momento vivido pelo time). 6.SIMULAÇÕES Já faz alguns anos que o recurso a técnicas de simulação a utilização de números aleatórios é utilizado como alternativa aos procedimentos mais convencionalmente utilizados em estatística para testar hipóteses, Waton e Blacksone (1989). Com o aumento da velocidade de processamento observado nos computadores hoje em dia, este procedimento ganha cada vez mais importância, uma vez que a lentidão, que era o principal problema observado no 6 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 passado, se reduz ao mínimo. A simulação trabalhada no presente trabalho será calculada com base nas probabilidades estimadas para os jogos não realizados do campeonato derivadas dos modelos estimados com os jogos realizados até a rodada, isto é, a cada rodada será estimado um modelo e calculada a probabilidade de cada resultado possível para todos os jogos não realizados do campeonato. A cada jogo não realizado, será atribuído um número aleatório entre 0 e 1 e, com base na probabilidade derivada do modelo e desse número aleatório, será atribuído o resultado ao jogo. Com base nos resultados estimados e nos resultados dos jogos já realizados, serão calculados os pontos estimados no final do campeonato e, através dessa pontuação estimada, analisados os times que figuram entre os resultados de interesse (times rebaixados e classificados para a Copa Libertadores da América) considerando todas as simulações realizadas. 7. ANÁLISE DOS RESULTADOS O Home Advantage observado no campeonato Brasileiro de 2008 até a rodada 35 (total de 350 jogos realizados) foi de 80,57%, ou seja, em 282 de todas as partidas disputadas, o time da casa pontuou (vitória ou empate). Ao analisar apenas a vitória do time da casa, esse percentual passa para 55,71%, ou seja, em 195 dos 350 jogos, o time da casa sai vencedor. Com relação aos modelos, no total, foram feitos 8 modelos (4 estimações para o modelo 1 e mais 4 estimações para o modelo 2), considerando os dados até uma determinada rodada k (k=20, 25, 30 e 35). Em outras palavras, existem dois modelos com os jogos realizados até a rodada 20, outros dois modelos considerando os jogos das rodadas 1 até a 25, ..., até dois modelos considerando todos os jogos desde a rodada 1 até a rodada 35. Em todos os modelos a restrição e foram satisfeitas, tornando possível a utilização e análise dos mesmos. A previsão dos times rebaixados e classificados para a copa libertadores da América; para tal, foram estimados modelos utilizando os dados até a rodada k, e com base nesse modelo simulava-se 10.000 resultados das rodadas subseqüentes e calculava-se o percentual de vezes que time figurava entre os quatro primeiros (e quatro últimos) colocados. A tabela 1 (abaixo) ilustra os percentuais que cada time figurava entre os 4 times com maior pontuação encontrados após 10.000 simulações de resultados considerando as probabilidades de resultado derivadas dos modelos de cada rodada (rodada 20, 25, 30 e 35). As rodadas foram selecionadas de maneira eqüidistante (5 rodadas de diferença entre elas Rodada 20 Rodada 25 Rodada 30 Rodada 35 Pontuação Final Real São Paulo 75 Grêmio 72 Cruzeiro 67 Palmeiras 65 Flamengo 64 Internacional 54 Botafogo 53 Coritiba 53 Goiás 53 Mod 1 24,6% 99,9% 84,7% 81,3% 7,6% 0,0% 59,3% 32,0% 0,0% Mod 2 43,7% 100,0% 83,6% 60,8% 7,8% 0,1% 27,7% 14,8% 0,0% Mod 1 38,7% 98,1% 53,1% 92,1% 30,4% 1,2% 60,5% 10,8% 1,1% Mod 2 45,0% 99,0% 48,3% 88,6% 28,2% 0,6% 57,8% 13,9% 0,1% Mod 1 78,7% 95,8% 95,2% 88,4% 38,8% 0,9% 0,9% 0,9% 0,4% Mod 2 79,5% 96,0% 87,8% 90,9% 37,5% 0,8% 1,5% 5,6% 0,4% Mod 1 100,0% 99,9% 97,7% 93,2% 9,2% 0,0% 0,0% 0,0% 0,0% Mod 2 100,0% 99,2% 68,6% 58,1% 74,1% 0,0% 0,0% 0,0% 0,0% 7 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 Sport Vitória 52 52 0,0% 1,5% 10,6% 59,3% 7,7% 8,2% 0,0% 6,3% 10,3% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% 0,0% Tabela 1 - % de vezes que o time figura entre os 4 de maior pontuação após 10.000 simulações Foram mantidos na tabela apenas os times que apresentaram algum % na classificação para a copa Libertadores da América. Os quatro primeiros times (em negrito e itálico), foram os times que se classificaram para a copa libertadores da América e os quatro últimos times (negrito e itálico) foram os times rebaixados para a série B do campeonato. Ao comparar as simulações dos modelos 1 e 2, observa-se que o modelo 2 capta mais rapidamente as mudanças dos times no campeonato que o modelo 1, como por exemplo: Até a rodada 10, o São Paulo não deu muita atenção ao campeonato brasileiro, pois tinha como objetivo principal a copa libertadores da América. Desta forma, o modelo 1 não coloca o São Paulo com grandes chances de se classificar para a libertadores da América. No modelo 1, o São Paulo aparece com um resultado nas simulações menor que a metade do último time que estaria classificado para a libertadores; enquanto no modelo 2, essa diferença é bem menor. O Flamengo apresentou um desempenho excelente nas rodadas finais do campeonato (exceto nas três últimas), entretanto, o modelo 1 não capta essa arrancada, deixando o flamengo com um baixo número de simulações entre os 4 de maior pontuação. É verdade que o Flamengo acabou não se classificando para a libertadores da América, perdendo a vaga para palmeiras e cruzeiro (que possuíam menor probabilidade segundo o modelo 2). O Flamengo tropeçou nos 3 últimos jogos, desempenho inferior ao que a equipe vinha apresentando. O time perdeu para o cruzeiro na rodada 36 (disputa direta pela vaga da libertadores), empatou com o Goiás na rodada 37 e perdeu para o Atlético de MG na rodada 38. Assim como no ano de 2007, o Botafogo apresentou um bom desempenho no início do campeonato, porém, ao longo do campeonato o time veio sofrendo derrotas e apresentando um desempenho inferior ao apresentado no início do campeonato, por isso, as chances do time terminar o campeonato entre as quatro maiores pontuações foram reduzindo ao longo das rodadas. A maior queda foi entre as rodadas 21 e 25, onde a equipe conseguiu somente uma vitória, um empate e três derrotas. Essa queda de desempenho foi captada por ambos os modelos para as equipes do Curitiba e do Vitória. O inverso ocorreu com o time São Paulo, que foi aumentando suas chances de estar entre 4 times de maior pontuação em ambos os modelos. Assim como na análise para os times que poderiam se classificar para a copa libertadores da América, foram calculados o percentual de vezes que cada time aparecia entre os quatro de menor pontuação (que seriam rebaixados para a série B do campeonato). A tabela 2 (abaixo) ilustra o percentual de vezes que o time fica entre os quatro times de menor pontuação. 8 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 Rodada 20 Goiás Atlético_MG Atlético_PR Fluminense Santos Náutico Figueirense Vasco Portuguesa Ipatinga Pontuação Final Real 53 48 45 45 45 44 44 40 38 35 Mod 1 1.3% 1.2% 39.7% 82.8% 66.4% 50.7% 0.1% 27.5% 33.5% 96.5% Mod 2 14.7% 0.3% 33.0% 97.0% 63.1% 68.0% 0.0% 8.9% 15.9% 98.8% Rodada 25 Mod 1 0.0% 2.7% 67.1% 52.7% 9.5% 20.1% 6.3% 60.4% 92.9% 88.3% Mod 2 0.2% 7.2% 40.0% 60.4% 16.3% 34.8% 7.5% 54.2% 87.5% 91.9% Rodada 30 Mod 1 0.0% 0.4% 90.9% 22.9% 0.7% 31.1% 2.0% 96.6% 62.1% 93.3% Rodada 35 Mod 2 Mod 1 Mod 2 0.0% 0.0% 0.0% 0.5% 0.0% 0.0% 76.5% 6.8% 14.3% 41.1% 0.3% 12.0% 1.0% 0.0% 0.2% 50.6% 1.2% 9.4% 2.4% 100.0% 90.2% 91.0% 91.9% 86.8% 47.8% 99.8% 87.4% 89.1% 100.0% 99.7% Tabela 2 - % de vezes que o time figura entre os 4 de menor pontuação após 10.000 simulações Assim como na análise anterior, o modelo 2 capta as nuances do campeonato mais rapidamente que o modelo 1. Vale ressaltar a melhora no desempenho do time do Fluminense ao longo do campeonato, independente do modelo. A equipe foi se distanciando de figurar entre os 4 de menor pontuação com o avançar das rodadas. Por outro lado, o time do Vasco foi piorando ao longo do campeonato. Um dos problemas observado no modelo 1, que é a demora para que sejam captadas as mudanças de comportamento dos times; foi resolvido pelo modelo 2, onde a performance recente do time passa a ser considerada como variável preditiva do modelo. 8. CONCLUSÕES E TRABALHOS FUTUROS Ambos os modelos apresentaram boas previsões para o resultado do campeonato, tanto para os times que, se não modificassem seu desempenho no campeonato, tinham as maiores chances de serem rebaixados, como para os times que, se mantivessem o mesmo desempenho observado até uma determinada rodada, tinham as maiores chances de serem classificados para a Libertadores da América. Contudo, o modelo 2 fica mais sensível a uma melhora no desempenho do time nas últimas rodadas, em função da inclusão da variável performance recente do time. O campeonato brasileiro é dividido em dois turnos, onde consideram-se os jogos até a rodada 19 como sendo o primeiro turno e os demais jogos como segundo turno. Entre essas rodadas existe uma brecha e diversos jogadores são vendidos a times do exterior, ou seja, o time que fez parte do primeiro turno possui diferenças em relação ao time do segundo turno. Essa informação não foi trabalhada diretamente em nenhum dos modelos, entretanto, poderiam ter sido utilizadas variáveis dummies com o objetivo de verificar se as diferenças no elenco de jogadores, ou mesmo da troca de técnicos pode influenciar na performance da equipe. 9. REFERÊNCIAS BIBLIOGRÁFICAS ALVES, A. M.; RAMOS, T. G.; Sant’Anna, Annibal Parracho; Soares de Mello, João Carlos Correa Baptista. Uma proposta de previsão de resultados para o campeonato brasileiro de futebol através do modelo logito. SPLOM 2008. 9 XXIX ENCONTRO NACIONAL DE ENGENHARIA DE PRODUCAO A Engenharia de Produção e o Desenvolvimento Sustentável: Integrando Tecnologia e Gestão Salvador, BA, Brasil, 06 a 09 de outubro de 2009 BLOYCE, D. and P. MURPHY, Sports administration on the hoof: the three points for a win “experiment” in English soccer. Soccer and Society, 9, 95-113, 2008. COURNEYA, K. S.; CARRON, A. V. (1992) The home advantage in sport competitions: a literature review. Journal of Sport and Exercise Psychology; 14:13-27. CRAIG. L. A.; HALL, A. R. (1994). Trying out for the team: Do exhibitions matter? Evidence from the National Football League. Journal of the American Statistical Association, 89, 1091-1099 LAWAL, H. BAYO; SUNDHEIM, A. RICHARD (2007). Modeling 2002-2003 English Premier League Results. IMA Sport 2007, 115-124. LAWAL, H. BAYO (2002). Modelling the 1984-1993 American League Baseball Results as dependent categorical data. Math. Scientist, 27, 53-66. LEE, A. J. (1997). Modeling scores in the premier league: Is Manchester United really the best? Chance, 10, 15-19 NEVILL, ALAN M; NEWELL, SUE M.; GALE, SALLY. Factors Associated With Home Advantage in English and Scottish Soccer Matches. Journal of Sports Science, volume 14, 181-186, April 1996. POLLARD, R. (1986) Home advantage in soccer: a retrospective analysis. Journal of Sports Sciences, 4, 237-248. POLLARD, R. (2002). Evidence of a reduced home advantage when a team moves to a new stadium. Journal of Sports Sciences, 20 (12), pp. 969-973. POLLARD, R. (2006). Worldwide regional variations in home advantage in association football. Journal of Sports Sciences, 24 (3), pp. 231-240. SANT’ANNA, ANNIBAL PARRACHO; BARBOZA, EDUARDO UCHOA; SOARES DE MELLO, JOÃO CARLOS CORREA BAPTISTA. Classification of the teams in the Brazilian Soccer Championship by probabilistic criteria composition. Soccer and Society. 2009. SCARFF, PHILIP A.; SHI XIN (2008). The importance of a match in a tournament. Computers & Operations Research 35 (2008) 2406-2418 STEFANI, R. T. E CLARKE, S. R. (1992), Predictions and home advantage for Australian Rules football, Journal of Applied Statistics, 9, 251-261 WATSON, H.J. BLACKSTONE JR, J. H. (1989). Computer simulation, 2nd ed. New York: John Wiley & Sons 10