1 UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 Verificação, Validação e Experimentação com Modelos de Simulação Prof. Luís César da Silva Email: [email protected] - Website: www.agais.com A estruturação de modelos para a simulação de sistemas leva a organização de estruturas matemáticas que podem ser visualizadas como sendo uma função f que produz uma saída y a partir de entradas de x e parâmetros do sistema p, Figura 1, assim y = f(x, p). Os fatores y, x e p podem ser uma única variável, ou um vetor, ou ainda uma matriz. Parâmetros do sistema, p Saídas, y Entradas, x Modelo do Sistema, f Figura 1 – Visualização de modelos de simulação, y = f(x, p) (MENNER, 1995). Quando da elaboração de modelos de simulação o objetivo é utiliza-los como ferramenta como suporte ao processo de tomada de decisão. O que normalmente, requer a condução de experimentos, tais como: (i) analise de sensibilidade, (ii) comparação de cenários, (iii) otimização, e (iv) simulação de Monte Carlo. No entanto, para que os resultados dessas experimentações possam realmente ser utilizados, o modelo de simulação empregado deve passar pelos procedimentos de verificação e validação. Conforme representado na Figura 2, quando da implementação de modelos de simulação três tipos de erros podem ocorrer: (i) Erro do Tipo I – os dados gerados pelo modelo são confiáveis, mas mesmo assim são rejeitados; (ii) Erro do Tipo II – os resultados apresentados pelo modelo não são apropriados, no entanto são aceitos como validos; e (iii) Erro do Tipo III – o modelo foi mal estruturado conseqüentemente é inapropriado para o uso. Para evitar a ocorrência desses erros é recomendado conduzir os procedimentos de verificação e validação. E estes procedimentos constituem nas atividades mais árduas no desenvolvimento de modelos; e visam responder se o modelo representa com fidelidade os aspectos em estudo associados a um dado sistema. O procedimento de verificação consiste em um conjunto de ações cuja meta é certificar se o modelo conceitual foi transcrito de forma adequada quando do uso da linguagem de Prof. Luís César da Silva - www.agais.com 2 UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 simulação ou de programação. Para a execução da verificação é recomendado: (i) envolver outras pessoas além dos idealizadores do modelo, (ii) rodar o modelo e proceder à comparação dos resultados gerados com os obtidos do sistema real, (iii) rastrear o programa e verificar a execução de cada rotina computacional, (iv) observar a animação e (v) analisar estatisticamente os valores gerados para as variáveis aleatórias, quer estas associadas as variáveis de entrada, parâmetros do sistema, ou variáveis de saída, Figura 1 (BALCI, 1997; MARIA, 1997). Problema Formulado Não O problema formulado engloba todos os aspectos desejados? Ocorre o Erro do Tipo I Sim Não O modelo implementado representa confiávelmente o sistema ? A solução apresentada tem cedibilidade A solução apresentada não tem cedibilidade Sim Na validação o modelo demonstrou credibilidade? Sim Não Não Sim Os resultados da simulação são aceitos ? Na validação o modelo demonstrou credibilidade? Sim Não Não Os resultados das simulações são aceitos ? Sim Sim Término com sucesso Ocorre o Erro do Tipo I Término com Erro do Tipo I Ocorre o Erro do Tipo II Término sem sucesso Término com Erro do Tipo II Figura 2 – Ocorrência de erros em estudos de simulação (BALCI, 1997). É importante ressaltar que as tarefas associadas ao procedimento de verificação devem ser conduzidas durante as diferentes fases de implementação do modelo, e não somente ao final. Prof. Luís César da Silva - www.agais.com 3 UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 Quanto ao procedimento de validação, este objetiva certificar se a transformação entrada-saída (input-output) realizada pelo modelo tem precisão para representar a mesma ocorrência procedida no sistema real. Para condução desse procedimento deve-se: (i) rodar o modelo considerando mesmas condições impostas ao sistema e (ii) comparar os dados gerados pelo modelo e o sistema (BALCI, 1997). A validação pode ser realizada de forma subjetiva ou estatística (MENNER 1995). A validação subjetiva é realizada quando não é possível conduzir incursões apropriadas sobre o sistema em estudo. Neste caso pode ser empregado, por exemplo, o Teste de Turing. Este consiste em: (i) obter os dados gerados pelo modelo e os do sistema, (ii) formatar os dados obtidos para um mesmo padrão e (iii) submeter os dois conjuntos de dados a equipe de especialistas. Caso estes profissionais não percebam diferenças entre os dois conjuntos de dados isto indica que o modelo está validado. Outra forma de proceder validação subjetiva é submeter a análise dos dados gerados pelo modelo a uma equipe de especialistas. Estes profissionais com base em suas experiências farão julgamento quanto a confiabilidade dos dados gerados (LAW e KELTON, 1991; WINSTON, 1994). A validação estatística é realizada pelo emprego de procedimentos estatísticos como os apresentados na Tabela 1. Tabela 1 - Estatísticas para análises aplicadas em verificação e validação de modelos Categoria Procedimento estatístico Média Medidas de posição (amostral) Mediana Moda Variância Estatística Descritiva Desvio padrão Medidas de dispersão (amostral) Coeficiente de variação Erro padrão da média Amplitude total Coeficiente de correlação amostral Hipótese de Nulidade Hipótese alternativa Teste de Z Teste de Aderência Hipóteses Estatísticas Teste do Qui-Quadrado ( χ ) 2 Teste de Independência Teste de homogeneidade Teste de F Teste de t Teste de hipótese para dados emparelhados Prof. Luís César da Silva - www.agais.com 4 UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 Para a aplicação dos processos destacados na Tabela 1 faz-se necessário a observância de fundamentos estatísticos, no que concerne ao tipo de variável, aleatória ou discreta, e se estas são independentes ou não. No caso de variáveis aleatórias, por exemplo, a variável Xi que corresponde ao tempo de espera em um sistema de fila, gerada pelo modelo na simulação na roda de número, tem-se que após n rodadas será constituído o conjunto {X1, X2,...Xn}. Esses valores serão independentes se as sementes dos geradores de números aleatórios foram escolhidas aleatoriamente. Desta forma, pode ser utilizado ferramentas disponibilizadas pela estatística clássica (Tabela 1) como: a média (equação 1), a variância amostral (equação 2), e o intervalo de variação da variável a um dado nível de probabilidade (equação 3). X= 1 n ∑ Xi n i =1 (1) s2 = 1 n (X i − X )2 ∑ n − 1 i =1 (2) s2 n (3) X ± tα / 2, n −1 em que tα / 2,n −1 - representa um valor da distribuição t para n-1 graus de liberdade ao nível de probabilidade de α / 2 . Um exemplo de emprego da equação 3 é apresentado na Tabela 2. Neste caso são calculados os Limites Inferior e Superior tomando como ponto de referência a média dos dados obtidos do sistema real, assim: Limite superior Æ LS = M s + t.Dp / n Limite inferior Æ LS = M s − t.Dp / n em que Ms = média dos dados obtidos do sistema real; Dp = desvio padrão dos dados gerados pelo modelo. Prof. Luís César da Silva - www.agais.com 5 UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 Calculados os limites é testado para cada nível de probabilidade se os valores máximos e mínimos estão contidos no intervalo de confiança. Se os valores estão contidos o teste é aceito caso contrário é rejeitado. Tabela 2 – Uso do teste de t na determinação de intervalo de confiança quando praticado cinco rodadas de simulação Consumo de Energia Elétrica o Demanda de Energia Elétrica Rodada n MWh – FP MWh – HP Total kWh kW -FP kW-HP 1 160,20 19,17 179,37 233,46 204,02 2 152,53 19,39 171,92 247,63 204,02 3 159,06 19,44 178,50 233,46 204,02 4 158,59 19,21 177,80 247,63 218,19 5 166,90 20,15 187,05 247,63 196,94 Valor Máximo 152,53 19,17 171,92 233,46 196,94 Valor Mínimo 166,90 20,15 187,05 247,63 218,19 Desvio Padrão 5,108 0,387 5,389 6,986 7,720 Média Sistema Real 159,46 19,47 178,93 241,96 205,434 Intervalo de confiança segundo o teste t Confiança 99% t = 4,604 4,604 4,604 4,604 4,604 Limite Inferior 148,94 18,68 167,83 227,58 189,54 Limite Superior 169,97 20,27 190,02 256,35 221,33 Intervalo de confiança segundo o teste t Confiança 95% t = 2,776 2,776 2,776 2,776 2,776 Limite Inferior 153,12 18,99 172,24 233,29 195,85 Limite Superior 165,80 19,95 185,62 250,64 215,02 Intervalo de confiança segundo o teste t Confiança 90% t = 2,132 2,132 2,132 2,132 2,132 Limite Inferior 154,59 19,10 173,79 235,30 198,08 Limite Superior 164,33 19,84 184,07 248,62 212,80 99% Aceito Aceito Aceito Aceito Aceito 95% Rejeitado Rejeitado Rejeitado Aceito Rejeitado 90% Rejeitado Rejeitado Rejeitado Rejeitado Rejeitado Testes Obs: FP – fora do horário de pico; HP – horário de pico. BARLAS (1989) sugere as seguintes práticas na execução de perdimentos quando da validação de modelo: • Avaliar de tendências: consiste em proceder análise de regressão tendo por dados os gerados pelo modelo e os coletados do sistema real; • Conduzir teste de autocorrelação (autocorrelation function test): é extensivamente utilizado em estimativas de modelos de séries temporais; Prof. Luís César da Silva - www.agais.com 6 UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 • Conduzir do o teste da correlação cruzada (cross-correlation function test): que consiste em determinar como duas séries temporais se assemelham. O que pode aplicado as séries correspondentes aos dados gerados pelo modelo e os coletados; • Realizar o cálculo do erro percentual (equação 4); S−A E1 = A .100 (4) em que S - é a média dos dados simulados; e A - é a média dos dados observados no sistema. • Avaliar a amplitude das variâncias (equação 5) E2 = ss − sa (5) sa em que s s - variância dos dados simulados; e s A - variância dos dados observados no sistema. • Determinar o coeficiente de discrepância: este procedimento é recomendado somente para se ter um apanhado da performance do modelo. Portanto, deve ser aplicado após ter-se utilizado de outros procedimentos mais eficientes. Como forma de cálculo tem-se as proposta por Henry Theils (equação 6) e por Griner (equação 7): ∑ (S − A ) ∑S + ∑ A 2 Uo = Uo = i i 2 i ∑ (S ∑ (S i − S − Ai + A) 2 − S) + 2 i (6) 2 i em que: Ai – valor observado no sistema Si – valor simulado Prof. Luís César da Silva - www.agais.com ∑ (A i − A) 2 (7) UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 7 Experimentação com modelos Uma vez o modelo verificado, validado e especificado as condições de uso, este pode ser utilizado para conduzir experimentações tipo: (a) análise de sensibilidade, (b) comparação de cenários, (c) otimização, e (d) simulação de Monte Carlo. 1. Análise de sensibilidade: consiste em alterar o valor de um ou mais parâmetros do modelo e certificar o impacto sobre os valores das variáveis de saída. Por exemplo, no caso uma unidade industrial poderia ser verificado o impacto sobre a performance do sistema ao ser aumentada ou reduzida a produtividade em uma dada operação unitária. 2. Comparação de cenários: é aplicado quando o objetivo é fazer a comparação das diversas possíveis configurações. Nestas comparações é certificado a que melhor atende os anseios do tomador de decisão. 3. Otimização: tem por objetivo por meio do modelo buscar a configuração e/ou a forma operação do sistema que trás melhor desempenho. O que pode ser em termos técnicos e/ou econômicos. 4. Simulação de Monte Carlo: é aplicada a modelos do tipo estocástico. Para tanto, é necessário proceder a várias rodadas com o modelo, e em seqüência realizar análises estatisticamente dos resultados gerados. Deste modo, para uma dada variável será possível determinar as probabilidades de ocorrência de valores, bem como, o intervalo de confiança. Referências KRAHL, A. The Extend Simulation Environment. In: The 2000 Winter Simulation Conference. Piscataway: NJ, IEEE, Proceedings. 2000. p. 280-289. LAW, A. M., KELTON, W. D. Simulation modeling & analysis, 2nd Edition, McGraw Hill, Inc: New York. 1991. MARIA, A. Introduction to Modeling and Simulation. In: The 1997 Winter Simulation Conference. Piscataway: NJ, IEEE, Proceedings. 1997. p. 7-13. Menner, W. A. Introduction to modeling and simulation. Johns Hopkins APL Technical Digest 16(1): 6:17. 1995 Neelamkavil, F. Computer simulation and modeling. Great Britain: John Wily & Sons Ltd. 1987. RIVERA, J. Modeling with Extend. In: The 1997 Winter Simulation Conference. Association of Prof. Luís César da Silva - www.agais.com UFES – Universidade Federal do Espírito Santo Departamento de Engenharia Rural Boletim Técnico: MS: 03/06 em 19/06/2006 Computer: New York, Proceedings. 1997. p. 674-676 SILVA, L C. Stochastic simulation of the dynamic behavior of grain storage facility. 2002. Tese (Doutorado em Engenharia Agrícola.) Universidade Federal de Viçosa. Viçosa: MG. WINSTON, W. L. Operations research - applications and algorithms. In. International Thomson Publishing. Belmont, California. 1994. 1312p. Prof. Luís César da Silva - www.agais.com 8