A Distribuição Skew-Normal Aplicada ao Seguro Agrícola Caroline Oliveira Santos DEX/UFLA e DEMAT/UFSJ João Domingos Scalon - DEX/UFLA Vitor Augusto Ozaki – ESALQ/USP 27/11/2012 1 Sumário Introdução Dados de produtividade Modelos de produtividade Cálculo do pagamento esperado Resultados Referências Agradecimentos 2 Introdução • Ozaki (2006) afirma que o seguro é uma das formas mais eficazes de se transferir o risco dos produtores para outros agentes econômicos. • Tarifas precisas • Prêmios de seguro • A seguradora 3 Introdução Peculiaridades • Falta de dados; • Deficiência de normatização e/ou agência normatizadora; • Difícil precificação; • Elevada exposição às catástrofes; • Alto custo de fiscalização e peritagem. • Prêmios elevados; – Desinteressante para a iniciativa privada. 4 Introdução Atualmente • Estimador – a produtividade agrícola média municipal dos últimos quatro ou cinco anos. • Distorções – Previsão das taxas de prêmio; • Seleção adversa ; • Risco moral. – Pagamentos esperados do seguro. Ozaki (2005, p. 214) destaca que os métodos comumente empregados no cálculo da taxa de prêmio não levam em conta a incerteza relacionada ao cálculo da taxa, ou seja, “a forma da distribuição de probabilidade da variável aleatória representada pela produtividade agrícola”. 5 Introdução • Atwood et al. (2002, 2003); Carriquiry et al. (2008); Just e Weninger (1999); Lawas (2005); Sherrick et al. (2004), ... – A modelagem da produtividade agrícola por distribuições de probabilidade é uma metodologia mais adequada para este propósito. • Uso de diferentes modelos. – Diferenças economicamente significativas. • Estimativa do pagamento esperado. • Modelo mais adequado. 6 Introdução Distribuições de probabilidade • Paramétricas (Sherrick et al., 2004; Lawas, 2005, ...); – Não requer uma série de dados muito longa. • Beta, Logística, Log-normal, Normal, Skew-normal, Weibull, ... • Métodos não-paramétricos (Ozaki; Goodwin e Shirota, 2008; Turvey e Zhao, 1999); – Mais flexíveis para descrever diferentes formas de densidades; – Não são aplicáveis quando há limitação de dados. 7 Introdução Objetivo • Distribuição skew-normal X distribuição normal – Skew-normal (O’Hagan e Leonard, 1976; Oliveira, 2009) – Normal (Mood, Graybill e Boes, 1974; Sherrick et al., 2004) 8 Dados de produtividade Dados • Trinta municípios do estado do Paraná – As maiores produtividades de milho, no ano de 2007; – Mínimo de 18 anos de observação; – Período de safras de 1980/1981 a 2006/2007. • Rendimento médio da produção da lavoura de milho (em grão) – Unidade: quilogramas por hectare (kg/ha) (1 ha = 10.000 m2) • Secretaria de Agricultura e Abastecimento do Paraná – SEAB – 1981 a 1989 • Instituto Brasileiro de Geografia e Estatística – IBGE – 1990 a 2007 9 Dados de produtividade Municípios • • • • • • • • • • Mariópolis Ibema Catanduvas Pato Branco Castro Piraí do Sul Ponta Grossa Tibagi Vitorino Arapoti • • • • • • • • • • Jaguariaíva Guaraniaçu Clevelândia Céu Azul São João Sengés Renascença Marilândia do Sul Ipiranga Campo do Tenente • • • • • • • • • • Nova Prata do Iguaçu Florestópolis Mangueirinha Verê Palmeira Campo Bonito Balsa Nova Laranjeiras do Sul Pranchita Guarapuava 10 Dados de produtividade Características das séries • Tendência – Avanço das tecnologias utilizadas nas lavouras, como técnicas de plantio, maquinário, insumos, etc. • Dependência temporal e variância não constante • Não é possível ajustar distribuições de probabilidade diretamente aos dados • Técnicas estatísticas – Dados de produtividade sem tendência, independentes e homocedásticos. 11 Dados de produtividade Tendência • Teste de Phillips-Perron (Phillips e Perron, 1988) (não-paramétrico) • Discrimina entre a raiz unitária não estacionária e acerca de uma tendência determinística estacionária. • Rejeitou a hipótese de estacionaridade (p > 0,05) para dezesseis das trinta séries analisadas. • • • • Para contornar o problema de tendência Regressão linear simples; Passeio aleatório; Processos auto-regressivos de ordem 1 [AR(1)]. – Teste de Phillips-Perron aceitou a hipótese de estacionaridade (p < 0,05) para todas as séries. 12 Dados de produtividade Dependência • Teste de Durbin-Watson (Durbin e Watson, 1950, 1951); – Com exceção dos municípios de Castro, Mangueirinha e Guarapuava, os demais apresentaram séries com dados independentes (p > 0,05). • Gráfico da função de autocorrelação (LAGES, 2004, p. 5). – Os autocorrelogramas mostraram que as cidades Piraí do Sul, Tibagi, Jaguariaíva, Sengés, Campo do Tenente e Verê apresentaram problemas de dependência. • Foi usado um modelo AR(1). • Nova análise de autocorrelação – As séries foram consideradas como não-autocorrelacionadas. 13 Dados de produtividade Heterocedasticidade • Teste de Breusch-Pagan (Breusch e Pagan, 1979) – Séries de produtividade homocedásticas (p > 0,05), – Com exceção dos municípios de Arapoti e São João • Detectada a presença de uma heterocedasticidade leve, • Não foram realizadas transformações. 14 Modelos de produtividade Distribuições de probabilidade • Série de produtividade – Estacionária, – Independente, – Homocedástica. • Ajuste de distribuições – Normal, – Skew-normal. 15 Modelos de produtividade Família de distribuições de probabilidade normal • Parâmetros (estimadores de máxima verossimilhança) – Média populacional (μ) – Variância (σ2) • Função densidade de probabilidade sendo • Cálculo de probabilidades – Integral definida no intervalo da variável aleatória objeto de estudo, – Métodos numéricos de integração. 16 Modelos de produtividade Família de distribuições de probabilidade skew-normal • Parâmetros (estimadores de máxima verossimilhança) – Média populacional (μ) – Desvio-padrão (σ) – Assimetria (α) • Função densidade de probabilidade em que • é a função densidade do modelo normal, • é a função de distribuição da normal. • Cálculo de probabilidades – Métodos numéricos 17 Modelos de produtividade Adequabilidade do ajuste • Teste de Kolmogorov-Smirnov (Mood; Graybill; Boes, 1974) – Investiga a significância da diferença entre a função distribuição empírica observada e a função distribuição de referência. • Modelo mais adequado – Menor soma de quadrados do erro calculada a partir de cada um dos modelos ajustados para cada uma das séries corrigidas. 18 Cálculo do pagamento esperado Pagamento esperado por unidade de área do seguro agrícola • Actual Production History (APH) (cálculo da produção histórica real) (Ozaki,2005; Sherrick et al.,2004) – União entre as funções densidade de probabilidade e a fórmula que estima o valor do pagamento esperado do seguro. • Pagamento de indenização – Quando a produtividade real, fica abaixo da produtividade garantida (nível garantido selecionado 70%, por exemplo) • Indenização – Diferença entre a produtividade garantida e a produtividade real com um preço garantido que é definido no momento do plantio pela seguradora. 19 Cálculo do pagamento esperado • A produtividade garantida que ficar abaixo do nível de produtividade esperado tem uma função de pagamento por unidade de área dada por • Pagamento esperado por unidade de área, para o APH 20 Resultados MARIÓPOLIS PATO BRANCO 1000 2000 -1000 -500 0 500 1000 1500 1000 1500 4e-04 3e-04 2e-04 2000 -3000 0 500 1000 Produtividade corrigida 1500 2000 0 TIBAGI 1000 2000 500 1000 6e-04 Densidade 4e-04 5e-04 -500 -1000 PONTA GROSSA 2e-04 2e-04 -1000 -2000 Produtividade corrigida 0e+00 0e+00 1e-04 2e-04 0e+00 500 1000 3e-04 Densidade 6e-04 4e-04 Densidade 0 Produtividade corrigida 0 Produtividade corrigida 6e-04 8e-04 6e-04 5e-04 4e-04 3e-04 2e-04 -500 -1000 PIRAÍ DO SUL 0e+00 1e-04 -1000 Densidade -2000 Produtividade corrigida CASTRO -1500 0e+00 0e+00 -1500 Produtividade corrigida 4e-04 0 1e-04 2e-04 1e-04 2e-04 0e+00 1e-04 -1000 3e-04 Densidade 4e-04 3e-04 Densidade 4e-04 5e-04 5e-04 6e-04 5e-04 4e-04 3e-04 Densidade 2e-04 1e-04 0e+00 -2000 Densidade CATANDUVAS 6e-04 IBEMA -1500 -1000 -500 0 500 Produtividade corrigida 1000 1500 -1500 -1000 -500 0 Produtividade corrigida Figura 1 Distribuições normal (___) e normal-assimétrica (_ _ _) ajustadas para produtividade de milho corrigida nos municípios do Paraná, 19812007 (continua) 21 Resultados GUARANIAÇU -1000 0 1000 2000 3000 5e-04 -2000 -1000 0 1000 2000 6e-04 2e-04 0e+00 1e-04 0e+00 -3000 4e-04 Densidade 3e-04 Densidade 3e-04 Densidade 2e-04 1e-04 0e+00 -2000 -1000 0 1000 2000 3000 4000 -1000 0 1000 Produtividade corrigida Produtividade corrigida Produtividade corrigida Produtividade corrigida CÉU AZUL SÃO JOÃO SENGÉS RENASCENÇA 2000 -1000 0 Produtividade corrigida 1000 2000 -4000 -3000 -2000 -1000 0 Produtividade corrigida 1000 2000 4e-04 3e-04 Densidade 1e-04 0e+00 0e+00 1e-04 1e-04 0e+00 0e+00 -2000 2e-04 5e-04 4e-04 3e-04 Densidade 2e-04 2e-04 Densidade 2e-04 1e-04 Densidade 3e-04 3e-04 4e-04 6e-04 -2000 2e-04 4e-04 4e-04 5e-04 0.00030 0.00020 Densidade 0.00010 0.00000 -3000 CLEVELÂNDIA 8e-04 ARAPOTI 6e-04 VITORINO -1000 -500 0 500 1000 1500 Produtividade corrigida 2000 2500 -2000 -1000 0 1000 2000 3000 4000 Produtividade corrigida Figura 1 Distribuições normal (___) e normal-assimétrica (_ _ _) ajustadas para produtividade de milho corrigida nos municípios do Paraná, 19812007 (continua) 22 Resultados MARILÂNDIA DO SUL 0 500 1000 1500 5e-04 -1500 -1000 -500 0 500 1000 1500 -500 0 500 1000 1500 2000 2500 -1000 0 1000 2000 Produtividade corrigida FLORESTÓPOLIS MANGUEIRINHA VERÊ PALMEIRA 1000 2000 3000 Densidade 3e-04 Densidade 2e-04 -1500 -1000 -500 0 500 Produtividade corrigida 1000 1500 4000 1000 1500 0e+00 0e+00 0e+00 1e-04 2e-04 4e-04 Densidade 4e-04 6e-04 0.00030 0.00020 0 Produtividade corrigida 3000 2e-04 3e-04 4e-04 5e-04 6e-04 7e-04 Produtividade corrigida 5e-04 Produtividade corrigida 0.00010 -1000 3e-04 Densidade 1e-04 -1000 Produtividade corrigida 0.00000 -2000 2e-04 4e-04 2000 0e+00 0e+00 -500 0e+00 1e-04 2e-04 2e-04 3e-04 Densidade Densidade 4e-04 4e-04 6e-04 5e-04 5e-04 4e-04 3e-04 Densidade 2e-04 1e-04 0e+00 -1000 Densidade NOVA PRATA DO IGUAÇU CAMPO DO TENENTE 6e-04 IPIRANGA -3000 -2000 -1000 0 1000 Produtividade corrigida 2000 3000 -1000 -500 0 500 Produtividade corrigida Figura 1 Distribuições normal (___) e normal-assimétrica (_ _ _) ajustadas para produtividade de milho corrigida nos municípios do Paraná, 19812007 (continua) 23 Resultados CAMPO BONITO BALSA NOVA -2000 -1500 -1000 -500 0 500 1000 1500 -1000 -500 0 500 1000 1500 4e-04 0e+00 0e+00 2e-04 2e-04 Densidade 4e-04 Densidade 6e-04 6e-04 8e-04 8e-04 1e-03 8e-04 6e-04 4e-04 0e+00 2e-04 Densidade LARANJEIRAS DO SUL -1000 Produtividade corrigida 0 1000 2000 3000 Produtividade corrigida Produtividade corrigida GUARAPUAVA 4e-04 Densidade 2e-04 4e-04 0e+00 2e-04 0e+00 Densidade 6e-04 6e-04 8e-04 PRANCHITA -2000 -1000 0 1000 Produtividade corrigida 2000 -1000 -500 0 500 1000 1500 Produtividade corrigida Figura 1 Distribuições normal (___) e normal-assimétrica (_ _ _) ajustadas para produtividade de milho corrigida nos municípios do Paraná, 19812007 (conclusão) 24 Resultados Tabela 1 Valores das somas dos quadrados dos erros para as distribuições normal e normal-assimétrica ajustadas para as séries corrigidas dos municípios do Paraná. Município Normal Normal-assimétrica Mariópolis 21864284 21864278 Ibema 7446391 7446387 Catanduvas 17111482 17111476 Pato Branco 25778779 25778775 Castro 7999119 7999114 Piraí do Sul 10798113 10798108 Ponta Grossa 11952740 -Tibagi 8728477 8728473 Vitorino 29674761 29674757 Arapoti 19266160 19266155 Jaguariaíva ks -Guaraniaçu 29613430 29613424 Clevelândia 13860732 13860729 Céu Azul 27501327 -São João 27248751 27248748 Sengés 18469095 18469090 Renascença 28301750 28301744 Marilândia do S. 12325812 12325809 Ipiranga 9847609 9847602 Campo do Tenente 12814034 12814028 Nova Prata do Iguaçu 22291792 -Florestópolis 34581821 34581814 Mangueirinha 10595520 10595515 Verê 23673437 23673434 Palmeira 9493398 9493392 Campo Bonito 10290144 10290142 Balsa Nova 7033049 7033044 Laranjeiras do S. 13740905 -Pranchita 14685681 14685677 Guarapuava 5956707 5956702 (--) Não houve convergência do estimador de máxima verossimilhança da normal-assimétrica. (ks) Teste de Kolmogorov-Smirnov não apresentou ajuste estatisticamente significante, ao nível de 10%. 25 Resultados • A densidade skew-normal apresentou as menores somas de quadrados dos erros para todas as distribuições de produtividade dos municípios em que foi possível ajustar a densidade. • Pode-se concluir que a normal-assimétrica foi a distribuição com melhor ajuste para todas as séries em que foi possível o ajuste das duas distribuições analisadas. 26 Resultados • A tabela 2 mostra os valores estimados (em R$/ha) para o pagamento esperado do seguro agrícola para cada um dos municípios selecionados do Paraná com base no APH. • Para obter os valores estimados foi usado o indicador Cepea/Esalq – Milho (31-01-2011) com um preço do milho de R$ 32,11 por saca de 60 quilogramas para ilustrar os cálculos e simular o preço do milho previsto em contrato. 27 Resultados Tabela 2 Pagamento esperado (em Reais por hectare) por unidade de área da cultura de milho para cidades do Paraná, cobertura de 70%, 1981-2007 Município Normal Normal-assimétrica Mariópolis 10,70493 12,07344 Ibema 0,1985859 0,1978225 Catanduvas 14,45295 16,61428 Pato Branco 2,809048 2,917147 Castro 0,7567108 0,7932405 Piraí do Sul 54,65214 40,44970 Ponta Grossa 1,410876 -Tibagi 5,540277 5,27399 Vitorino 0,5070298 0,4216994 Arapoti 11,41671 12,72312 Jaguariaíva ks -Guaraniaçu 17,49157 15,47649 Clevelândia 1,802261 1,167653 Céu Azul 6,783582 -São João 3,606921 3,934251 Sengés 68,44152 63,05922 Renascença 1,028588 0,7941647 Marilândia do S. 0,01902890 0,01532165 Ipiranga 15,57037 18,882 Campo do Tenente 23,80958 14,3778 Nova Prata do Iguaçu 18,31154 -Florestópolis 66,65323 77,0081 Mangueirinha 1,825512 1,947399 Verê 0,01780649 0,01551144 Palmeira 2,646129 1,982869 Campo Bonito 2,487175 1,893065 Balsa Nova 34,2689 27,84263 Laranjeiras do S. 18,24871 -Pranchita 0,01203237 0,01201180 Guarapuava 4,559823 4,075864 (--) Não houve convergência do estimador de máxima verossimilhança da normal-assimétrica. (ks) Teste de Kolmogorov-Smirnov não apresentou ajuste estatisticamente significante, ao nível de 10%. 28 Resultados • Os pagamentos esperados com o uso da distribuição skew-normal foram maiores que os estimados pela distribuição normal em 11 dos 25 municípios. • Este fato sugere alguma assimetria positiva na distribuição skew-normal. • Skew-normal X normal – – – – Possibilidade de assimetria, Pode não ocorrer convergência no algoritmo que estima os parâmetros, Skew-normal ainda não foi considerada em estudos, Bimodalidade? Multimodalidade? 29 Resultados Conclusão • Não foi possível comparar os resultados obtidos com dados reais de pagamentos esperados de seguradoras. • Os resultados mostraram que a densidade skew-normal é um modelo competitivo e alternativo à distribuição normal para explicar as distribuições de produtividade agrícola de milho. • Espera-se que os resultados possam contribuir para o progresso do seguro agrícola brasileiro e que sejam úteis para outros pesquisadores da área. 30 Referências • ATWOOD, J.; SHAIK, S.; WATTS, M. Can normality of yields be assumed for crop insurance?. Canadian Journal of Agricultural Economics, v. 50, p. 171-184, 2002. • ATWOOD, J.; SHAIK, S.; WATTS, M. Are Crop Yields Normally Distributed? A Reexamination. American Journal of Agricultural Economics, v. 85, p. 888-901, November 2003. • BREUSCH, T. S.; PAGAN, A. R. A simple test for heteroscedasticity and random coefficient variation. Econometrica, v. 47(5), 1979. • CARRIQUIRY, M. A.; BABCOCK, B. A.; HART, C. E., Using a farmer’s beta for improved estimation of expected yields. Journal of Agricultural and Resource Economics, v. 33, p. 52-68, 2008. • DURBIN, J.; WATSON, G. S. Testing for serial correlation in least squares regression: I. Biometrika, v. 37(3/4), p. 409-428, 1950. • DURBIN, J.; WATSON, G. S. Testing for serial correlation in least squares regression: II. Biometrika, v. 38(1/2), p. 159178,1951. • JUST, R. E.; WENINGER, Q. Are Crop Yields Normally Distributed?. American Journal of Agricultural Economics, v. 81, p. 278-304, 1999. • LAGES, W. F. Descrição de sinais aleatórios. Universidade Federal do Rio Grande do Sul, Programa de Pós-Graduação em Engenharia Elétrica, Disciplina ELE00071-Tópicos Especiais em Automação e Controle II, 2004. Disponível em: <www.ece.ufrgs.br/~fetter/ele00071/dec/signals.pdf>. Acesso em 24 de janeiro de 2011. • LAWAS, C. P. B.S. Crop Insurance Premium Rate Impacts of Flexible Parametric Yield Distributions: an Evaluation of the Johnson Family of Distributions. 2005. 81 p.. Tese. (Mestrado em Ciências) Texas Tech University, 2005. 31 Referências • MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the Theory of Statistics. Ed. McGraw-Hill, 577 p. 1974. • O’HAGAN, A.; LEONARD, T. Bayes estimation subject to uncertainty about parameter constraints. Biometrika, v. 63 (1), p. 201-203,1976. • OLIVEIRA, M. S. de. Comparações Múltiplas Bayesianas com Erro Normal assimétrico. 2009. 154 p.. Tese. (Doutorado em Estatística e Exp. Agrop.) Universidade Federal de Lavras, Lavras, 2009. • OZAKI, V. A. Métodos atuariais aplicados à determinação da taxa de prêmio de contratos de seguro agrícola: um estudo de caso. 2005. 324 p. Tese (Doutorado em Economia Aplicada). Escola Superior de Agricultura “Luiz de Queiroz”, Piracicaba, SP, 2005. • OZAKI, V. A.; GOODWIN, B. K.; SHIROTA, R. Parametric and non-parametric statistical modeling of crop yield: implications for pricing crop insurance contracts. Applied Economics, v. 40, p. 1151-1164, 2008. • PHILLIPS, P. C. B.; PERRON, P. Testing for a unit root in time series regression. Biometrika, v. 75 (2), p. 335-346, 1988. • SHERRICK, B. J. Crop Insurance Valuation under Alternative Yield Distributions. American Journal of Agricultural Economics, v. 86(2), p. 406-419, 2004. • ZANINI, F. C. et al. Crop insurance valuation under alternative yield distributions. Proceedings of the NCR-134 Conference on Applied Commodity Price Analysis, Forecasting, and Market Risk Management. St. Louis, MO. 2001. [http://www.farmdoc.uiuc.edu/nccc134]. 32 Agradecimentos • Prof. João Domingos Scalon – DEX/UFLA • Prof. Vitor Augusto Ozaki – ESALQ • Departamento de Matemática da Universidade Federal de São João delRei (DEMAT/UFSJ) Obrigada pela atenção! 33 A Distribuição Skew-Normal Aplicada ao Seguro Agrícola Caroline Oliveira Santos DEX/UFLA e DEMAT/UFSJ João Domingos Scalon - DEX/UFLA Vitor Augusto Ozaki – ESALQ/USP 27/11/2012 34