LEANDRO FERREIRA INTERVALOS DE CONFIANÇA PARA O PONTO CRÍTICO DE MODELOS DE REGRESSÃO QUADRÁTICA: ABORDAGENS BOOTSTRAP, BAYESIANA E FUZZY LAVRAS - MG 2012 LEANDRO FERREIRA INTERVALOS DE CONFIANÇA PARA O PONTO CRÍTICO DE MODELOS DE REGRESSÃO QUADRÁTICA: ABORDAGENS BOOTSTRAP, BAYESIANA E FUZZY Tese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor. Orientador Dr. Augusto Ramalho de Morais LAVRAS - MG 2012 Fabíola Ficha Catalográfica Preparada pela Divisão de Processos Técnicos da Biblioteca da UFLA Ferreira, Leandro. Intervalos de confiança para o ponto crítico de modelos de regressão quadrática: abordagens bootstrap, bayesiana e fuzzy / Leandro Ferreira. – Lavras : UFLA, 2012. 115 p. : il. Tese (doutorado) – Universidade Federal de Lavras, 2012. Orientador: Augusto Ramalho de Morais. Bibliografia. 1. Análise de regressão. 2. Boostrap paramétrico. 3. Inferência bayesiana. 4. Lógica fuzzy. I. Universidade Federal de Lavras. II. Título. CDD – 519.536 LEANDRO FERREIRA INTERVALOS DE CONFIANÇA PARA O PONTO CRÍTICO DE MODELOS DE REGRESSÃO QUADRÁTICA: ABORDAGENS BOOTSTRAP, BAYESIANA E FUZZY Tese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor. APROVADA em 30 de agosto de 2012. Dra. Thelma Sáfadi UFLA Dr. Sérgio Martins de Souza UFLA Dr. Tadayuki Yanagi Junior UFLA Dra. Carla Regina Guimarães Brighenti UFSJ Dr. Augusto Ramalho de Morais Orientador LAVRAS - MG 2012 À minha mãe, Nenzinha, por ter sempre acreditado em minhas escolhas com seu imenso amor. DEDICO AGRADECIMENTOS À Força maior que rege todo o universo, ao grande Mestre, à grande Mãe e aos grandes Amigos espirituais, por mais esta oportunidade de crescimento. À companheira Simone, presente em todos os momentos, nos quais, aprendemos e crescemos. Ao meu pai Silvio Ferreira, pelo aprendizado especial. À madrinha Vilma, pelo seu amor de mãe. Agradeço ao Eli e à Constança, pela confiança depositada em mim. Obrigado por cada prece. À família, queridas primas e irmãs Nêm e Damiana, Tio Paulo, Tia Neli, Tio Hélcio, Maikon e tantos outros, pelo grande carinho. Ao professor e orientador Augusto Ramalho de Morais, por ter acreditado em meu trabalho. Em cada conversa, eu me lembrava que “a ciência e a religião são duas alavancas da humanidade, uma revela as leis do mundo material e a outra as do mundo moral”. À Universidade Federal de Lavras (UFLA), por intermédio do Departamento de Ciências Exatas, pela oportunidade e apoio. À CAPES, pela concessão da bolsa de estudos. À banca examinadora, composta pelos professores, Thelma Sáfadi, Sérgio Martins de Souza, Tadayuki Yanagi Junior e Carla Regina Guimarães Brighenti, pela participação, procedentes correções e sábias sugestões. Ao amigo Augusto Maciel da Silva, pelo grande companherismo. Nunca esquecerei o que fizeste por mim. Foram tantas idas e vindas, e sempre do meu lado, auxiliando-me, superando indiferenças. É verdade que “amizade só faz sentido se traz o céu para mais perto da gente, e se inaugura aqui mesmo o seu começo”. De maneira muito especial, à amiga Ana Lúcia Souza Silva Mateus, pela grande amizade. É uma das pessoas responsáveis por uma grande conquista em minha vida. À amiga Giselle Borges, pela grande amizade ao longo de toda vida acadêmica. Ao amigo Danilo Machado Pires, pelo grande auxílio no desenvolvimento deste trabalho. Ao amigo, Crysttian Arantes Paixão, pelo grande companherismo. Aos grandes amigos, Luiz Gustavo Fernandes Julião, Liliam Helena, Bebel, Marilena, Cristiane, Carlos Eduardo, Ana Paula Vicente, Fábio Martins, Daysa, Lucélia e Álvaro, pela grande amizade. Aos colegas do curso de Estatística e Experimentação Agropecuária, Ana Paula Coelho Madeira, Paulo César, Edcarlos, Paulo Henrique, Vanessa Siqueira Peres, Felipe, Manoel, Juliano e Walmes, pela amizade e apoio. Aos amigos Lola, Júlia, Marilda, Domingos, Erlene, Márcia e Carlinho, pelo auxílio especial. Aos professores da UFLA, em particular, Renato Ribeiro de Lima, Maria do Carmo Pacheco de Toledo e Costa, Elaine das Graças Frade, Rosana Maria Mendes, Andréia da Silva Coutinho, José Antônio Araújo Andrade, Osnel Broche Cristo, Onofre Rojas Santos, Luiz Eurico Junqueira Coli e Vicente Gualberto, pelos ensinamentos e oportunidades. Agradeço de maneira muito especial ao professor Tadayuki Yanagi Junior, pela orientação, dedicação e paciência durante toda a minha vida acadêmica. Ao professor Sérgio Martins de Souza, pelo incentivo e apoio dados para prosseguir com os estudos. Às funcionárias do Departamento de Ciências Exatas, Josi, Edila, Selminha e Maria, pela atenção e carinho. Muito obrigado a todos que contribuíram por mais esta importante conquista! RESUMO Em um modelo de regressão quadrática em que, por exemplo, a produção de determinada cultura é avaliada em função de diferentes doses de nutrientes, pode haver interesse em obter um intervalo de confiança para o ponto crítico que represente os valores de doses que proporcionam aproximadamente a produção máxima da cultura. O presente trabalho tem, como objetivo, propor a construção de intervalos de confiança para o ponto crítico, utilizando a metodologia bootstrap paramétrico, inferência bayesiana e lógica fuzzy, considerando dados de produção de matéria seca do sistema radicular de braquiária em função de diferentes doses de adubação fosfatada. Para a análise bootstrap paramétrico, foram consideradas diferentes variâncias teóricas para o erro e intervalos de confiança foram construídos de acordo com diferentes expressões de variâncias para o ponto crítico, além do intervalo de confiança bootstrap-t. Na análise bayesiana, intervalos de confiança bayesiano (intervalos de credibilidade de máxima densidade a posteriori - HPD) foram encontrados para o ponto crítico, sendo que, para isso, foram definidas prioris para cada parâmetro do modelo de regressão quadrática, inclusive para o ponto crítico, e por meio do amostrador de Gibbs, foram realizadas inferências. Na análise fuzzy, por intermédio do princípio de extensão de Zadeh, um modelo fuzzy de regressão quadrática foi encontrado, considerando incertezas presentes nas estimativas dos parâmetros obtidas pelo método dos mínimos quadrados. Dessa maneira, foram obtidos um ponto crítico fuzzy e intervalos de confiança fuzzy por intermédio de operações intervalares e α-níveis. Uma segunda análise fuzzy foi realizada considerando a metodologia de Buckley, na qual um estimador fuzzy para o ponto crítico foi construído com base em um intervalo de confiança convencional. Pela análise boostrap paramétrico, os intervalos de confiança que consideraram a expressão da variância com covariância entre os parâmetros do modelo de regressão apresentaram maior precisão, sendo que a distribuição de frequência do ponto crítico tende a uma distribuição assimétrica positiva e formato do tipo leptocúrtico com o aumento da variância teórica. De acordo com as prioris assumidas, os intervalos de confiança bayesiano encontrados para o ponto crítico apresentaram alta precisão. Considerando as incertezas tratadas pela análise fuzzy, o aumento dos níveis de confiança, baseados em α-níveis, resultaram em maior precisão dos intervalos de confiança fuzzy. A metodologia de Buckley apresentou mais informações do que uma estimativa intervalar convencional. Palavras-chave: Análise de regressão. Bootstrap paramétrico. Inferência bayesiana. Lógica fuzzy. ABSTRACT Using a quadratic regression model where, for example, the production of a certain culture is assessed by different doses of nutrients, might be interesting to obtain a confidence interval for the critical point that represents the value of doses that provide approximately the maximum production culture. This paper has as a main goal, proposes a construction of confidence intervals for the critical point using parametric bootstrap methodology, bayesian inference and fuzzy logic considering data from dry matter production of signal grass at different doses of phosphorus. For the parametric bootstrap analysis were considered different theoretical variances for the error and confidence intervals were constructed according to different expressions of variances of the critical point, beyond the bootstrap-t confidence interval.In bayesian analysis, bayesian confidence intervals (Highest Posterior Density - HPD) were found for the critical point. Thus, priors were defined for each parameter, including the critical point, and through the Gibbs sampler were made inferences. In fuzzy analysis, by the Zadeh’s extension principle, a fuzzy quadratic regression model was found considering uncertainties on estimates of the parameters obtained by the least squares method. Thus, a fuzzy critical point and fuzzy confidence intervals were obtained using interval operations and α-cuts. A second fuzzy analysis was performed considering the Buckley’s methodology, in which a fuzzy estimator to the critical point were constructed based on a classical confidence interval. For parametric bootstrap analysis, confidence intervals considered that the expression of the variance, which take into consideration the covariance between the parameters of the regression model showed higher precision, and the frequency distribution of the critical point tends to a positive asymmetric distribution and leptokurtic shape with increasing variance of theoretical. According to the priors assumed, the bayesian confidence intervals found for the critical point showed high precision. Considering the uncertainties treated by the fuzzy analysis, the increased levels of confidence, based on α-cuts, resulted in higher precision of the fuzzy confidence intervals. The Buckley’s methodology provided more information than a interval estimate conventional. Keywords: Regression analysis. Parametric bootstrap. Bayesian inference. Fuzzy logic. LISTA DE FIGURAS Figura1 Representação de uma função de pertinência triangular . . . . . . Figura2 Princípio de extensão . . . . . . . . . . . . . . . . . . . . . . . . Figura3 Dados de produção de matéria seca em função de diferentes doses de adubação fosfatada . . . . . . . . . . . . . . . . . . . . . . . Figura4 Fluxograma para obter os intervalos de confiança, considerando a metodologia bootstrap . . . . . . . . . . . . . . . . . . . . . . . Figura5 Fluxograma referente à análise fuzzy 1 . . . . . . . . . . . . . . . Figura6 Fluxograma referente à análise fuzzy 2 . . . . . . . . . . . . . . . Figura7 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 18,25 . . . . . . . . . . . . . . . . Figura8 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 22,81 . . . . . . . . . . . . . . . . Figura9 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 30,41 . . . . . . . . . . . . . . . . Figura10 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 45,61 . . . . . . . . . . . . . . . . Figura11 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 91,23 . . . . . . . . . . . . . . . . Figura12 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 182,45 . . . . . . . . . . . . . . . . Figura13 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 273,68 . . . . . . . . . . . . . . . . Figura14 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro β0 . . . . . . . . . . . . . . . . . . . . . . . . Figura15 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro β2 . . . . . . . . . . . . . . . . . . . . . . . . Figura16 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro η . . . . . . . . . . . . . . . . . . . . . . . . . Figura17 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro σ 2 . . . . . . . . . . . . . . . . . . . . . . . . Figura18 Solução do modelo fuzzy de regressão quadrática, considerando os dados de produção de matéria seca (y) em função de diferentes doses de adubação fosfata (x) . . . . . . . . . . . . . . . . . . . 42 43 49 55 60 63 70 70 71 71 72 72 73 81 81 82 82 85 Figura19 Solução defuzzificada do modelo fuzzy de regressão quadrática e solução clássica obtida pelo método dos mínimos quadrados, considerando os dados de produção de matéria seca (y) em função de diferentes doses de adubação fosfata (x) . . . . . . . . . . . . Figura20 Representação gráfica da função de pertinência do ponto crítico fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Figura21 Representação gráfica da função de pertinência da estimativa fuzzy do ponto crítico, utilizando a metodologia de Buckley . . . . . . 85 87 90 LISTA DE TABELAS Tabela1 Análise de variância para um modelo de regressão quadrática. . . Tabela2 Valores estimados da produção de matéria seca na primeira amostra bootstrap para variância teórica igual a 18,25 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC11 e IC21 ) para o ponto crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela3 Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 18,25 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC12 e IC22 ) para o ponto crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela4 Valores estimados da produção de matéria seca na primeira amostra bootstrap para variância teórica igual a 91,23 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC11 e IC21 ) para o ponto crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela5 Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 91,23 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC12 e IC22 ) para o ponto crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela6 Valores médios do ponto crítico e dos diferentes intervalos de confiança, de acordo com as variâncias teóricas consideradas, utilizando o método de reamostragem. . . . . . . . . . . . . . . . . . Tabela7 Resultados para o teste de assimetria assintótico (g1 ), excesso de curtose assintótico (g2 ) e estatística W de Shapiro-Wilk referentes aos valores simulados do ponto crítico. . . . . . . . . . . . . . . Tabela8 Estimativas dos critérios de Raftery e Lewis e, Geweke, utilizados na avaliação da convergência das cadeias amostradas. . . . . . . . 24 65 65 66 66 68 69 79 Tabela9 Valores médios obtidos pela distribuição a posteriori dos parâmetros e seus respectivos limites inferior e superior dos intervalos de confiança bayesianos (HPD). . . . . . . . . . . . . . . . . . . . . Tabela10 Estimativas dos parâmetros do modelo de regressão quadrática e respectivos erros padrão das estimativas. . . . . . . . . . . . . . . Tabela11 Limites inferior (η1α ) e superior (η2α ) do intervalo de confiança fuzzy para o ponto crítico fuzzy, considerando α-níveis entre 0,20 e 1,00. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabela12 Estimativa fuzzy Ê do ponto crítico considerando α-níveis enα tre 0,65 e 1,00. . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 83 88 89 SUMÁRIO 1 2 2.1 2.1.1 2.1.2 2.1.3 2.2 2.2.1 2.3 2.3.1 2.3.2 2.3.3 2.3.4 2.3.5 2.4 2.4.1 2.4.2 2.4.3 2.4.4 2.4.5 2.4.6 2.4.7 3 3.1 3.2 3.3 3.4 3.4.1 3.4.2 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . REFERENCIAL TEÓRICO . . . . . . . . . . . . . . . . . . . . . Modelos de regressão . . . . . . . . . . . . . . . . . . . . . . . . . Modelo de regressão quadrática . . . . . . . . . . . . . . . . . . . Ponto crítico de modelo de regressão quadrática . . . . . . . . . . Intervalos de confiança para o ponto crítico . . . . . . . . . . . . . Metodologia bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . Metodologia bootstrap aplicada em regressão . . . . . . . . . . . . Inferência bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . Distribuições a priori . . . . . . . . . . . . . . . . . . . . . . . . . Distribuições a posteriori . . . . . . . . . . . . . . . . . . . . . . . Intervalos de credibilidade . . . . . . . . . . . . . . . . . . . . . . Métodos de simulação . . . . . . . . . . . . . . . . . . . . . . . . . Lógica fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conjunto fuzzy e função de pertinência . . . . . . . . . . . . . . . Níveis de um conjunto fuzzy . . . . . . . . . . . . . . . . . . . . . Números fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Princípio de extensão de Zadeh . . . . . . . . . . . . . . . . . . . . Métodos de defuzzificação . . . . . . . . . . . . . . . . . . . . . . Teoria da possibilidade . . . . . . . . . . . . . . . . . . . . . . . . Estatística e lógica fuzzy . . . . . . . . . . . . . . . . . . . . . . . . MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . Dados de produção de matéria seca . . . . . . . . . . . . . . . . . Análise bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . Análise bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . Análise fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de Buckley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . . 4.1 Análise bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Análise bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3 Análise fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy 15 17 17 19 25 25 30 32 33 33 34 35 35 36 38 38 40 41 43 44 45 46 48 48 49 56 57 57 61 64 64 73 83 83 4.3.2 Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de Buckley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 5 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 APÊNDICE A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 APÊNDICE B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 APÊNDICE C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 APÊNDICE D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 15 1 INTRODUÇÃO Em diversas pesquisas, pode haver interesse em avaliar a produção de determinada cultura em função de diferentes doses de nutrientes. Considerando que o comportamento dos dados pode ser descrito por meio de um modelo de regressão quadrática, um dos resultados a ser analisado é a estimativa do ponto de máximo ou de mínimo do modelo, denominado de ponto crítico, o qual se refere, respectivamente, à estimativa da dose de nutriente que proporciona uma produção máxima ou mínima da cultura. Um modelo de regressão quadrática, com uma variável independente, pode ser dado por ŷi = β̂0 + β̂1 xi + β̂2 x2i , no qual um estimador para o ponto crítico pode ser encontrado, derivando-se ŷi em relação a x e fazendo sua derivada igual a zero. Dependendo da forma do modelo, o ponto crítico pode ser caracterizado como um ponto de máximo, quando β̂2 < 0, ou ponto de mínimo, quando β̂2 > 0. Admitindo que a curva do modelo apresente uma região suave em torno de um ponto de máximo, o pesquisador, por questão de economia, pode sugerir, por exemplo, a retirada de 10% de dose de nutriente a ser aplicada, obtendo aproximadamente a produção máxima da cultura. Atentando para tratamentos estatístico e fuzzy de tal situação, intervalos de confiança podem ser construídos para o ponto crítico. Dessa maneira, com certo nível de confiança, o pesquisador pode sugerir uma dose de nutriente que resulte num valor entre os limites do intervalo de confiança. Diante disso, diversas metodologias podem ser utilizadas para auxiliar na construção dos intervalos de confiança para o ponto crítico, como: metodologia bootstrap, que consiste na obtenção de um novo conjunto de dados por reamostragem do conjunto de dados original; metodologia bayesiana, na qual intervalos de confiança baseados na máxima densidade a posteriori podem ser determinados para parâmetros de um modelo e; metodologia fuzzy, em que operações intervalares fuzzy podem ser realizadas para avaliar incertezas presentes em modelos estatísticos. 16 Dessa maneira, os objetivos deste trabalho são: 1. obter intervalos de confiança para o ponto crítico, considerando diferentes situações experimentais através da metodologia bootstrap paramétrico, de acordo com diferentes variâncias teóricas para o erro e diferentes fórmulas de variância do ponto crítico; 2. determinar intervalos de confiança bayesiano para o ponto crítico, considerando intervalos de máxima densidade a posteriori; 3. obter intervalos de confiança fuzzy, considerando um ponto crítico fuzzy baseado na divisão intervalar de números fuzzy; 4. realizar uma análise fuzzy com base na metodologia de Buckley para determinar um estimador fuzzy para o ponto crítico baseado em um intervalo de confiança convencional. 17 2 REFERENCIAL TEÓRICO 2.1 Modelos de regressão Com o objetivo de analisar a produção de uma cultura, um pesquisador pode fixar doses crescentes de um determinado nutriente e avaliar a influência destas na produção da cultura. Tal análise pode ser realizada por meio de uma relação funcional entre as doses de nutriente, denominada de variável independente ou variável regressora, x, e a produção da cultura, denominada de variável independente ou variável resposta, y, por meio de um modelo de regressão. Draper e Smith (1998) classificaram os modelos de regressão, em relação aos seus parâmetros, em lineares, linearizáveis e não-lineares: a) modelos lineares: aqueles que são lineares em relação aos parâmetros, ou seja, as derivadas parciais da variável resposta y = f (x,θ), em relação a cada parâmetro, não dependem dos próprios parâmetros: ∂ fi (x,θ) = g (x) ∂θj (1) para i = 1,2,...,n e j = 1,2,...,p, sendo que n é o número total de observações e p é o número de parâmetros do modelo; b) modelos linearizáveis: aqueles que podem ser transformados em lineares, por meio de alguma transformação, por exemplo: y = λx ε (2) na qual o erro ε é denominado multiplicativo; c) modelos não lineares: são aqueles que não se enquadram nos casos a) e b), por exemplo: y = λx + ε (3) 18 em que o erro ε é denominado aditivo e não existe transformação capaz de tornar o modelo linear. O modelo é dito não-linear, pois a derivada em relação ao parâmetro é dependente do parâmetro. De acordo com Hoffmann e Vieira (1998), um modelo linear, denominado de modelo de regressão linear múltipla. pode ser expresso como: yi = β0 + β1 xi1 + β2 xi2 + ... + βp−1 xi,p−1 + εi (4) em que: yi representa os valores observados da variável dependente; β0 , β1 , ..., βp−1 são os parâmetros a serem estimados; xi1 , xi2 , ..., xi,p−1 representa o i-ésimo valor fixo de uma variável independente; εi são os erros experimentais relacionados com os valores observados yi que, em geral, são considerados independentes e normalmente distribuídos com média zero e variância constante. Existem vários métodos que podem ser utilizados para a estimação dos parâmetros, sendo que os mais comumente empregados são o método dos mínimos quadrados e o da máxima verossimilhança. Draper e Smith (1998) distinguiram os modelos de regressão em função das suposições do erro da seguinte maneira: a) modelos ordinários: aqueles cuja estrutura dos erros não viola nenhuma das pressuposições. Pode ser escrito de forma mais eficiente como ∼ε ∼ N µ,Iσ 2 , em que ∼ε é um vetor de erros aleatórios independentes e normalmente distribuídos; b) modelos ponderados: são aqueles cuja estrutura dos erros viola a pressuposição de homogeneidade de variâncias. Nesse caso, diz-se que os erros são heterocedásticos. Escreve-se ∼ε ∼ N µ,Dσ 2 , em que D é uma matriz 19 diagonal, positiva definida, que pondera a variância σ 2 ; c) modelos generalizados: são aqueles cuja estrutura dos erros viola a pressuposição de independência dos erros e possivelmente a de homogeneidade de variâncias. Diz-se que os erros são correlacionados (e possivelmente hete rocedásticos). Escreve-se ∼ε ∼ N µ,W σ 2 , sendo W uma matriz simétrica, positiva definida, que representa as variâncas e covariâncias dos erros. 2.1.1 Modelo de regressão quadrática Segundo Kutner, Nachtsheim e Neter (2005), o modelo de regressão quadrática, com uma variável independente, é: yi = β0 + β1 xi + β2 x2i + εi (5) em que: yi representa o i-ésimo valor observado de uma variável dependente; β0 , β1 , β2 são os parâmetros a serem estimados; xi representa o i-ésimo valor fixo de uma variável independente; εi representa o i-ésimo erro aleatório, associado à observação yi que, em geral, são considerados independentes e normalmente distribuídos com média zero e variância constante σ 2 . Em termos matriciais, pode-se escrevê-lo como: Y∼ = Xβ + ∼ε ∼ (6) 20 y1 1 x1 x21 y2 .. . .. . = 1 x2 .. .. . . .. .. . . x22 .. . .. . yn 1 xn ε1 ε2 β0 . . β1 + .. .. β2 . εn x2n (7) em que: Y∼ é um vetor de realizações da variável dependente, de dimensões nx1; X é a matriz dos coeficientes associados aos parâmetros ou matriz do planejamento, de dimensões nx3; β é o vetor de parâmetros, de dimensões 3x1; ∼ ε é o vetor de variáveis aleatórias não observáveis (erros experimentais), ∼ com dimensões nx1, os quais são assumidos serem independentes e normalmente distribuídos. Para estimar os parâmetros do modelo, pode-se utilizar o método dos mínimos quadrados, que consiste em minimizar a soma de quadrados dos erros (SQE), obtendo o sistema de equações normais (SEN). Para tanto, tem-se o vetor de erros e o SQE, conforme apresentado a seguir: ε = Y∼ − Xβ ∼ (8) ∼ 0 SQE = ∼ε ∼ε = Y∼ − Xβ Y∼ − Xβ ∼ ∼ 0 0 = Y∼ 0 − β X Y∼ − Xβ ∼ ∼ 0 0 0 0 0 0 (9) 0 = Y∼ Y∼ − Y∼ Xβ −β X Y∼ + β X Xβ ∼ ∼ ∼ ∼ 0 0 0 0 = Y∼ 0 Y∼ − 2β X Y∼ + β X Xβ ∼ ∼ ∼ 21 Derivando SQE em relação a β , obtém-se: ∼ ∂Y∼ 0 Y∼ ∂β ∼ −2 0 0 ∂β X Y∼ ∼ ∂β ∼ + 0 0 ∂β X Xβ ∼ ∼ ∂β ∼ = −2X 0 Y∼ + 2X 0 Xβ ∼ (10) b como o vetor que anula a derivada, obtém-se o SEN, de na qual, denominando β ∼ acordo com Searle (1971): b = X 0Y X 0X β ∼ ∼ (11) Para o caso do modelo de regressão quadrática em questão, as matrizes que constituem o SEN são as seguintes: n n P 0 XX= i=1 xi n P 2 xi i=1 n P i=1 n P i=1 n P i=1 n P xi x2i x3i yi ni=1 P X 0 Y∼ = i=1 xi yi n P 2 xi yi n P x2i 3 xi i=1 n P 4 xi i=1 n P (12) i=1 (13) i=1 b = X 0 Y tem a seguinte Assim, o sistema de equações normais X 0 X β ∼ ∼ 22 forma: n n P i=1 xi n P 2 xi i=1 n P i=1 n P i=1 n P i=1 xi x2i x3i n P x2i n P yi β0 ni=1 Pxy x3i . β1 = i=1 i i i=1 n n P β2 P 2 x4i xi yi i=1 n P i=1 (14) i=1 Segundo Kutner, Nachtsheim e Neter (2005), o sistema de equações normais pode também ser escrito da seguinte maneira: n P i=1 n P i=1 n P i=1 n P yi = β̂0 + β̂1 xi yi = β̂0 x2i yi = β̂0 n P i=1 i=1 n P i=1 n P xi + β̂2 n P xi + β̂1 i=1 i=1 n P x2i + β̂1 x2i x2i + β̂2 i=1 n P i=1 n P x3i + β̂2 x3i i=1 (15) x4i Dado que a matriz X possui posto coluna completo, então X 0 X é uma matriz positiva definida e, portanto, invertível. Assim, como em Kutner, Nachtsheim e Neter (2005), a solução única é dada por: b = X 0Y X 0X β ∼ ∼ X 0X −1 b = X 0X X 0X β ∼ b = X 0X β ∼ −1 X 0 Y∼ −1 X 0 Y∼ (16) 23 b são dadas por: Dessa maneira, a esperança e variância de β ∼ h i b = E X 0 X −1 X 0 Y E β ∼ ∼ h i −1 0 = X 0X X E Y∼ −1 0 = X 0X X Xβ ∼ (17) =β ∼ h i b = V X 0 X −1 X 0 Y V β ∼ ∼ h ih −1 0 −1 0 i0 = X 0X X V Y∼ X 0X X −1 0 h 0 −1 0 i0 = σ2 X 0X X XX X −1 0 −1 = σ2 X 0X X X X 0X −1 = σ2 X 0X (18) b , βk e βj , para k,j = 0,1,2, k 6= j, A covariância entre dois elementos de β ∼ é dada por σ 2 (X 0 X)−1 = σ 2 Tk+1,j+1 , sendo Tk+1,j+1 o elemento da (k + 1)ésima linha e (j + 1)-ésima coluna de (X 0 X)−1 . Encontrada a solução do SEN, pode-se determinar as somas de quadrados do modelo de regressão quadrática, obtendo a análise de variância. De acordo com Charnet et al. (2008), pode-se definir: n X 2 (yi − ȳ) = n X i=1 i=1 2 (yi − ŷi ) + n X (ŷi − ȳ)2 (19) i=1 em que: n P i=1 (yi − ȳ)2 = n P i=1 yi2 − n P 2 yi i=1 n = Y∼ 0 Y∼ − Y∼ 0 JY∼ = Y∼ 0 Y∼ − C é a soma de qua- drados total corrigida pela média, denominada por SQT , representando a variação 24 total de Y∼ em torno de sua média; n P i=1 0 b X 0 Y é a soma de quadrados do erro, denominada por (yi − ŷi )2 = Y∼ 0 Y∼ − β ∼ ∼ SQE; n P i=1 b 0 X 0 Y − C é a soma de quadrados de regressão, denominada por (ŷi − ȳ)2 = β ∼ ∼ SQReg, representando a variação das esperanças específicas de Y∼ , dado X, em torno da média. Dessa maneira, tem-se que: SQT = SQE + SQ Re g (20) Na Tabela 1, tem-se o esquema de análise de variância para o modelo de regressão quadrática, na qual o número de graus de liberdade (G.L.), expressões para o cálculo das somas de quadrados (S.Q.), quadrados médios (Q.M.) e teste F são apresentados, sendo que: σ̂ 2 = SQE = QM E n−3 (21) em que QME é o quadrado médio dos erros. Tabela 1 Análise de variância para um modelo de regressão quadrática. F.V. G.L. Regressão 2 S.Q. 0 0 b β X Y∼ − C ∼ Erro n-3 b X 0Y Y∼ 0 Y∼ − β ∼ ∼ Total n-1 Y∼ 0 Y∼ − C 0 Q.M F SQ Re g 2 QM Re g QM E SQE n−3 25 2.1.2 Ponto crítico de modelo de regressão quadrática Seja o modelo de regressão quadrática, com uma variável independente: ŷi = β̂0 + β̂1 xi + β̂2 x2i (22) A obtenção de um ponto crítico de uma dada função é feita conforme Guidorizzi (2001), derivando-se o modelo (22) em relação a x e igualando a zero: dŷi = dx d β̂0 + β̂1 xi + β̂2 x2i dx = β̂1 + 2β̂2 xi = 0 (23) Dessa maneira, o estimador do ponto crítico é dado por: x̂i = η̂ = − β̂1 2β̂2 (24) De acordo com a derivada segunda do modelo (22), dada por: d2 ŷi = 2β̂2 dx2 o estimador do ponto crítico será a abscissa de um ponto de máximo se β̂2 for negativo e será de mínimo se β̂2 for positivo. 2.1.3 Intervalos de confiança para o ponto crítico Considerando que a estimativa pontual do ponto crítico é dada por η̂, toda a inferência estatística pode ser realizada com base nessa estimativa. O problema da estimação pontual é que ela não avalia a precisão da estimativa obtida. Dessa maneira, pode-se associar medidas de precisão, como o erro padrão e intervalos de confiança, traduzindo incertezas presente na estimação pontual. De acordo com Casella e Berger (2010), considerando uma amostra x = 26 (x1 ,x2 ,...,xn ), intervalos de confiança podem ser construídos da forma: [L (x) , U (x)] (25) em que L (x) e U (x) são, respectivamente, os limites inferior e superior do intervalo de confiança. Dessa maneira, para um parâmetro θ, tem-se: P [L (x) 6 θ 6 U (x)] = 1 − α (26) para 0 6 α 6 1, ou seja, diante de várias realizações do experimento, 100 (1 − α) % dos intervalos de confiança obtidos conterão o verdadeiro valor do parâmetro θ. Com isso, tem-se que o intervalo de confiança é uma quantidade aleatória e o parâmetro uma quantidade fixa. Intervalos de confiança para o ponto crítico, cujo estimador envolve um quociente de variáveis aleatórias, podem ser construídos considerando diferentes metodologias. Fieller (1954) propôs um método para construção de intervalos de confiança para um quociente de variáveis aleatórias, na qual, de acordo com o quociente x1 x2 em que x1 ∼ N m1 ,σ12 , x2 ∼ N m2 ,σ22 e µ = z= (27) m1 m2 , a variável u = x1 − µx2 terá distribuição normal com média zero e variância V (u) = σ12 + µ2 σ22 . Sendo s21 e s22 estimadores não viesados de σ12 e σ22 , respectivamente, o quociente x1 − µx2 u p =p 2 V (û) s1 + µ2 s22 (28) tem distribuição t de Student. Dessa maneira, a um certo nível de probabilidade 27 α, tem-se: " # x1 − µx2 P −t 6 p 2 6t =1−α s1 + µ2 s22 (29) x − µx2 p1 6t s21 + µ2 s22 (30) na qual a inequação: fornece os extremos do intervalo de confiança. D’Aulísio, Pimentel-Gomes e Nogueira (1976) estudaram a distribuição do quociente: x=− b̂ 2ĉ (31) que se refere ao ponto de máximo ou de mínimo da função de produção estimada: ŷ = â + b̂P1 (x) + ĉP2 (x) (32) na qual: P1 (x) = x − x̄ e P1 (x) = x2 − k são polinômios ortogonais, sendo x̄ a média dos valores de x e k um número real; â, b̂ e ĉ são os estimadores dos parâmetros, sendo b̂ e ĉ independentes; ŷ são os valores preditos. Para tanto, foram gerados 16000 dados de distribuição normal. Após ajustados através de variâncias teóricas, foram obtidos 8000 valores para x. As variâncias utilizadas foram 0,015625; 0,0625; 0,25; 1,00; 2,00; 4,00; 6,25 e 9,00. Verificou-se que a distribuição de x foge completamente da normalidade, exceto talvez para o valor mais baixo de σ 2 estudado, e que à medida que crescem os valores das variâncias teóricas estudadas, a distribuição tende a ser leptocúrtica. Além da análise da distribuição, intervalos de confiança foram obtidos para x, 28 considerando o método de Fieller; a fórmula da variância comum, dada por: n P V1 (x) = i=1 x2i − n P 2 xi i=1 N N −1 (33) em que xi são os valores simulados e; a fórmula da variância obtida pela diferenb̂ ciação de x = − 2ĉ : 2 1 1 b̂ V2 (x) = 2 V b̂ + 4 V (ĉ) 4 ĉ ĉ (34) em que V b̂ e V (ĉ) foram obtidas pelas fórmulas de variâncias usuais e, ĉ e b̂ são as médias das estimativas dos valores simulados. Para σ 2 > 0,25, o método de Fieller resultou em intervalos de confiança com extremos infinitos, sendo que os intervalos construídos, considerando V2 (x), apresentaram maior precisão. Freitas (1978) estudou a distribuição dos erros experimentais associados ao ponto que determina a produção máxima da cultura de algodão, dado por: √ b̂ 2ĉ (35) + cxi + ei (36) x=− para o modelo de produção: 1/2 yi = a + bxi em que: yi representa a produção obtida na i-ésima dose de nutriente, em quilogramas por hectare; xi representa a i-ésima quantidade de dose de nutriente (N , P2 O5 ou K2 O), em quilogramas por hectare. Dessa maneira, os erros foram considerados aleatórios e independentes com distribuição normal de média zero e variância σ 2 . Verificou-se que a dis- 29 tribuição do quociente foi aproximadamente normal para as variâncias σ 2 = 5 e σ 2 = 10. Já para as variâncias σ 2 = 15, 20, 25, 30, 35, 40, 45 e 50, a distribuição caracterizou-se por ser leptocúrtica e com assimetria positiva. Considerando os valores simulados, intervalos de confiança considerando o método de Fieller, √ √ V1 ( x) e V2 ( x), conforme D’Aulísio, Pimentel-Gomes e Nogueira (1976), foram construídos, sendo que diante dos resultados obtidos, os intervalos conside√ rando V2 ( x) apresentaram maior precisão. De acordo com o trabalho desenvolvido por Freitas (1978), Nunes et al. (2004) utilizaram simulação Monte Carlo para avaliar diferentes fórmulas de variâncias para o ponto crítico de um modelo de regressão quadrática, dado por: ŷ = â + b̂x + ĉx2 (37) no qual o estimador do ponto é dado por: x̂ = b̂ −2ĉ (38) Para tanto, consideraram-se as variâncias teóricas σ 2 = 0,1, 0,5, 1,0, 5, 10, 15, 20 e 50 para o erro. As estimativas da variância do ponto crítico foram obtidas por meio das fórmulas da variância comum, por diferenciação do estimador do ponto crítico (D’AULÍSIO; PIMENTEL-GOMES; NOGUEIRA, 1976) e pela fórmula demonstrada para o cálculo da variância de uma razão, considerando a covariância entre b̂ e ĉ (MOOD; GRAYBILL; BOES, 1974). Intervalos de confiança para o ponto crítico foram encontrados considerando as diferentes fórmulas de variâncias. Pôde-se concluir que a variância do ponto crítico calculada, usando-se a expressão que leva em consideração a covariância entre b̂ e ĉ, apresentaram resultados mais satisfatórios, assim como os intervalos de confiança que utilizaram tal fórmula. A variância teórica afetou as estimativas do ponto crítico, sendo que maiores variâncias foram relacionadas com maiores valores médios. A distribuição do ponto crítico apresentou uma forte tendência de assimetria à direita e ao formato leptocúrtico para σ 2 > 10. Hirschberg e Lye (2005) investigaram a construção de intervalos de confi- 30 ança para o ponto crítico de modelos de regressão quadrática, utilizando o método Delta; método de Fieller; a primeira derivada do modelo de regressão quadrática; inferência bayesiana, na qual uma priori de Jeffreys foi assumida para o ponto crítico; teste de razão de verossimilhança e; metódo bootstrap, no qual intervalos de confiança percentil e bootstrap-t foram construídos, sendo que a estimativa do erro padrão do ponto crítico foi obtida utilizando o método Delta. Diante das simulações realizadas, os métodos bootstrap-t e Delta apresentaram maior precisão, sendo que o método de Fieller e o teste de razão de verossimilhança apresentaram intervalos de confiança com extremos infinitos. 2.2 Metodologia bootstrap Em inferência estatística, características da população são analisadas com base em amostras. Considerando que a inferência é realizada admitindo o Teorema Central do Limite, em que amostras suficientemente grandes são consideradas, a metodologia bootstrap surge como alternativa para analisar situações em que as amostras não são suficientemente grandes, assim como, para obter aproximações de distribuições amostrais de determinadas estatísticas. A metodologia bootstrap, desenvolvida por Efron (1979), consiste em admitir a amostra orginal como se fosse a própria população, sendo que para isso, a amostra original deve representar bem a população em estudo. Dessa maneira, novas amostras com reposição são obtidas a partir de reamostragem da amostra original, denominadas de amostras bootstrap, na qual representam diferentes situações experimentais com a idéia de que o experimento é repetido por diversas vezes. Para cada amostra bootstrap, é calculada uma estimativa para a estatística de interesse. Ao final do processo de reamostragem, o conjunto das estimativas obtidas, denominadas de estimativas bootstrap, dá origem à distribuição bootstrap, que tem aproximadamente a mesma forma e dispersão da distribuição amostral da estatística, porém está centrada no valor da estatística original e não no valor do parâmetro de interesse (EFRON; TIBSHIRANI, 1993). Com base nas estimativas 31 bootstrap, intervalos de confiança bootstrap podem ser encontrados, realizando milhares de remostragens para que as oscilações provocadas pela aleatoriedade do processo sejam minimizadas. O número de reamostragem mínimo é igual a 1000 e para a grande maioria das situações, um número de reamostragem igual a 2000 fornece excelentes resultados (FERREIRA, 2009). A metodologia bootstrap pode ser implementada tanto de forma não paramétrica quanto de forma paramétrica. No caso do bootstrap não paramétrico, a amostragem é feita com reposição da amostra original, supondo que as observações são obtidas a partir de uma distribuição empírica que designa uma probabilidade igual a 1/n para cada uma das observações y1 ,y2 ,...,yn . No caso paramétrico, a amostragem é realizada com base numa distribuição ajustada às observações amostrais. A partir de uma amostra bootstrap Bb = {y1∗ ,y2∗ ,...,yn∗ }, em que yi∗ é uma escolha aleatória de {y1 ,y2 ,...,yn }, calcula-se uma estimativa da estatística de interesse, θ̂b∗ . Realizando esse processo para b = 1,...,B vezes, pode-se obter, conforme Efron e Tibshirani (1993), a estimativa bootstrap do erro padrão da estatística de interesse: ∗ σ̂B θ̂ = v u B 2 uP ∗ u θ̂b − θ̂∗ t b=1 (39) B−1 B P em que θ̂b∗ é o estimador calculado a partir da b-ésima amostra e θ̂∗ = b=1 θ̂b∗ B éa média dos valores reamostrados. Dessa maneira, a metodologia bootstrap oferece um meio alternativo para calcular erros padrão, com a grande vantagem de que a fórmula apresentada anteriormente é aplicável a qualquer estimador (CASELLA; BERGER, 2010). 32 2.2.1 Metodologia bootstrap aplicada em regressão De acordo com Draper e Smith (1998), dois métodos de reamostragem bootstrap não paramétricos podem ser utilizados em modelos de regressão, que são: Bootstrap residual e Bootstrap de pares. Ambos os métodos são descritos a seguir: a) Bootstrap residual: 1. ajuste um modelo de regressão, considerando os dados da amostra original e obtenha os n resíduos, b ε; ∼ 2. selecione uma amostra aleatória de tamanho n dos resíduos b ε obtidos no ∼ passo 1, utilizando reamostragem com reposição, com probabilidade 1/n para cada resíduo selecionado, obtendo ∼ε∗ ; 3. gere novos valores de Y∼ fazendo: b + ε∗ Y∼ ∗ = X β ∼ ∼ b são as estimativas dos em que ∼ε∗ são os resíduos obtidos no passo 2 e β ∼ parâmetros obtidas no passo 1; 4. ajuste um modelo de regressão, considerando Y∼ ∗ , pelo método dos mínimos b∗ ; quadrados, obtendo novas estimativas para os parâmetros, β ∼ 5. Repita os passos 1 a 4, R vezes. b) Bootstrap de pares: 1. reamostre com reposição n pares dos valores originais (yi ,xi ), com probabilidade 1/n para cada par; 2. ajuste um modelo de regressão, considerando os n pares reamostrados no passo 1, pelo método dos mínimos quadrados, obtendo novas estimativas b∗ ; para os parâmetros, β ∼ 33 3. Repita os passos 1 a 4, R vezes. Para modelos de regressão, a metodologia bootstrap paramétrico (EFRON; TIBSHIRANI, 1993) consiste em, sob hipótese de normalidade, tomar amostras ∼ε∗ da distribuição N 0,σ 2 , em que σ 2 é o quadrado médio do erro da regressão, geb + ε∗ , rando novos valores da variável resposta, Y , por meio do modelo Y ∗ = X β ∼ ∼ ∼ ∼ b são os valores estimados dos parâmetros obtidos pelo método dos míniem que β ∼ mos quadrados, considerando os dados originais. 2.3 Inferência bayesiana Na inferência frequentista, um determinado parâmetro θ é considerado como um valor fixo ou constante, enquanto que na inferência bayesiana, θ é considerado como uma variável aleatória. Dessa maneira, a inferência bayesiana consiste em assumir uma distribuição a priori para θ, traduzir informações referentes aos dados amostrais através de uma função de verossimilhança, e obter por meio do teorema de Bayes, a distribuição a posteriori para θ. O grau de incerteza ou informação que se tem a respeito de θ é representado pela sua distribuição a priori, sendo que ocorrido o experimento, a inferência é realizada com base na distribuição a posteriori . 2.3.1 Teorema de Bayes De acordo com Paulino, Turkman e Murteira (2003), o teorema de Bayes é um dos resultados da matemática que se propõe a caracterizar a aprendizagem com a experiência, isto é, modificar a atitude inicial em relação aos "antecedentes", depois de ter a informação adicional de que certo evento se realizou. Considerando Ai como eventos disjuntos de um espaço amostral e B como 34 um evento do espaço amostral, o teorema de Bayes é dado por: P (Ai |B) = P (B|Ai ) P (Ai ) P (B|Ai ) P (Ai ) = n P P (B) P (B|Ai ) P (Ai ) (40) i=1 em que, considerando A como parâmetros desconhecidos e B como variáveis aleatórias correspondentes à amostra, P (B|A) representa a função de verossimilhança relacionada à distribuição probabilística dos dados amostrais, P (A) são distribuições a priori, que representam o conhecimento prévio a respeito dos parâmetros e P (A|B) corresponde à distribuição a posteriori dos parâmetros, considerando que o experimento ocorreu. Com isso, a informação que se tem a respeito de um parâmetro θ, representada pela sua distribuição a priori, p (θ), pode ser aumentada, observandose uma variável aleatória X relacionada com θ, obtendo a distribuição amostral p (x|θ), na qual para um valor fixo de x, a função L (θ; x) = p (x|θ) fornece a verossimilhança de cada um dos possíveis valores de θ (PAULINO; TURKMAN; MURTEIRA, 2003). Assim, o teorema de Bayes é dado da seguinte maneira: p (θ|x) = p (x|θ) p (θ) p (x|θ) p (θ) = R p (x) p (θ,x) dθ (41) em que θ é contínuo. Como o denominador não depende de θ, servindo apenas como uma constante normalizadora de p (θ|x), o teorema pode ser reecrito como: p (θ|x) ∝ p (x|θ) p (θ) 2.3.2 (42) Distribuições a priori A informação prévia que se tem a respeito de um determinado parâmetro é representada pela sua distribuição a priori. Quando o pesquisador tem alguma informação sobre o parâmetro em estudo, ele pode trabalhar com uma priori de- 35 nominada de priori informativa. Uma priori é caracterizada como não informativa quando a informação dos dados é dominante ou quando se deseja representar o desconhecimento sobre θ (BOX; TIAO, 1992). Uma das prioris não informativas mais utilizada é a priori de Jeffreys (1961). 2.3.3 Distribuições a posteriori Considerando θ como um vetor de parâmetros e θi como um parâmetro específico, a distribuição a posteriori conjunta, dada por p (θ|x), deve ser integrada em relação a todos os parâmetros, exceto a θi . Dessa maneira, encontra-se uma distribuição para θi , denominada de distribuição marginal de θi , sendo expressa por: Z p (θi |x) = Z ... p (θi, θ−i |x) dθ−i (43) em que θ−i = (θ1 ,...,θi−1 ,θi+1 ,...,θj ) é o conjunto complementar de parâmetros para θi (PAULINO; TURKMAN; MURTEIRA, 2003). Com base na distribuição marginal a posteriori, que contém toda a informação probabilística a respeito do parâmetro, estimativas bayesianas pontuais podem ser encontradas, por exemplo, moda, média e mediana a posteriori, além de estimativas bayesianas intervalares, através da construção de intervalos de credibilidade (BOX; TIAO, 1992). 2.3.4 Intervalos de credibilidade Uma alternativa aos intervalos de confiança abordados na estatística convencional, considerados como intervalos aleatórios, é o intervalo de confiança bayesiano, denominado de intervalo de credibilidade, no qual a quantidade aleatória é o parâmeto. O intervalo C será um intervalo de credibilidade de 100 (1 − α) %, ou 36 nível de credibilidade 1 − α, para θ se P (θ ∈ C) > 1 − α. Dessa maneira, a definição probabilística expressa a pertinência ou não de θ ao intervalo C. Com o mesmo grau de crebilidade, existe uma infinidade de regiões de credibilidade, surgindo o intervalo de máxima densidade a posteriori (Highest Posterior Density) ou intervalo HPD, no qual é um intervalo de credibilidade de comprimento mínimo, tomando-se os valores de θ com maior densidade a posteriori (PAULINO; TURKMAN; MURTEIRA, 2003). 2.3.5 Métodos de simulação Em diversas situações, a distribuição marginal a posteriori de um determinado parâmetro θ é difícil de ser encontrada, devido à impossibilidade de calcular analiticamente as integrais envolvidas. Dessa maneira, pode-se utilizar métodos aproximados baseados em simulação estocástica, como os métodos não iterativos e iterativos. Dentre os métodos não iterativos, têm-se os métodos de reamostragem por rejeição e ponderada e, os métodos de Monte Carlo. Como métodos iterativos, têm-se os métodos de Monte Carlo via cadeias de Markov (MCMC), que consistem em gerar valores de uma distribuição condicional a posteriori para cada parâmetro, como os algoritmos Gibbs (GELFAND; SMITH, 1990) e de MetropolisHastings (HASTINGS, 1970). De acordo com Paulino, Turkman e Murteira (2003), o algoritmo Gibbs ou método de amostragem Gibbs é baseado no fato de que se a distribuição a posteriori conjunta, p (θ|x) for positiva, então, é unicamente determinada pelas distribuições condicionais completas, p (θi |θ−i ,x). Segundo Gamerman (1997), a amostragem Gibbs pode ser descrita da seguinte forma: 1. inicie o contador de iterações da cadeia l = 1 e escolha valores iniciais (0) (0) 0 θ = θ1 ,...,θj ; (l) (l) 2. obtenha um novo valor θl = θ1 ,...,θj , a partir de θ(l−1) , por meio de 37 sucessivas gerações de valores: (l) (l−1) (l−1) (l−1) θ1 ∼ p θ1 |θ2 ,θ3 ,...,θj ,x (l) (l) (l−1) (l−1) θ2 ∼ p θ2 |θ1 ,θ3 ,...,θj ,x .. . (l) (l) (l) (l) θj ∼ p θj |θ1 ,θ2 ,...,θj−1 ,x 3. mude o contador l para l + 1 e retorne ao passo 2, até atingir a convergência. No caso em que a forma da distribuição condicional completa não é reconhecida, pode-se utilizar o algoritmo de Metropolis-Hastings. De acordo com Chib e Greenberg (1995), o algoritmo de Metropolis-Hastings pode ser descrito da seguinte maneira: 1. inicie o contador de iterações da cadeia v = 1 e especifique valores iniciais (0) (0) 0 θ = θ1 ,...,θj ; 2. gere um novo valor θ∗ de uma distribuição auxiliar proposta q (.|θ); ∗ |x)q(θ|θ ∗ ) 3. calcule a probabilidade de aceitação α (θ,θ∗ ) = min 1, p(θ ∗ p(θ|x)q(θ |θ) , em que p é a distribuição de interesse, e gere u ∼ U (0,1); 4. se u < α (θ,θ∗ ), então, aceite o novo valor, θ∗ , e faça θ(v+1) = θ∗ , caso contrário, rejeite e faça θ(v+1) = θ(v) ; 5. incremente o contador de v para v + 1 e volte ao passo 2. Nos métodos de Monte Carlo via cadeias de Markov, tem-se a necessidade de diagnosticar a convergência das cadeias para a distribuição original. Para tanto, têm-se os métodos informais e formais. Os métodos informais foram inicialmente propostos por Gelfand e Smith (1990), na qual sugeriram, por exemplo, a técnica gráfica que consiste em observar a trajetória da cadeia ao longo das iterações, sendo que após um período inicial, se a cadeia apresentar o mesmo comportamento, então, pode-se concluir a convergência. Dentre os métodos formais, 38 podem-se destacar os critérios propostos por Raftery e Lewis (1992) e Geweke (1992). O critério de Raftery e Lewis (1992) estima o número de iterações necessárias para que o algoritmo Gibbs apresente convergência, sendo que o método fornece as estimativas do burn-in, o número total de iterações que devem ser computadas e a distância mínima de uma iteração à outra (thin), para se obter a subamostra aproximadamente independente. A regra de decisão é baseada no fator de dependência, que é responsável pelo acréscimo multiplicativo ao número de iterações necessárias para se alcançar a convergência. Se o fator de dependência for maior que cinco, pode-se concluir que a cadeia não atingiu convergência. O critério de Geweke (1992) propõe uma análise da convergência baseada no teste de igualdade de médias da primeira e da última parte da cadeia de tamanho N , geralmente, as primeiras 0,1N iterações e as últimas 0,5N iterações. Para tanto, técnicas de análise espectral são utilizadas para avaliar a convergência da cadeia. A regra de decisão é baseada na estimativa de um valor p, sendo que se esse valor for menor que um nível de significância adotado pelo pesquisador, conclui-se que a cadeia não atingiu convergência. 2.4 2.4.1 Lógica fuzzy Conjunto fuzzy e função de pertinência A lógica fuzzy, também conhecida como lógica nebulosa, lógica difusa ou teoria das possibilidades, é uma extensão da lógica clássica, a qual se baseia na teoria dos conjuntos fuzzy. A lógica fuzzy foi inicialmente introduzida por Zadeh (1965), tendo como objetivo, trabalhar informações imprecisas. Um conjunto clássico pode ser caracterizado por sua função característica. De acordo com Barros e Bassanezi (2010), sejam U um conjunto universo e A um 39 subconjunto de U , a função característica de A é definida como: χA : U → {0,1} (44) em que: ( χA (x) = 1 se x ∈ A 0 se x ∈ /A sendo que χA é uma função cujo domínio é U e a imagem está contida no conjunto {0,1}, com χA (x) = 1 indicando que o elemento x está em A, enquanto χA (x) = 0 indica que x não é elemento de A. De acordo com Tanaka (1997), um conjunto ou subconjunto fuzzy A de um conjunto universo U é definido por uma função de pertinência µA representada por: µA : U → [0,1] (45) na qual µA (x) ∈ [0,1] é o grau de pertinência com que o elemento x de U pertence ao conjunto fuzzy A. Os conjuntos fuzzy podem ser expressados de maneira discreta ou contínua. Quando o conjunto universo U é discreto, um conjunto fuzzy A pode ser representado como: A = µA (x1 )/x1 + µA (x2 )/x2 + ... + µA (xn )/xn = N X µA (xi )/xi (46) i=1 em que o símbolo / é apenas usado para associar o elemento do conjunto universo U e seu grau de pertinência ao conjunto fuzzy A, assim como o sinal + que não significa soma, mas sim conexão entre os elementos. Quando o conjunto universo U é contínuo, um conjunto fuzzy A pode ser 40 representado como: Z µA (xi )/xi A= (47) U em que o símbolo ∫ não tem nenhuma conexão com integral, assim como P com somatório, no caso discreto. Operações que envolvem conjuntos clássicos como união, intersecção e complemento também podem ser realizadas por meio de conjuntos fuzzy. Sejam A e B conjuntos fuzzy. De acordo com Tanaka (1997), as funções de pertinência que representam os conjuntos fuzzy união, intersecção e complementar são dadas, respectivamente, por: 2.4.2 µA∪B (x) = max {µA (x) ,µB (x)} (48) µA∩B (x) = min {µA (x) ,µB (x)} (49) µA0 (x) = 1 − µA (x) ,∀x ∈ U (50) µB 0 (x) = 1 − µB (x) ,∀x ∈ U (51) Níveis de um conjunto fuzzy De acordo com Tsoukalas e Uhrig (1997), com qualquer conjunto fuzzy A, pode-se associar uma coleção de conjuntos clássicos denominados de α - níveis de A. Um α - nível é um conjunto clássico que consiste de elementos que pertencem ao conjunto fuzzy A com grau de pertinência maior ou igual a α, isto é: [A]α = {x ∈ U/µA (x) > α} para 0 < α 6 1. (52) 41 2.4.3 Números fuzzy Com o objetivo de se trabalhar com operações aritméticas que envolvem incertezas, foram definidos os números fuzzy. Tanaka (1997) define um conjunto fuzzy A como número fuzzy quando o conjunto universo no qual µA (x) está definida é o conjunto dos números reais e satisfaz às seguintes condições: • A é um conjunto convexo; • existe pelo menos um valor de x que admite pertinência máxima (µA (x) = 1); • µA (x) é contínua em um dado intervalo. Sejam A e B números fuzzy com α - níveis dados, respectivamente, por α [A] = [aα1 , aα2 ] e [B]α = [bα1 , bα2 ]. Conforme Barros e Bassanezi (2010), valem as seguintes operações intervalares: a) A soma entre A e B é o número fuzzy A + B, cujos α - níveis são [A + B]α = [A]α + [B]α = [aα1 + bα1 , aα2 + bα2 ] (53) b) A diferença entre A e B é o número fuzzy A − B, cujos α - níveis são [A − B]α = [A]α − [B]α = [aα1 − bα2 , aα2 − bα1 ] (54) c) A multiplicação de λ por A é o número fuzzy λA, cujos α - níveis são ( [λA]α = λ[A]α = [λaα1 , λaα2 ] se λ > 0 [λaα2 , λaα1 ] se λ < 0 (55) d) A multiplicação de A por B é o número fuzzy A.B, cujos α - níveis são [AB]α = [A]α [B]α = [min P, max P ] em que P = {aα1 bα1 ,aα1 bα2 ,aα2 bα1 ,aα2 bα2 }. (56) 42 e) A divisão de A por B é o número fuzzy cujos α - níveis são A B α α α a1 a2 [A]α = , α = [B] bα2 bα1 (57) Considerando um número fuzzy triangular A, sua função de pertinência é da seguinte forma: µA (x) = x−a u−a , b−x b−u , se u 6 x 6 b 0, caso contrario se a 6 x 6 u (58) em que µA (u) = 1, podendo ser representado de maneira simplificada por A = (a; u; b). A Figura 1 apresenta uma função de pertinência triangular. Os α - níveis desses números fuzzy são os intervalos: [aα1 , aα2 ] = [(u − a) α + a, (u − b) α + b] Figura 1 Representação de uma função de pertinência triangular (59) 43 2.4.4 Princípio de extensão de Zadeh O princípio de extensão de Zadeh tem como finalidade ampliar operações matemáticas do domínio clássico ao domínio fuzzy. Sejam X e Y conjuntos e f uma aplicação de X em Y , seja A um conjunto fuzzy em X, o princípio de extensão afirma que a imagem de A pela função f é um conjunto fuzzy B = f (A) em Y , cuja função de pertinência é dada por µB (y) = sup µA (x), sendo ilustrado na Figura 2 (PEDRYCZ; GOMIDE, 1998). x Figura 2 Princípio de extensão Segundo Jafelice (2004), o princípio de extensão pode ser descrito como: • o grau de pertinência de um valor do contradomínio é definido diretamente pelo grau de pertinência de sua pré imagem; • quando um valor do contradomínio é mapeado por vários do domínio, o seu grau de pertinência é obtido pelo valor máximo dos graus de pertinência dos valores da entrada. O princípio de extensão pode ser facilmente generalizado para funções de várias variáveis. Sejam X = X1 × X2 × ... × Xn e Y conjuntos universos, considere os conjuntos Ai em Xi , i = 1,...,n, e uma função f : X → Y . Os 44 conjuntos fuzzy A1 , A2 ,...,An são então transformados pela f , produzindo o conjunto fuzzy B = f (A1 ,A2 ,...,An ) em Y , cuja função de pertinência é µB (y) = sup min [µA1 (x1 ) ,µA2 (x2 ) ,...,µAn (xn )] para x ∈ X, x = (x1 ,x2 ,...,xn ) ∈ x X1 × X2 × ... × Xn e y = f (x). Melo (2009) apresentou uma metodologia computacional que permitiu aplicar o princípio de extensão para funções não monótonas com dois parâmetros fuzzy. Para tanto, analisou o problema do Oscilador Harmônico Unidimensional, considerando os parâmetros amplitude e frequência como incertos. Os resultados obtidos mostraram que a solução fuzzy aproximou a solução clássica do Oscilador Harmônico Amortecido. Com o objetivo de apresentar uma metodologia computacional para aplicar lógica fuzzy a funções matemáticas gerais, Pires (2010) utilizou o princípio de extensão de Zadeh em grandezas termodinâmicas e em equações de difusão, que são exemplos de equações diferenciais parciais importantes em engenharia. Verificou-se que os resultados tenderam à solução clássica à medida que a incerteza diminuía, concluindo que o processo de construção de funções de pertinência, etapa de fuzzificação, foi bem estruturado. 2.4.5 Métodos de defuzzificação Uma das etapas importantes, que envolve um estudo baseado em lógica fuzzy, é a etapa da defuzzificação. A defuzzificação consiste em traduzir um conjunto fuzzy em um número real. Existem diversos métodos de defuzzificação, sendo que o mais utilizado é o método do Centro de Gravidade, também chamado de Centróide ou Centro de Área (MAMDANI, 1974). De acordo com Barros e Bassanezi (2010), o método do Centro de Gravidade (G) é semelhante à média ponderada para distribuição de dados, com a diferença de que os pesos são os valores µA (x), que indicam o grau de pertinência do valor xi no conjunto fuzzy A. 45 Para um domínio discreto, tem-se: n P G (A) = xi µA (xi ) i=0 n P (60) µA (xi ) i=0 Para um domínio contínuo, tem-se: R xµA (x) dx R G (A) = R µA (x) dx (61) R em que R é a região de integração. 2.4.6 Teoria da possibilidade Na teoria estatística, as informações são tratadas, considerando funções de probabilidade ou funções densidade de probabilidade. A probabilidade está relacionada com a incerteza do resultado futuro de um experimento aleatório, sendo que nesse caso, os eventos são bem definidos e a dúvida está na ocorrência dos mesmos. Na teoria fuzzy, as informações são tratadas por meio de funções de pertinência, µ (x) : Ω → [0,1], na qual µ (x) indica a pertinência ou possibilidade de x ser igual a um determinado valor. Enquanto que, na teoria de probabilidade, os eventos são bem definidos, na teoria da possibilidade, tem-se imprecisão quanto a definição dos eventos. De acordo com Zadeh (1978), uma distribuição de possibilidade sobre o conjunto Ω 6= ∅ é uma função µ (x) : Ω → [0,1], satisfazendo sup µ (x) = 1. x∈Ω 46 2.4.7 Estatística e lógica fuzzy Com o avanço da teoria dos conjuntos fuzzy, envolvendo números fuzzy e princípio de extensão, muitas pesquisas têm sido desenvolvidas, combinando métodos estatísticos com lógica fuzzy (TAHERI, 2003), como no estudo de variáveis aleatórias (GONZALEZ-RODRIGUES; COLUBI; GIL, 2006; AKBARI; REZAEI, 2009), testes de hipóteses (GRZEGORZEWSKI; HRYNIEWICZ, 1997) e análises de regressão (WU, 2003; BARGIELA; PEDRYCZ; NAKASHIMA, 2007). Uma das principais aplicações envolvendo estatística e lógica fuzzy, foi introduzida por Zadeh (1968), a qual propôs o estudo da probabilidade de um evento fuzzy. Seja A um evento fuzzy, em que µA (x) : Ω → [0,1], a probabilidade de A é dada por: m P P (A) = µA (xi ) i=1 n (62) em que m e n são, respectivamente, os números de elementos de A e Ω. Tanaka, Uejima e Asai (1982) apresentaram a primeira regressão linear fuzzy, na qual consideraram a variável dependente como fuzzy. Dessa maneira, as observações foram representadas por números fuzzy através de funções de pertinência triangulares simétricas, denotados por Ȳi = (ȳi ,ei ), i = 1,2,...M , em que ȳi é o centro e ei é a largura do i-ésimo dado coletado, dado como: ( µȲi (yi ) = 1− 0 |ȳi −yi | ei se ȳi − ei 6 yi 6 ȳi + ei caso contrario (63) Nesse caso, o modelo básico assumiu uma função linear fuzzy, como se segue: yi = A0 + A1 xi1 + ... + AN xiN = Yi = AXi (64) 47 sendo que Xi = [Xi0 ,Xi1 ,...,XiN ]T é um vetor de variáveis independentes do i-ésimo dado, A = [A0 ,A1 ,...,AN ] é um vetor de parâmetros fuzzy presente na forma de números fuzzy triangulares simétricos, denotados por Aj = (αj ,cj ), j = 1,...,N , na qual αj é o centro e cj a largura. Pelo princípio de extensão, obteve-se a função de pertinência do número fuzzy estimado: µyi∗ (yi ) = |yi −αT Xi | 1 − cT X i 1 0 se Xi 6= 0 se Xi = 0, yi = 0 (65) caso contrrio em que cT = (c0 ,c1 ,...,cN ) e αT = (α0 ,α1 ,...,αN ). Buckley (2005) apresentou estimadores fuzzy baseados em α - níveis, estabelecendo uma relação com níveis de confiança de intervalos convencionais. Falsafain, Taheri e Mashinchi (2008) utilizaram a metodologia proposta por Buckley (2005), apresentando funções de pertinência únicas para estimadores fuzzy de parâmetros de distribuições Normal, Exponencial e Poisson. Considerando um sistema baseado em regras fuzzy (SBRF), Missio e Barros (2009) trataram a variável de entrada do sistema como uma variável aleatória, sendo que seus valores foram estimados pelo método de Monte Carlo. Para isso, geraram-se amostras de valores aleatórios através da distribuição uniforme e, em seguida, tais amostras foram transformadas através da função de distribuição de Weibull truncada. Dessa maneira, os valores de entrada do sistema foram dados pelas médias das amostras obtidas. Como resultado, verificaram a existência de uma aproximação da solução obtida pelo SBRF com a solução apresentada pela literatura. A dificuldade encontrada foi a de determinar uma distribuição de probabilidade para a variável incerta. 48 3 3.1 MATERIAL E MÉTODOS Dados de produção de matéria seca Para a realização deste trabalho, foram considerados dados adaptados da pesquisa desenvolvida por Santos et al. (2002), na qual avaliaram as respostas de fungo micorrízico arbuscular, adubações fosfatada e nitrogenada na produção e qualidade da forragem de braquiarão e amendoim forrageiro consorciados. Para tanto, foi utilizado o delineamento inteiramente casualizado em um esquema fatorial 5x2x2, com 4 repetições, perfazendo um total de 20 tratamentos, sendo 5 doses de adubação fosfatada, 2 tratamentos de inoculação (inoculado e não inoculado com fungo micorrízico arbuscular) e 2 tratamentos de adubação nitrogenada (com e sem adubação nitrogenada em cobertura). Dentre as variáveis avaliadas, a produção de matéria seca do sistema radicular do braquiarão (g.vaso−1 ) foi influenciada significativamente pelas doses de adubação fosfatada (mg.kg−1 ) quando não inoculada com fungo micorrízico arbuscular e com adubação nitrogenada em cobertura. Dessa maneira, foi considerado o seguinte modelo de regressão quadrática: yi = β0 + β1 xi + β2 x2i + εi (66) em que: yi representa o i-ésimo valor observado da produção de matéria seca; β0 , β1 e β2 são os parâmetros a serem estimados; xi representa o i-ésimo valor fixo da dose de adubação fosfatada; εi é o erro experimental associado a observação yi , εi ∼ N 0,σ 2 . Como suposição básica para a realização do estudo, considerou-se que todos os parâmetros são significativamente diferentes de zero, principalmente para β2 . 49 A Figura 3 apresenta o comportamento da produção de matéria seca (y) em função de diferentes doses de adubação fosfatada (x). Figura 3 3.2 Dados de produção de matéria seca em função de diferentes doses de adubação fosfatada Análise bootstrap A análise bootstrap paramétrico foi realizada, considerando as estimativas obtidas via método dos mínimos quadrados, β̂0 , β̂1 , β̂2 , η̂ e σ̂ 2 , como os verdadeiros valores de β0 , β1 , β2 , η e σ 2 , sendo η̂ = − β̂1 , 2β̂2 o estimador do ponto crítico. Dessa maneira, 4000 reamostragens foram realizadas, caracterizando diferentes situações experimentais, em que os erros assumiram uma distribuição normal com média zero e as seguintes variâncias teóricas: σ 2 10, σ 2 8, σ 2 6, σ 2 4, σ 2 2, σ 2 e 1,5σ 2 . 50 Intervalos de confiança para o ponto crítico foram obtidos, considerando as fórmulas das variâncias apresentadas por Mood, Graybill e Boes (1974) e D’Aulísio, Pimentel-Gomes e Nogueira (1976). Como o estimador do ponto crítico envolve um quociente de variáveis aleatórias, Mood, Graybill e Boes (1974) propuseram analisar a variância de tal quociente por meio da expansão da função f (x,y) = x y em série de Taylor. Assim, de acordo com Lima (2009), a expansão de f (x,y) em torno de (µx ,µy ) é dada por: ∂f ∂f f (x,y) = f (µx ,µy ) + (µx ,µy ) (x − µx ) + (µx ,µy ) (y − µy ) + ∂x ∂y 2 1 ∂ f ∂2f 2 + (µ ,µ ) (x − µ ) + (µx ,µy ) (x − µx ) (y − µy ) + (67) x y x 2! ∂x2 ∂y∂x ∂2f ∂2f 2 + (µx ,µy ) (y − µy ) + (µx ,µy ) (x − µx ) (y − µy ) + ... ∂y 2 ∂x∂y Fazendo as derivadas parciais e uma aproximação para funções de duas variáveis, tem-se: f (x,y) ≈ + 1 µx 1 µx + (x − µx ) − 2 (y − µy ) − 2 (x − µx ) (y − µy ) + µy µy µy µy µx (y − µy )2 µ3y (68) A partir da definição de variância, Mood, Graybill e Boes (1974) afirmam que: " # x 2 x x 2 =E − E V y y y (69) Da aproximação obtida anteriormente, tem-se que: x µx 1 µx E ≈ − 2 Cov [x,y] + 3 V [y] y µy µy µy (70) 51 2 Para obter E xy , foi realizada a expansão de f (x,y) = x2 y2 em série de Taylor, obtendo para funções com duas variáves: f (x,y) ≈ µ2x 2µx 2µ2x 1 + (x − µ ) − (y − µy ) + 2 (x − µx )2 − x 2 2 3 µy µy µy µy 4µx 3µ2 − 3 (x − µx ) (y − µy ) + 4x (y − µy )2 µy µy (71) Aplicando-se o operador esperança matemática, obtém-se: " # µ2 1 3µ2 4µx x 2 ≈ x2 + 2 V [x] + 4x V [y] − 3 Cov [x,y] E y µy µy µy µy (72) Dessa maneira, tem-se que: 2 x µx 1 2 1 V ≈ V [x] + 3 V [y] − Cov [x,y] y µy µ2x µy µx µy (73) que é a expressão dada por Mood, Graybill e Boes (1974) para o cálculo da variância de um quociente de duas variáveis aleatórias. Assim, a variância do estimador do ponto crítico pode ser dada por: V1 (η̂) = V1 − β̂1 2β̂2 ! = 1 µβ̂1 4 µβ̂2 !2 h i V β̂1 h i V β̂2 + µ2 β̂1 µ2 β̂2 − h 2Cov β̂1 ,β̂2 i µβ̂1 µβ̂2 (74) i h Para o caso em que a covariância entre β̂1 e β̂2 é nula Cov β̂1 ,β̂2 = 0 , a fórmula anterior pode ser simplificada, resultando na mesma fórmula apresenta por D’Aulísio, Pimentel-Gomes e Nogueira (1976), a qual foi obtida através da primeira derivada do estimador do ponto crítico em relação a x, sendo dada por: V2 (η̂) = V2 − β̂1 2β̂2 ! = h i V β̂1 1 4 µ2 β̂2 h i µ2β̂ V β̂2 + 1 4 µ β̂2 (75) 52 Dessa maneira, para cada reamostragem, que originou novas amostras denominadas de amostras bootstrap, intervalos de confiança, considerando V1 (η̂) e V2 (η̂), foram obtidos: IC1r (η) = η̂ r ± t(v,α/2) q V1r (η̂ r ) (76) IC2r (η) = η̂ r ± t(v,α/2) q V2r (η̂ r ) (77) para r = 1,...,4000, em que t(v,α/2) é o valor crítico da distribuição t de Student para v = 15 e α = 5%. Ao término das 4000 reamostragens, as médias dos intervalos IC1r (η) e IC2r (η) foram encontradas, obtendo os intervalos IC1 (η) = LI 1 ; LS 1 e IC2 (η) = LI 2 ; LS 2 , em que LI 1 e LS 1 são as médias dos limites inferior e superior referentes aos IC1r (η) e LI 2 e LS 2 são as médias dos limites inferior e superior referentes aos IC2r (η). Considerando η̂ como a média dos 4000 valores simulados do ponto crítico e a fórmula da variância comum, V3 (η̂), obteve-se o seguinte intervalo de confiança: IC3 (η) = η̂ ± t(v,α/2) p V3 (η̂) (78) em que: R P V3 (η̂) = i=1 R P η̂i2 − !2 η̂i i=1 R−1 R (79) para v = 3999, R = 4000 e α = 5%. Intervalos de confiança bootstrap-t foram gerados de acordo com Efron e Tibshirani (1993), considerando as variâncias V1 (η̂) e V2 (η̂), obtendo, respectiva- 53 mente, IC4 (η) e IC5 (η) com 95% de confiança: h i p p IC4 (η) = η̂ − t11−α/2 V1 (η̂); η̂ − t1α/2 V1 (η̂) (80) h i p p IC5 (η) = η̂ − t21−α/2 V2 (η̂); η̂ − t2α/2 V2 (η̂) (81) em que η̂ é a estimativa obtida considerando os dados originais e, t1 e t2 são os valores padronizados e ordenados dos 4000 pontos críticos simulados, na qual t1 e t2 resultam, respectivamente, das padronizações T 1r e T 2r : η̂ r − η̂ T 1r = p r V1 (η̂ r ) η̂ r − η̂ T 2r = p r V2 (η̂ r ) para r = 1,...,4000. Com os 4000 valores simulados do ponto crítico foram construídos histogramas da distribuição de frequência e realizados os testes de normalidade de Shapiro-Wilk, assimetria e excesso de curtose assintótico. Para tanto, os momentos amostrais foram encontrados conforme Mood, Graybill e Boes (1974), no qual, para os valores simuladosdo ponto crítico, o tR t P ésimo momento amostral é dado por mt = R. O estimador do η̂ r − η̂ r=1. 3/2 coeficiente de assimetria é dado por g1 = m3 m2 , sendo que para g1 = 0 a distribuição é simétrica, g1 > 0 a distribuição é assimétrica a direita (assimetria positiva) e para g1 < 0, a distribuição é assimétrica a esquerda (assimetria negativa). O estimador do coeficiente para avaliar o excesso de curtose é dado por g2 = m4 m22 − 3. Tendo como referência a distribuição normal, que possui coeficiente de curtose igual a 0, para g2 = 0, a distribuição é denominada de mesocúrtica, g2 > 0 a distribuição é denominada de leptocúrtica, na qual a curva é mais afilada e para g2 < 0, a distribuição é denominada de platicúrtica, na qual a 54 curva é mais achatada. Dessa maneira, os testes foram realizados , considerando que g1 ∼N ˙ (0,6/4000) e g2 ∼N ˙ (0,24/4000) (SNEDECOR; COCHRAN, 1980). A Figura 4 apresenta, resumidamente, os passos utilizados para a obtenção dos intervalos de confiança, considerando a metodologia bootstrap para variância teórica igual a σ 2 8. A análise bootstrap foi realizada no software R (R DEVELOPMENT CORE TEAM, 2012), cuja rotina está apresentada no APÊNDICE A. Figura 4 Fluxograma para obter os intervalos de confiança, considerando a metodologia bootstrap 55 56 3.3 Análise bayesiana Considerando que o ponto crítico do modelo de regressão quadrática é β1 dado por η = − 2β , o modelo yi = β0 + β1 xi + β2 x2i + εi pode ser reescrito da 2 forma: yi = β0 − 2ηβ2 xi + β2 x2i + εi (82) Dessa maneira, com a finalidade de obter intervalos de confiança bayesianos para os parâmetros do modelo, considerando os dados de produção de matéria seca em função de diferentes doses de adubação fosfatada, foi analisado o vetor de parâmetros desconhecidos λ0 = β0 ,β2 ,η,σ 2 . Para a estimativa dos parâmetros, obteve-se a distribuição a posteriori conjunta, sendo para isso foram assumidas as seguintes distribuições a priori: que 2 2 β0 ∼ N µβ0 ,σβ0 , β2 ∼ N µβ2 ,σβ2 , η ∼ N µη ,ση2 e σ 2 ∼ IG (α,β). Pelo teorema de Bayes, a distribuição a posteriori conjunta pode ser descrita da seguinte maneira: p β0 ,β 2 ,η,σ 2 |y ∝ L y|β0 ,β 2 ,η,σ 2 .p (β0 ) .p (β2 ) .p (η) .p σ 2 −( n +α+1) 2 . p β0 ,β 2 ,η,σ 2 |y ∝ σ 2 ( 2) n 1 X 2 . exp − 2 yi − β0 + 2ηβ2 xi − β2 xi . 2σ i=1 " # ) ( 1 (β0 − µβ0 )2 (β2 − µβ2 )2 (η − µη )2 β + + − 2 . exp − 2 ση2 σ σβ20 σβ22 (83) Com o objetivo de obter aproximações das distribuições marginais dos parâmetros, métodos MCMC foram utilizados para gerar valores das distribuições a 57 posteriori condicionais completas para cada parâmetro. Tais distribuições condicionais foram obtidas a partir da distribuição a posteriori conjunta. A monitoração da convergência das cadeias foi realizada através de análise gráfica e considerando os critérios de Raftery e Lewis (1992), por meio do fator de dependência, e de Geweke (1992), com base na estimativa de um valor p. Os métodos MCMC foram implementados no software R (R DEVELOPMENT CORE TEAM, 2012) como apresentado no APÊNDICE B, sendo que o pacote Bayesian Output Analysis (BOA) foi utilizado para avaliar a convergência das cadeias e realizar a inferência sobre os parâmetros do modelo. 3.4 3.4.1 Análise fuzzy Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy Para a análise fuzzy 1, as estimativas dos parâmetros do modelo de regressão quadrática foram consideradas como incertas, sendo que para isso, foram definidos os números fuzzy β̃0 , β̃1 e β̃2 referentes às estimativas β̂0 , β̂1 e β̂2 , respectivamente. Tais números fuzzy foram representados por meio das seguintes funções de pertinência triangulares: µβ̃0 (a) = µβ̃1 (b) = 0, se a−a0 +δ1 , δ1 a0 +δ1 −a , δ1 a 6 a0 − δ1 se a0 − δ1 < a 6 a0 se a0 6 a < a0 + δ1 0, se a > a0 + δ1 0, se b 6 b0 − δ2 b−b0 +δ2 , δ2 b0 +δ2 −b , δ2 se b0 − δ2 < b 6 b0 se b0 6 b < b0 + δ2 0, se b > b0 + δ2 (84) (85) 58 µβ̃2 (c) = c 6 c0 − δ3 0, se c−c0 +δ3 , δ3 c0 +δ3 −c , δ3 se c0 − δ3 < c 6 c0 se c0 6 c < c0 + δ3 0, se (86) c > c0 + δ3 em que a0 , b0 e c0 são, respectivamente, as estimativas dos parâmetros β0 , β1 e β2 obtidas via método dos mínimos quadrados que assumem grau de pertinência máximo igual a 1 em cada função de pertinência e,δ1 , δ2 e δ3 são, respectivamente, os erros padrão das estimativas β̂0 , β̂1 e β̂2 . Para realizar a discretização dos números fuzzy, foram considerados ∆, como sendo um passo no intervalo de cada função de pertinência, e n, como o número de pontos a serem analisados, tendo, respectivamente, para β̃0 , β̃1 e β̃2 : ∆1 = (a0 + δ1 ) − (a0 − δ1 ) 2δ1 = n−1 n−1 (87) ∆2 = (b0 + δ2 ) − (b0 − δ2 ) 2δ2 = n−1 n−1 (88) ∆3 = 2δ3 (c0 + δ3 ) − (c0 − δ3 ) = n−1 n−1 (89) O princípio de extensão de Zadeh foi implementado utilizando a linguagem de programação C++ (APÊNDICE C), sendo que as análises gráficas foram realizadas por meio do software GNUPLOT 4.6. Para tanto, foi considerado o seguinte modelo, denominado de modelo fuzzy de regressão quadrática: ỹ = β̃0 + F β̃1 + F β̃2 (90) em que: β̃0 = n X µβ̃0 (ai ) i=1 ai (91) 59 n X µβ̃1 (bi ) F β̃1 = bi x (92) n X µβ̃2 (ci ) F β̃2 = ci x2 (93) i=1 i=1 Assim, de acordo com Pedrycz e Gomide (1998), obteve-se a seguinte função de pertinência de ỹ: µ(β̃0 +F (β̃1 )+F (β̃2 )) (z) = max {(a,b,c):a+b+c=z} h i min µβ̃0 (a) ,µβ̃1 (b) ,µβ̃2 (c) (94) Em seguida, para obter uma curva representativa do modelo fuzzy, foi utilizado o método de defuzzificação do Centro de Gravidade para cada valor de x. Considerando que as estimativas β̂1 e β̂2 são incertas, surge o ponto crítico fuzzy baseado na divisão de números fuzzy, que é dado por: η̃ = − β̃1 2β̃2 (95) Com o objetivo de determinar η̃ em termos de α-níveis, foram realizadas operações intervalares de multiplicação e divisão conforme Barros e Bassanezi (2010), obtendo: h iα h i " # (α) (α) (α) (α) β11 ; β12 β̃1 β β 11 i =− [η̃]α = − h iα = − h ; 12(α) = (α) (α) (α) 2β22 2β21 2β21 ; 2β22 2 β̃2 " # (α) (α) β β = − 12(α) ; − 11(α) 2β21 2β22 (96) Dessa maneira, os α-níveis obtidos foram denominados de intervalos de confiança fuzzy com α% de confiança para o ponto crítico fuzzy. A Figura 5 apresenta um fluxograma referente a análise fuzzy 1. 60 Análise fuzzy 1 Modelo de regressão quadrática ŷ = βˆ0 + βˆ1x + βˆ2 x 2 Estimativas β̂ 0 β̂1 β̂ 2 Números fuzzy β0 β1 β2 Modelo fuzzy de regressão quadrática y = β0 + β1x + β2 x 2 Ponto crítico fuzzy β η = − 1 2β 2 Intervalo de confiança fuzzy para o ponto crítico fuzzy α [η] Figura 5 Fluxograma referente à análise fuzzy 1 61 3.4.2 Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de Buckley A metodologia de Buckley (2005) consiste em considerar uma estimativa pontual de um determinado parâmetro como incerta, sendo que tal incerteza é definida com base em um intervalo de confiança convencional. Para isso, é estabelecida uma relação entre um conjunto composto por todos intervalos de confiança convencionais 100 (1 − β) %, com 0 < β 6 1, e α-níveis, com 0 < α 6 1 . Dessa maneira, o conjunto de intervalos de confiança convencionais é transformado em um número fuzzy, sendo denominado de estimador fuzzy. Um estimador fuzzy do ponto crítico pode ser obtido de acordo com o seguinte intervalo de confiança convencional: IC1−β (η) = η̂ ± t(v,β/2) p V (η̂) (97) em que v é o grau de liberdade do resíduo do modelo de regressão quadrática e V (η̂) = V1 − ! β̂1 2β̂2 h i h i !2 h i V 2Cov β̂ β̂ , β̂ V β̂ 2 1 2 1 1 = + − 4 µβ̂2 µβ̂1 µβ̂2 µ2 µ2 µβ̂1 β̂1 β̂2 como a variância do ponto crítico de acordo com Mood, Graybill e Boes (1974). Com isso, obteve-se o seguinte estimador fuzzy para η em termos de αníveis: Ê = [E1 (α) ; E2 (α)] (98) i h p p Ê = η̂ − t(v,α/2) V (η̂); η̂ + t(v,α/2) V (η̂) (99) α α para 0 < α 6 1. Dessa maneira, considerando as estimativas obtidas para os parâmetros via método dos mínimos quadrados, uma estimativa fuzzy do ponto crítico foi obtida 62 por meio do software MAPLE 12, cuja rotina está apresentada no APÊNDICE D. A Figura 6 apresenta um fluxograma referente a análise fuzzy 2. 63 Análise fuzzy 2 Intervalo de confiança convencional IC1− β (η ) Conjunto de intervalos de confiança convencionais ࢻ-níveis Estimador fuzzy do ponto crítico = ηˆ − t ( v,α 2) V (ηˆ ) ;ηˆ + t ( v,α 2) V (ηˆ ) α ( Eˆ ) Figura 6 Fluxograma referente à análise fuzzy 2 64 4 RESULTADOS E DISCUSSÃO De acordo com o método dos mínimos quadrados, o modelo de regressão quadrática ajustado foi igual a ŷ = 73,1929 + 1,1413x − 0,0035x2 , com R2 = 0,9864, que explica 98,64% da variabilidade dos dados, denotando um modelo adequado para os dados de produção de matéria seca (y) em função das doses crescentes (x) de adubação fosfatada, e σ 2 = σ̂ 2 = 182,45. A estimativa pontual do ponto crítico foi de 163,0429 mg.kg−1 de adubo fosfatado, resultando na produção máxima de matéria seca. 4.1 Análise bootstrap As Tabelas 2 a 5 apresentam, como exemplos, as 1a e 2a amostras boots trap para as variâncias teóricas σ 2 10 = 18,25 e σ 2 2 = 91,23, assim como as estimativas obtidas para cada parâmetro do modelo e os intervalos de confiança, considerando as fórmulas de variâncias de Mood, Graybill e Boes (1974), IC1r , dada em (74), e de D’Aulísio, Pimentel-Gomes e Nogueira (1976), IC2r , dada em (75), para o ponto crítico. 65 Tabela 2 Valores estimados da produção de matéria seca na primeira amostra bootstrap para variância teórica igual a 18,25 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC11 e IC21 ) para o ponto crítico. Doses (x) 0 50 100 150 200 Parâmetro β0 β1 β2 η Tabela 3 1 76,2735 122,0854 155,1065 164,9605 161,6751 Estimativas 74,4186 1,1481 -0,0036 Esimativa 160,4942 Repetição Média 2 3 4 (ȳ) 81,6374 74,6918 68,4722 75,2687 123,6193 116,5861 121,5176 120,9521 155,0959 149,3904 157,0042 154,1493 178,2223 160,6313 164,8602 167,1686 157,2155 167,8994 154,5995 160,3474 IC [69,0783; 79,7589] [1,0216; 1,2746] [-0,0042; -0,0030] IC21 IC11 [149,0735; 171,9149] [128,0329; 192,9555] Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 18,25 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC12 e IC22 ) para o ponto crítico. Doses (x) 0 50 100 150 200 Parâmetros β0 β1 β2 η 1 75,2814 119,8854 148,9168 165,9986 175,2504 Esimativas 74,4201 1,1509 -0,0034 Esimativa 168,0744 Repetição Média 2 3 4 (ȳ) 72,8466 75,0123 66,3474 72,3719 127,1537 125,2472 116,6153 122,2254 152,8784 152,2791 150,3163 151,0977 167,9876 172,8200 173,5792 170,0964 164,3434 156,0028 164,2843 164,9702 IC [67,5066; 77,3336] [1,0345; 1,2673] [-0,0040; -0,0029] IC12 IC22 [155,9744; 180,1743] [135,8293; 200,3195] 66 Tabela 4 Valores estimados da produção de matéria seca na primeira amostra bootstrap para variância teórica igual a 91,23 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC11 e IC21 ) para o ponto crítico. Doses (x) 0 50 100 150 200 Parâmetro β0 β1 β2 η Tabela 5 1 77,1017 109,8889 125,8993 148,7863 160,9462 Esimativas 76,0534 1,0546 -0,0032 Esimativa 166,6423 Repetição Média 2 3 4 (ȳ) 68,6865 72,0974 83,4879 75,3434 126,4010 137,1387 120,4432 123,4680 145,9273 155,8368 157,7338 146,3493 170,7925 166,2197 174,8097 165,1521 160,3773 154,0380 164,3993 159,9402 IC [65,6905; 86,4163] [0,8091; 1,3001] [-0,0043; -0,0020] IC21 IC11 [139,5185; 193,7660] [93,5125; 239,7720] Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 91,23 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos de confiança (IC12 e IC22 ) para o ponto crítico. Doses (x) 0 50 100 150 200 Parâmetro β0 β1 β2 η 1 71,3733 107,3854 149,1595 145,3169 155,0243 Estimativas 67,5119 1,1723 -0,0034 Estimativa 172,9682 Repetição Média 2 3 4 (ȳ) 73,1046 64,4405 72,9719 70,4726 122,8377 102,3631 104,9031 109,3723 147,4707 175,1896 159,9557 157,9439 171,7679 171,9503 174,7480 165,9458 180,0145 170,2966 157,9658 165,8253 IC [56,6297; 78,3941] [0,9145; 1,4301] [-0,0046; -0,0022] IC12 IC22 [144,2482; 201,6882] [99,2959; 246,6404] 67 Dando continuidade ao processo de reamostragem, a Tabela 6 apresenta os valores médios das estimativas obtidas nas 4000 reamostragens para o ponto crítico (η) e para os cinco diferentes intervalos de confiança propostos (IC1 , IC2 , IC3 , IC4 e IC5 ) em função das diferentes variâncias teóricas do erro experimental. Constata-se que as estimativas do ponto crítico não se alteraram muito, sendo que ligeiro aumento ocorreu com o incremento da variância teórica. Os resultados da Tabela 6 mostram que a variância residual afeta grandemente na estimação dos IC para o ponto crítico. À medida em que a variância foi aumentada, os IC tenderam a apresentar maior amplitude, sugerindo a existência de menor precisão. Tal resultado também foi verificado por Nunes et al. (2004), ao trabalharem com diferentes fórmulas de variância do ponto crítico na avaliação da produção máxima de cultura de algodão. Esse fato vem alertar os pesquisadores na condução do experimento com adubação, na qual tem-se o interesse de estimar a dose ótima. Para se ter uma confiança maior na estimação e provavelmente na indicação dessa dose ótima, maior precisão deve ser buscada no experimento. Dentre os intervalos de confiança IC1 e IC2 , que consideram a média dos intervalos obtidos ao longo das amostras bootstrap, o intervalo IC1 apresenta maior precisão; isso pode ser verificado pela menor amplitude do intervalo, talvez devido ao fato de que o seu estimador leva em consideração a covariância entre β1 e β2 . De acordo com o método bootstrap-t, o intervalo de confiança IC5 , que adota a fórmula da variância do ponto crítico proposta por D’Aulísio, PimentelGomes e Nogueira (1976), apresenta maior precisão nas diferentes variâncias teóricas. Dentre os intervalos analisados, o intervalo IC3 , que considera a fórmula da variância comum, apresenta maior precisão, sendo plausível de uso apenas nos estudos simulados, já que seu cálculo é realizado com as estimativas obtidas em cada reamostragem. Tabela 6 η̂ 163,3530 163,4712 163,7060 163,8023 164,3920 166,3862 168,8741 163,3530 163,4712 163,7060 163,8023 164,3920 166,3862 168,8741 Variância teórica 18,25 22,81 30,41 45,61 91,23 182,45 273,68 18,25 22,81 30,41 45,61 91,23 182,45 273,68 IC1 [154,8201; 174,6262] [153,5733; 175,5041] [151,7800; 177,4687] [149,1687; 181,0721] [142,4399; 188,9732] [131,9563; 203,6495] [121,0386; 217,8047] IC4 [136,6507; 198,6299] [137,8673; 201,6671] [137,9856; 200,6145] [138,6562; 202,1101] [140,8762; 204,3448] [144,4611; 207,6514] [146,6550; 208,9989] IC2 [137,6701; 191,7763] [134,5575; 194,5199] [129,5610; 199,6877] [121,8582; 208,3826] [103,4622 227,9509] [75,2951; 260,3107] [50,3690; 288,4744] IC5 [134,4101; 196,3963] [135,3851; 198,6848] [134,8911; 197,3944] [134,9878; 198,0169] [135,8579; 198,8485] [138,6340; 199,7231] [140,2485; 199,2429] IC3 [155,1041; 174,3423] [153,8705; 175,2070] [152,4681; 176,7806] [149,6936; 180,5473] [142,5117; 188,9015] [132,3825; 203,2233] [117,5615; 221,2819] Valores médios do ponto crítico e dos diferentes intervalos de confiança, de acordo com as variâncias teóricas consideradas, utilizando o método de reamostragem. 68 69 A Tabela 7 apresenta os resultados referentes ao teste de assimetria assintótico (g1 ) e excesso de curtose assintótico (g2 ), além da estatística W de ShapiroWilk para os valores do ponto crítico nas diversas simulações. As estimativas dos coeficientes de assimetria e curtose aumentaram com o incremento da variância teórica. Os testes de assimetria e curtose indicam que, com o aumento da variância teórica, as estimativas do ponto crítico tendem a não seguir ao de uma distribuição normal, sendo tal resultado verificado pela estatística W de Shapiro-Wilk. As Figuras 7 a 13 apresentam os histogramas dos valores simulados do ponto crítico, considerando as diferentes variâncias teóricas. Pode-se visualizar que nas menores variâncias, os gráficos sugerem certa aproximação da curva normal. Pode-se observar que a partir da variância teórica igual a 30,41, o ponto crítico apresenta maior tendência a uma distribuição de frequência com assimetria positiva e formato do tipo leptocúrtico. Tabela 7 Resultados para o teste de assimetria assintótico (g1 ), excesso de curtose assintótico (g2 ) e estatística W de Shapiro-Wilk referentes aos valores simulados do ponto crítico. Variância teórica σ 2 18,25 22,81 30,41 45,61 91,23 182,45 273,68 *significativo a 5% Assimetria (g1 ) 0,41704∗ 0,4337∗ 0,4372∗ 0,5884∗ 1,1794∗ 1,4561∗ 3,2498∗ Curtose (g2 ) 0,31307∗ 0,5822∗ 0,2574∗ 0,9597∗ 3,6228∗ 4,2560∗ 25,1194∗ W 0,9904∗ 0,9899∗ 0,9890∗ 0,9823∗ 0,9437∗ 0,9151∗ 0,7858∗ 70 Figura 7 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 18,25 Figura 8 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 22,81 71 Figura 9 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 30,41 Figura 10 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 45,61 72 Figura 11 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 91,23 Figura 12 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 182,45 73 Figura 13 4.2 Distribuição de frequência dos valores simulados do ponto crítico para variância teórica igual a 273,68 Análise bayesiana A partir da distribuição a posteriori conjunta dada em (83), a distribuição a posteriori condicional completa para o parâmetro β0 é dada por: n 2 1 X 2 p β0 |β2 ,η,σ ,y ∝ exp − 2 yi − β0 + 2β2 ηxi − β2 x2i 2σ i=1 ) ( 1 . exp − 2 [β0 − µβ0 ]2 2σβ0 ( ) Fazendo yi∗ = yi + 2β2 ηxi − β2 x2i , obtém-se: n 1 X ∗ ∝ exp − 2 [yi − β0 ]2 2σ ( i=1 ) ( 1 . exp − 2 [β0 − µβ0 ]2 2σβ0 ) . (100) 74 Desenvolvendo-se os quadrados, tem-se: n 1 X ∗2 ∝ exp − 2 yi − 2yi∗ β0 + β02 2σ ( i=1 ) ( 1 . exp − 2 β02 − 2β0 µβ0 + µ2β0 2σβ0 ) Resolvendo o somatório e rearranjando-se os termos, considerando que os termos que não dependem de β0 são constantes, obtém-se: ) " # n X 1 1 ∝ exp − 2 −2β0 yi∗ + nβ02 − β02 − 2β0 µβ0 + µ2β0 2 2σ 2σ β0 i=1 ( " #) n X 1 ∝ exp − 2 2 −2β0 σβ20 yi∗ + nβ02 σβ20 + β02 σ 2 − 2β0 σ 2 µβ0 + σ 2 µ2β0 2σ σβ0 i=1 ( ( " 1 ∝ exp − 2 2 β02 nσβ20 + σ 2 − 2β0 2σ σβ0 σβ20 n X #) ! yi∗ 2 + σ µβ0 + σ 2 µ2β0 i=1 2 n P 2 ∗ 2 σβ0 yi + σ µβ0 nσ 2 + σ 2 β0 i=1 β − ∝ exp − 0 2σ 2 σβ20 nσβ20 + σ 2 que é o núcleo de uma distribuição normal. Dessa maneira, a distribuição a posteriori condicional completa para β0 é uma normal: β0 |β2 ,η,σ 2 ,y ∼ N σβ20 n P i=1 yi + 2β2 ηxi − β2 x2i + σ 2 µβ0 nσβ20 + σ 2 σ 2 σβ20 , 2 nσβ0 + σ 2 (101) A distribuição a posteriori condicional completa para o parâmetro β2 é 75 dada por: n 2 1 X p β2 |β0 ,η,σ 2 ,y ∝ exp − 2 yi − β0 + 2β2 ηxi − β2 x2i 2σ i=1 ) ( 1 2 . exp − 2 [β2 − µβ2 ] 2σβ2 ( ) . (102) Fazendo yi∗ = yi − β0 , obtém-se: n 2 1 X ∗ ∝ exp − 2 yi + 2β2 ηxi − β2 x2i 2σ ( ) i=1 n 1 X ∗ ∝ exp − 2 [yi + β2 xi (2η − xi )]2 2σ ( ) i=1 ( ) ( ) 1 . exp − 2 [β2 − µβ2 ]2 2σβ2 1 . exp − 2 [β2 − µβ2 ]2 2σβ2 Desenvolvendo-se os quadrados, tem-se: ) n i 1 X h ∗2 yi + 2yi∗ β2 xi (2η − xi ) + β22 x2i (2η − xi )2 . ∝ exp − 2 2σ i=1 ( ) 1 2 2 . exp − 2 β2 − 2β2 µβ2 + µβ2 2σβ2 ( Resolvendo o somatório e rearranjando-se os termos, considerando que os termos que não dependem de β2 são constantes, obtém-se: " # n n X X 1 yi∗ xi (2η − xi ) + β22 x2i (2η − xi )2 ∝ exp − 2 2β2 2σ i=1 i=1 ) 1 − 2 β22 − 2β2 µβ2 + µ2β2 2σβ2 ( 76 ou " n X 1 2 yi∗ xi (2η − xi )+ ∝ exp − 2 2 2β2 σβ2 2σ σβ2 i=1 ( +β22 σβ22 n X #) x2i (2η − xi )2 + β22 σ 2 − 2β2 σ 2 µβ2 + σ 2 µ2β2 i=1 ou ainda ( " 1 ∝ exp − 2 2 β22 2σ σβ2 −2β2 −σβ22 n X σβ22 n X ! x2i (2η − xi )2 + σ 2 − i=1 #) ! yi∗ xi (2η 2 − xi ) + σ µβ2 + σ 2 µ2β2 i=1 reagrupando n P 2 x2i (2η − xi )2 + σ 2 σβ2 i=1 ∝ exp − 2σ 2 σβ22 β2 − n P yi∗ xi (2η − xi ) + σ 2 µβ2 i=1 n P σβ22 x2i (2η − xi )2 + σ 2 −σβ22 i=1 que é o núcleo de uma distribuição normal. Dessa maneira, a distribuição a posteriori condicional completa para β2 é uma normal: 2 β2 |β0 ,η,σ ,y ∼ N −σβ22 n P (yi − β0 ) xi (2η − xi ) + σ 2 µβ2 i=1 σβ22 n P i=1 , x2i (2η 2 − xi ) + σ 2 σβ22 , σβ22 n P i=1 x2i (2η − xi )2 + σ 2 σ2 (103) A distribuição a posteriori condicional completa para o parâmetro η é dada 77 por: n ( 2 1 X p η|β0 ,β2 ,σ 2 ,y ∝ exp − 2 yi − β0 + 2β2 ηxi − β2 x2i 2σ i=1 1 2 . exp − 2 [η − µη ] 2ση ) . (104) Fazendo yi∗ = yi − β0 − β2 x2i , obtém-se: n 1 X ∗ ∝ exp − 2 [yi + 2β2 ηxi ]2 2σ ( ) i=1 1 . exp − 2 [η − µη ]2 2ση Desenvolvendo-se os quadrados, tem-se: n ( 1 X ∗2 ∝ exp − 2 yi + 2yi∗ β2 ηxi + 4β22 η 2 x2i 2σ i=1 1 . exp − 2 η 2 − 2ηµη + µ2η 2ση ) . Resolvendo o somatório e rearranjando-se os termos, considerando que os termos que não dependem de η são constantes, obtém-se: " # n n X X 1 1 2 2 ∗ 2 2 2 ∝ exp − 2 2β2 η yi xi + 4β2 η xi − 2 η − 2ηµη + µη 2σ 2ση ( i=1 i=1 ou " n X 1 yi∗ xi + ∝ exp − 2 2 2β2 ηση2 2σ ση ( i=1 + 4β22 η 2 ση2 n X i=1 #) x2i 2 2 2 + η σ − 2ησ µη + σ 2 µ2η 78 agrupando 1 ∝ exp − 2 2 2σ ση −2η " η2 −β2 ση2 4β22 ση2 n X ! x2i + σ 2 − i=1 n X ! yi∗ xi 2 #) + + σ µη σ 2 µ2η i=1 reagrupando, obtém-se: 2 n n P P 2 2 2 2 2 ∗ 2 −β2 ση yi x i + σ µη xi + σ 4β2 ση i=1 i=1 ∝ exp − n η − P 2σ 2 ση2 2σ2 4β x2i + σ 2 2 η i=1 que é o núcleo de uma distribuição normal. Dessa maneira, a distribuição a posteriori condicional completa para η é uma normal: −β2 ση2 n P yi − β0 − β2 x2i xi + σ 2 µη i=1 η|β0 ,β2 ,σ 2 ,y ∼ N 4β22 ση2 , n P i=1 x2i , + σ2 (105) σ 2 ση2 n P 2 2 2 2 4β2 ση xi + σ i=1 A distribuição a posteriori condicional completa para o parâmetro σ 2 é dada por: ( n 1 X exp − 2 p σ |β0 ,β2 ,η,y ∝ σ [yi − β0 + 2β2 ηxi − 2σ i=1 (106) o β 2 −β2 x2i . exp − 2 σ 2 n 2 − 2 −α−1 Dessa maneira, rearranjando-se os termos, a distribuição a posteriori con- 79 dicional completa para σ 2 é uma gama inversa: ∝ σ n 2 −( +α+1) 2 ( 1 exp − 2 σ n 2 1 X yi − β0 + 2β2 ηxi − β2 x2i + β 2 !) i=1 n σ 2 |β0 ,β2 ,η,y ∼ IG α∗ = + α, 2 ! n 1 X ∗ 2 2 ,β = yi − β0 + 2β2 ηxi − β2 xi + β 2 i=1 (107) Como as distribuições a posteriori condicionais completas são de formas conhecidas, no caso, distribuição normal para β0 , β2 e η e, distribuição gama inversa para σ 2 , utilizou-se o algoritmo Gibbs para amostrar tais distribuições. A Tabela 8 apresenta os critérios de Raftery e Lewis e, Geweke, utilizados na análise da convergência das cadeias de cada um dos parâmetros. De acordo com o critério de Raftery e Lewis, os fatores de dependência (FD) de cada parâmetro apresentam valores menores do que cinco, denotando a convergência das cadeias. Pelo critério de Geweke, observa-se que os valores de p são maiores que o nível de significância pré-fixado de 5%, não apresentando, dessa maneira, evidências contra a convergência. Tabela 8 Estimativas dos critérios de Raftery e Lewis e, Geweke, utilizados na avaliação da convergência das cadeias amostradas. Parâmetros β0 β2 η σ2 Raftery e Lewis (FD) 1,0149 1,0149 0,9904 0,9824 Geweke (valor p) 0,4230 0,9748 0,3514 0,6503 Os resultados apresentados na Tabela 8 podem ser confirmados por meio da visualização gráfica do traço da cadeia, nas Figuras 14 a 17, justificando que as cadeias se encontram em equilíbrio. Ainda nas Figuras 14 a 17, têm-se os gráficos 80 das distribuições a posteriori marginais para cada parâmetro. A Tabela 9 apresenta as média a posteriori para os parâmetros, assim como o intervalo de confiança bayesiano (HPD) com coeficiente de credibilidade de 95% para cada parâmetro do modelo. O intervalo de confiança bayesiano encontrado para η apresenta alta precisão, com magnitude igual a 0,1217. Intervalos de confiança bayesiano com alta precisão também foram encontrados por Buonaccorsi e Gatsonis (1988), na qual utilizaram prioris normais para avaliar a razão de coeficientes de modelos de regressão linear simples no estudo de biodisponibilidade de nutrientes em alimentos. Tabela 9 Valores médios obtidos pela distribuição a posteriori dos parâmetros e seus respectivos limites inferior e superior dos intervalos de confiança bayesianos (HPD). Parâmetros Média β0 β2 η σ2 73,0006 -0,0035 162,9932 180,0873 HPD LI LS 72,9395 73,0614 -0,0038 -0,0032 162,9295 163,0547 107,2225 267,1666 81 Figura 14 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro β0 Figura 15 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro β2 82 Figura 16 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro η Figura 17 Traço da cadeia e gráfico da distribuição a posteriori marginal para o parâmetro σ 2 83 4.3 4.3.1 Análise fuzzy Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy A Tabela 10 apresenta as estimativas dos parâmetros do modelo de regressão quadrática por meio do método dos mínimos quadrados e os erros padrão das estimativas, considerando os dados de produção de matéria seca em função de diferentes doses de adubação fosfatada. Tabela 10 Estimativas dos parâmetros do modelo de regressão quadrática e respectivos erros padrão das estimativas. Parâmetro β0 β1 β2 Estimativa 73,1929 1,1413 -0,0035 Erro padrão 6,0839 0,1441 0,0007 Considerando os erros padrão das estimativas como incertezas no modelo fuzzy de regressão quadrática, as seguintes funções de pertinência triangulares foram obtidas: µβ̃0 (a) = µβ̃1 (b) = 0, se a−67,1090 6,0839 , 79,2768−a 6,0839 , a 6 67,1090 se 67,1090 < a 6 73,1929 se 73,1929 6 a < 79,2768 0, se a > 79,2768 0, se b 6 0,9972 b−0,9972 0,1441 , 1,2854−b 0,1441 , se 0,9972 < b 6 1,1413 se 1,1413 6 b < 1,2854 0, se b > 1,2854 (108) (109) 84 µβ̃2 (c) = 0, se c+0,0042 0,0007 , −0,0028−c 0,0007 , c 6 −0,0042 se −0,0042 < c 6 −0,0035 se −0,0035 6 c < −0,0028 0, se (110) c > −0,0028 A Figura 18 apresenta a solução do modelo fuzzy de regressão quadrática através do princípio de extensão de Zadeh, em que a escala entre 0 e 1 representa os graus de pertinência de y (produção de matéria seca, g.vaso−1 ), sendo que a região amarela representa os valores de y com pertinência em torno de 1. Pode-se observar que para cada valor de x (dose de adubação fosfatada, mg.kg−1 ) têm-se incertezas quanto ao valor de y. Como exemplo, em x = 160, tem-se pertinência em torno de 0 para y = 120 e, para y = 165, tem-se pertinência em torno de 1. Ainda pode-se verificar que incertezas quanto a y são menos presentes para valores menores de x. A Figura 19 apresenta a solução defuzzificada do modelo fuzzy pelo método do Centro de Gravidade e a solução clássica obtida pelo método dos mínimos quadrados. 85 Figura 18 Solução do modelo fuzzy de regressão quadrática, considerando os dados de produção de matéria seca (y) em função de diferentes doses de adubação fosfata (x) Figura 19 Solução defuzzificada do modelo fuzzy de regressão quadrática e solução clássica obtida pelo método dos mínimos quadrados, considerando os dados de produção de matéria seca (y) em função de diferentes doses de adubação fosfata (x) 86 De acordo com os números fuzzy β̃1 e β̃2 , foi obtido o ponto crítico fuzzy em termos de α-nível: [0,1441α + 0,9972; −0,1441α + 1,2854] [η̃]α = = [0,0014α + 0,0056; −0,0014α + 0,0084] 0,1441α + 0,9972 −0,1441α + 1,2854 = ; −0,0014α + 0,0084 0,0014α + 0,0056 (111) Expressando [η̃]α em termos de função de pertinência, obteve-se: µη̃ (x) = 0, se 0,9972−0,0084x −0,1441−0,0014x , 1,2854−0,0056x 0,1441+0,0014x , x 6 118,7143 se 118,7143 < x 6 163,0429 se 163,0429 6 x < 229,5357 0, se (112) x > 229,5357 A Figura 20 apresenta a função de pertinência de η̃, representado as incertezas quanto ao ponto crítico. Como exemplo, para um ponto crítico igual a 180, tem-se grau de pertinência igual a 0,70 no conjunto η̃, sendo que para um ponto crítico igual a 125, tem-se grau de pertinência igual a 0,17. 87 Figura 20 Representação gráfica da função de pertinência do ponto crítico fuzzy A Tabela 11 apresenta intervalos de confiança fuzzy para o ponto crítico fuzzy para α-níveis entre 0,20 e 1,00 . Tem-se, por exemplo, de acordo com a definição de α-nível, valores de x entre 160,4095 e 165,7294 pertencem ao conjunto clássico [η̃]0,95 ; nesse caso, o intervalo [η̃]0,95 = [160,4095; 165,7294] é definido como um intervalo de confiança fuzzy com 95% de confiança para o ponto crítico fuzzy. Com isso, têm-se 95% de possibilidade de obter aproximadamente a produção máxima de matéria seca considerando doses entre 160,4095 e 165,7294 mg.kg−1 de adubação fosfatada. Para α = 1,00, em que se tem a pertinência máxima, [η̃]1,00 = [163,0429; 163,0429] representa um intervalo de confiança fuzzy com 100% de confiança para o ponto crítico fuzzy, sendo que diante das incertezas consideradas, uma dose igual a 163,0429 mg.kg−1 de adubação fosfatada proporciona aproximadamente a produção máxima de matéria seca, sendo que tal dose corresponde a estimativa pontual obtida utilizando o método dos mínimos quadrados. Como a maior dose de adubação fosfatada utilizada no experimento foi igual a 200 mg.kg−1 , os intervalos de confiança fuzzy com α-níveis menores do que 0,40 não fazem sentido prático, pois extrapolam o limite superior utilizado. Diante dos resultados apresentados, operações intervalares fuzzy se mostram como uma alternativa apropriada para analisar estimadores, como verificado 88 por Lee (2001). Tabela 11 Limites inferior (η1α ) e superior (η2α ) do intervalo de confiança fuzzy para o ponto crítico fuzzy, considerando α-níveis entre 0,20 e 1,00. [η̃]α α 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,55 0,60 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 4.3.2 η1α 126,3571 128,3509 130,3797 132,4444 134,5459 136,6853 138,8636 141,0819 143,3413 145,6429 147,9879 150,3776 152,8132 155,2961 157,8277 160,4095 163,0429 η2α 213,7041 209,9790 206,3405 202,7857 199,3117 195,9157 192,5952 189,3477 186,1708 183,0622 180,0198 177,0414 174,1250 171,2688 168,4708 165,7294 163,0429 Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de Buckley De acordo com as estimativas dos parâmetros do modelo de regressão quadrática, considerando os dados de produção de matéria seca em função de diferentes doses de adubação fosfatada, obteve-se a estimativa fuzzy do ponto crítico em termos de α-níveis: Ê = 163,0429 − t(15,α/2) .14,3653; 163,0429 + t(15,α/2) .14,3653 (113) α em que t(v,α/2) é o valor crítico da distribuição t de Student para v = 15. 89 Por exemplo, para α = 0,95, tem-se que: Ê 0,95 = [162,1269; 163,9589] na qual, com grau de possibilidade igual a 0,95, valores do ponto crítico entre 162,1269 e 163,9589 mg.kg−1 de adubação fosfatada fornecem aproximadamente a produção máxima da cultura. A Tabela 12 apresenta a estimativa fuzzy Ê ponto crítico considerando α-níveis entre 0,65 e 1,00. α do A Figura 21 apresenta a função de pertinência da estimativa fuzzy, na qual pode-se observar que a estimativa pontual do ponto crítico obtida pelo método dos mínimos quadrados, x = η̂ = 163,0429, apresenta grau de pertinência igual a 1,00. Dessa maneira, a estimativa fuzzy oferece, com certo grau de pertinência, valores do ponto crítico que resultam aproximadamente na produção máxima da cultura. De acordo com Buckley (2005), a estimativa fuzzy do ponto crítico contém mais informações do que uma simples estimativa pontual ou intervalar convencional, sendo que a estimativa fuzzy contém a estimativa pontual η̂ e todos os 100 (1 − β) %. Tal resultado também é enfatizado por Parchami e Mashinchi (2007), na qual utilizaram a metodologia de Buckley em índices de capacidade de processos no controle da qualidade de produtos e serviços. Tabela 12 Estimativa fuzzy Ê do ponto crítico considerando α-níveis entre α 0,65 e 1,00. α Ê 0,65 0,70 0,75 0,80 0,85 0,90 0,95 1,00 [156,3916; 169,6942] [157,4004; 168,6854] [158,3807; 167,7052] [159,3383; 166,7475] [160,2788; 165,8070] [161,2069; 164,8789] [162,1269; 163,9589] [163,0429; 163,0429] α 90 Figura 21 Representação gráfica da função de pertinência da estimativa fuzzy do ponto crítico, utilizando a metodologia de Buckley 91 5 CONCLUSÃO Na estimação de intervalos de confiança para o ponto crítico do modelo de regressão quadrática, conclui-se que: 1. a metodologia bootstrap paramétrico mostrou-se como uma excelente alternativa para a construção de intervalos de confiança para o ponto crítico, cujo estimador envolve um quociente de variáveis aleatórias, e para a análise da distribuição de frequência diante de diferentes situações experimentais. Diante das simulações realizadas, sugere-se usar intervalos de confiança que consideram a covariância entre os parâmetros do modelo; 2. como alternativa a construção de intervalos de confiança convencionais, a análise bayesiana mostrou-se de fácil aplicação de acordo com as prioris adotadas para os parâmetros do modelo de regressão quadrática, sendo que o intervalo de confiança bayesiano obtido para o ponto crítico apresenta uma interpretação mais direta do que a de um intervalo de confiança convencional, pois todas as informações da inferência estão resumidas na distribuição a posteriori; 3. as incertezas incorporadas no modelo de regressão quadrática proporcionaram a obtenção do ponto crítico fuzzy, na qual por meio de operações aritméticas intervalares, resultou na construção de intervalos de confiança fuzzy satisfatórios. Diante da metodologia apresentada, o pesquisador pode analisar incertezas advindas de especialistas e dados estatísticos no modelo de regressão, e avaliar níveis de possibilidade para se obter um intervalo para o ponto crítico; 4. a metodologia de Buckley fornece uma análise mais completa de um intervalo de confiança convencional por meio de um estimador fuzzy. Dessa maneira, o pesquisador pode avaliar o comportamento de tal estimador diante de diferentes incertezas. 92 REFERÊNCIAS AKBARI, M. GH.; REZAEI, A. H. Order statistics using fuzzy random variables. Statistics and Probability Letters, n. 79, p. 1031-1037, 2009. BARGIELA, A.; PEDRYCZ, W.; NAKASHIMA, T. Multiple regression with fuzzy data. Fuzzy Sets and Systems, n. 158, p. 2169-2188, 2007. BARROS, L. C.; BASSANEZI, R. C. Tópicos de lógica fuzzy e biomatemática. 2. ed. Campinas: IMECC-UNICAMP, 2010. 404 p. BOX, G. E. P.; TIAO, G. C. Bayesian inference in statistical analysis. New York: John Wiley, 1992. 558 p. BUCKLEY, J. J. Fuzzy statistics: hypothesis testing. Soft Comput, n. 9, p. 512-518, 2005. BUONACCORSI, J. P.; GATSONIS, C. Bayesian inference for ratios of coefficients in a linear model. Biometrics, Oxford, v. 44, n. 1, p. 87-101, 1988. CASELLA, G.; BERGER, R. L. Inferência estatística. São Paulo: Cengage Learning, 2010. 588 p. CHARNET, R. et al. Análise de modelos de regressão linear com aplicação. 2. ed. Campinas: UNICAMP, 2008. 368 p. CHIB, S.; GREENBERG, E. Understanding the Metropolis-Hastings Algorithm. The American Statistician, Alexandria, v. 49, n. 4, p. 327-335, Nov. 1995. D’AULISIO, M. B. G.; PIMENTEL-GOMES, F.; NOGUEIRA, I. R. Estudo da distribuição dos pontos de máximo ou de mínimo de equações de regressão de segundo grau. Anais da Escola Superior de Agricultura "Luiz de Queiroz", Piracicaba, v. 38, p. 291-307, 1976. 93 DRAPER, N. R.; SMITH, H. Applied regression analysis. 3. ed. New York: John Wiley & Sons, 1998. 706 p. EFRON, B. Bootstrap methods: Another look at the Jackkinef. The Annals of Statistics, n. 1, p. 1-20, 1979. EFRON, B.; TIBSHIRANI, R. An introduction to the Bootstrap. London: Chapman & Hall, 1993. 436 p. FALSAFAIN, A.; TAHERI, S. M.; MASHINCHI, M. Fuzzy estimation of parameters in statistical models. International Journal of Computational and Mathematical Sciences, v. 2, n. 2, p. 79-85, 2008. FERREIRA, D. Estatística básica. 2. ed. Lavras: UFLA, 2009. 664 p. FIELLER, E. C. Some Problems in Interval Estimation. Journal of the Royal Statistical Society - Series B, v. 16, n. 2, p. 175-185, 1954. FREITAS, A. R. A variância dos pontos de máximo ou de mínimo de equações de regressão de segundo grau, 1978. 81 p. Dissertação (Mestrado em Estatística e Experimentação Agronômica) - Escola Superior de Agricultura Luiz de Queiroz. Universidade de São Paulo, Piracicaba, SP. GAMERMAN, D. Markov Chain Monte Carlo: Stochastic Simulation for Bayesian Inference. Londres: Chapman & Hall, 1997. 245 p. GELFAND, A. E.; SMITH, A. F. M. Sampling based approaches for calculating marginal desities. Journal of the American Statistical Association, London, v. 85, n. 410, p. 398-409, Jun. 1990. GEWEKE, J. Evaluating the accuracy of sampling-based approaches to the calculation of posterior moments. In: BERNARDO, J. M.; BERGER, J. O.; DAWID, A. P.; SMITH, A. F. M. (Ed.). Bayesian Statistics 4. New York: Oxford University Press, 1992. 526 p. 94 GONZALEZ-RODRIGUES, G.; COLUBI, A.; GIL, A. M. A fuzzy representation of random variables: an operacional tool in exploratory analysis and hypothesis testings. Computational Statistics and Data Analysis, n. 51, p. 163-176, 2006. GRZEGORZEWSKI, P.; HRYNIEWICZ, O. Testing statistical hypotheses in fuzzy environment. Mathware and Soft Computing, n. 4, p. 203-217, 1997. GUIDORIZZI, H. L. Um curso de cálculo Vol. 1. Rio de Janeiro: Livros Técnicos e Científicos, 2001. 658 p. HASTING, W. K. Monte Carlos Sampling methods using Markov chains and their applications. Biometrika, London, v. 57, n. 1, p. 97-109, 1970. HIRSCHBERG, J. G.; LYE, J. N. Inferences for the extremum of quadratic regression models. Research paper/ The University of Melbourne/ Department of Economics, Melbourne, n. 906, p. 1-23, 2005. HOFFMANN, R., VIEIRA, S. Análise de regressão: uma introdução à econometria. 3. ed. São Paulo: HUCITEC, 1998. 379 p. JAFELICE, R. M. Modelagem fuzzy para dinâmica de transferência de soropositivos para HIV em doença plenamente manifesta. 2004. 187 p. Tese (Doutorado em Engenharia Elétrica) - Faculdade de Engenharia Elétrica e Computação. Unversidade Estadual de Campinas, Campinas, SP. JEFFREYS, H. Theory of probability. Oxford: Claredon, 1961. 325 p. KUTNER, M. H.; NACHTSHEIM, C. J.; NETER, J.; LI, W. Applied linear statistical models. 5. ed. Boston: McGraw-Hill, 2005. 1396 p. LEE, H. T. Cpk index estimation using fuzzy numbers. European Journal of Operational research, v. 129, p. 683-688, 2001. 95 LIMA, E. L. Análise real - Volume 1. 10. ed. Rio de Janeiro: IMPA, 2009. 189 p. MAMDANI, E. H. Applications of fuzzy algorithms for control of a simple ynamic plant. Proceedings of the IEEE, New York, v. 121, n. 12, p. 1585-1588, 1974. MELO, G. J. A. Princípio de extensão de Zadeh aplicado a funções não monótonas com dois parâmetros fuzzy. 2009. 69 p. Dissertação (Mestrado em Engenharia de Sistemas) - Universidade Federal de Lavras, Lavras, MG. MISSIO, M.; BARROS, L. C. Modelo probabilístico para uma variável fuzzy. Biomatemática, Campinas, v. 19, p. 25-38, Nov. 2009. MOOD, A. M.; GRAYBILL, F. A.; BOES, D.C. Introduction to the theory of statistics. 3. ed. Tokio: McGraw-Hill, 1974. 564 p. NUNES, C. C. F. et al. Variâncias do ponto crítico de equações de regressão quadrática. Ciência e Agrotecnologia, Lavras, v. 28, n. 2, p. 389-396, 2004. PARCHAMI, A.; MASHINCHI, M. Fuzzy estimation for process capability indices. Information Sciences, v. 177, p. 1452-1462, 2007. PAULINO, C. D.; TURKMAN, M. A.; MURTEIRA, B. Estatística Bayesiana. Lisboa: Fundação Calouste Gulbenkian, 2003. 446 p. PEDRYCZ, W.; GOMIDE, F. An introduction to fuzzy sets: analysis and design. Cambridge: MIT, 1998. 461 p. PIRES, D. M. Implementação computacional do princípio de extensão de Zadeh. 2010. 59 p. Dissertação (Mestrado em Engenharia de Sistemas) Universidade Federal de Lavras, Lavras, MG. 96 RAFTERY, A. L.; LEWIS, S. Comment: one long run with diagnostics: implementation strategies for Markov chain Monte Carlo. Statistical Science, Hayward, v. 7, n. 4, p. 493-497, Nov. 1992. R DEVELOPMENT CORE TEAM (2012). R: A language and enviroment for statistical computing. Disponível em: http://www.R-project.org. Acesso em: 20 Mai. 2012. SANTOS, I. P. A. et al. Influência do fósforo, micorriza e nitrogênio no conteúdo de minerais de Brachiaria brizantha e Arachis pintoi consorciados. Revista Brasileira de Zootecnia, v. 31, n. 2, p. 605-616, 2002. SEARLE, S. R. Linear Models. New York: John Wiley, 1971. 532 p. SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 7. ed. Ames: Iowa State University, 1980. 507 p. TAHERI, S. M. Trends in fuzzy statistics. Austrian Journal of Statistics, v. 32, n. 3, p. 239-257, 2003. TANAKA, K. An introduction to fuzzy logic for practical applications. Tokyo: Springer, 1997. 138 p. TANAKA, H.; UEJIMA, S.; ASAI, K. Linear regression analysis with fuzzy model. IEEE Transactions on Systems, n. 6, p. 903-907, 1982. TSOUKALAS, C. D.; UHRIG, M. A. Fuzzy and neural approaches in engineering. New York: John Wiley, 1997. 587 p. WU, H. C. Fuzzy estimates of regression parameters in linear regression models for imprecise input and output data. Computational Statistics and Data Analysis, n. 42, p. 203-217, 2003. 97 ZADEH, L. A. Fuzzy Sets. Journal Information and Control, n. 8, p. 338-353, 1965. ——· Fuzzy Sets as a basis for a theory of possibility. Fuzzy Sets and Systems, n. 1, p. 3-28, 1978. ——· Probability measures of fuzzy events. Journal of Mathematical Analysis and Applications, v. 23, n. 2, p. 421-427, 1968. 98 APÊNDICE A - Rotina R, programa utilizado para a análise bootstrap paramétrico. #Número de r e a m o s t r a g e n s b o o t s t r a p B<−4000 # Variância teórica s2T < −18.25 # Dados o r i g i n a i s d o s e s <−c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 5 0 , 1 5 0 , 1 5 0 , 150 ,200 ,200 ,200 ,200) p r o d u c a o <−c ( 7 6 , 8 1 , 9 1 , 5 7 , 1 1 5 , 1 1 9 , 1 2 4 , 1 0 2 , 1 2 9 , 1 6 7 , 1 5 0 , 1 7 0 , 160 ,189 ,170 ,165 ,156 ,174 ,160 ,150) r e g <−lm ( p r o d u c a o ~ d o s e s + I ( d o s e s ^ 2 ) ) a0<−r o u n d ( r e g $ c o e f f [ 1 ] , 4 ) b0<−r o u n d ( r e g $ c o e f f [ 2 ] , 4 ) c0<−r o u n d ( r e g $ c o e f f [ 3 ] , 4 ) e t a <−r o u n d ( b0 /( −2 * c0 ) , 4 ) X<−c b i n d ( r e p ( 1 , 2 0 ) , c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 150 ,150 ,150 ,150 ,200 ,200 ,200 ,200) , c (0 ,0 ,0 ,0 ,50^2 ,50^2 ,50^2 , 50^2 ,100^2 ,100^2 ,100^2 ,100^2 ,150^2 ,150^2 ,150^2 ,150^2 ,200^2 , 200^2 ,200^2 ,200^2)) iXX<− s o l v e ( t (X)%*%X) y e s t <− m a t r i x ( , 5 , 4 ) a e s t <−b e s t <−c e s t <− e t a e s t <− v e c t o r ( ) sd1 <−quan1 <−LI1 <−LS1<−AMP1<− v e c t o r ( ) sd2 <−quan2 <−LI2 <−LS2<−AMP2<− v e c t o r ( ) LIa <−LSa<− v e c t o r ( ) LIb <−LSb<− v e c t o r ( ) LIc <−LSc<− v e c t o r ( ) d o s e s 2 <−c ( 0 , 5 0 , 1 0 0 , 1 5 0 , 2 0 0 ) p r o d u c a o 0 <−c ( 7 6 , 8 1 , 9 1 , 5 7 ) p r o d u c a o 5 0 <−c ( 1 1 5 , 1 1 9 , 1 2 4 , 1 0 2 ) p r o d u c a o 1 0 0 <−c ( 1 2 9 , 1 6 7 , 1 5 0 , 1 7 0 ) p r o d u c a o 1 5 0 <−c ( 1 6 0 , 1 8 9 , 1 7 0 , 1 6 5 ) p r o d u c a o 2 0 0 <−c ( 1 5 6 , 1 7 4 , 1 6 0 , 1 5 0 ) 99 dados <−c b i n d ( p r o d u c a o 0 , p r o d u c a o 5 0 , p r o d u c a o 1 0 0 , producao150 , producao200 ) d a d o s e s <− m a t r i x ( , B , 2 0 ) c o e f <− m a t r i x ( , B , 3 ) f o r ( i i n 1 : B) { f o r ( j in 1: ncol ( dados ) ) { f o r ( k i n 1 : nrow ( d a d o s ) ) { e<−rnorm ( 1 , 0 , s q r t ( s2T ) ) y e s t [ j , k]<− a0 +b0 * d o s e s 2 [ j ] + c0 * ( ( d o s e s 2 [ j ] ) ^ 2 ) + e } } d r e s <−c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 5 0 , 1 5 0 , 150 ,150 ,200 ,200 ,200 ,200) y r e s <−c ( y e s t [ 1 , ] , y e s t [ 2 , ] , y e s t [ 3 , ] , y e s t [ 4 , ] , y e s t [ 5 , ] ) mod<−lm ( y r e s ~ d r e s + I ( d r e s ^ 2 ) ) d a d o s e s [ i ,] < − r o u n d ( c b i n d ( y r e s ) , 4 ) c o e f [ i ,] < − c b i n d ( mod$coef [ 1 ] , mod$coef [ 2 ] , mod$coef [ 3 ] ) a e s t [ i ]<− r o u n d ( mod$coef [ 1 ] , 4 ) b e s t [ i ]<− r o u n d ( mod$coef [ 2 ] , 4 ) c e s t [ i ]<− r o u n d ( mod$coef [ 3 ] , 4 ) e t a e s t [ i ]<− r o u n d (( − b e s t [ i ] ) / ( 2 * c e s t [ i ] ) ) f a c . d o s e s <− f a c t o r ( d r e s ) r e g <−lm ( y r e s ~ d r e s + I ( d r e s ^ 2 ) + I ( d r e s ^ 3 ) + I ( d r e s ^ 4 ) ) anova2 <−a n o v a ( r e g ) VT<−a n o v a 2 [ 5 , 3 ] * iXX L I a [ i ]<− a e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 1 , 1 ] ) ) LSa [ i ]<− a e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 1 , 1 ] ) ) LIb [ i ]<− b e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 2 , 2 ] ) ) LSb [ i ]<− b e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 2 , 2 ] ) ) L I c [ i ]<− c e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 3 , 3 ] ) ) LSc [ i ]<− c e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 3 , 3 ] ) ) # I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a p r o p o s t o p o r Mood , G r a y b i l l e Boes ( 1 9 7 4 ) s d 1 [ i ]<− s q r t ( ( 1 / 4 ) * ( ( b e s t [ i ] / c e s t [ i ] ) ^ 2 ) * ( ( VT [ 2 , 2 ] / ( b e s t [ i ] ^ 2 ) ) 100 + (VT [ 3 , 3 ] / ( c e s t [ i ] ^ 2 ) ) − ( ( 2 * VT [ 2 , 3 ] ) / ( b e s t [ i ] * c e s t [ i ] ) ) ) ) quan1 [ i ] < −(( e t a e s t [ i ]− e t a ) / s d 1 [ i ] ) LI1 [ i ]<− e t a e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * s d 1 [ i ] LS1 [ i ]<− e t a e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * s d 1 [ i ] # I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a p r o p o s t o p o r D’ A u l í s i o , P i m e n t e l −Gomes e N o g u e i r a ( 1 9 7 6 ) s d 2 [ i ]<− s q r t ( ( 1 / 4 ) * ( ( ( VT [ 2 , 2 ] ) / ( ( c e s t [ i ] ) ^ 2 ) ) + ( ( b e s t [ i ] ^ 2 ) *VT [ 3 , 3 ] ) / ( c e s t [ i ] ^ 4 ) ) ) quan2 [ i ] < −(( e t a e s t [ i ]− e t a ) / s d 2 [ i ] ) LI2 [ i ]<− e t a e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * s d 2 [ i ] LS2 [ i ]<− e t a e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * s d 2 [ i ] } # I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a p r o p o s t o p o r Mood , G r a y b i l l e Boes ( 1 9 7 4 ) IC1LI1 <−mean ( LI1 ) IC1LS1<−mean ( LS1 ) # I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a p r o p o s t o p o r D’ A u l í s i o , P i m e n t e l −Gomes e N o g u e i r a ( 1 9 7 6 ) IC2LI2 <−mean ( LI2 ) IC2LS2<−mean ( LS2 ) # I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a comum da variância IC3LI3 <−mean ( e t a e s t )−2 * s d ( e t a e s t ) IC3LS3<−mean ( e t a e s t )+ 2 * s d ( e t a e s t ) # I n t e r v a l o de c o n f i a n ç a b o o t s t r a p −t c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a p r o p o s t o p o r Mood , G r a y b i l l e Boes ( 1 9 7 4 ) VT1< −182.45 * iXX q u a n o r d 1 <− s o r t ( quan1 ) t 1 <−q u a n o r d 1 [ 0 . 9 7 5 * B] t 2 <−q u a n o r d 1 [ 0 . 0 2 5 * B] s d e t a 1 <− s q r t ( ( 1 / 4 ) * ( ( b0 / c0 ) ^ 2 ) * ( ( VT1 [ 2 , 2 ] / ( b0 ^ 2 ) ) + ( VT1 [ 3 , 3 ] / ( c0 ^ 2 ) ) − ( ( 2 * VT1 [ 2 , 3 ] ) / ( b0 * c0 ) ) ) ) IC4LI4 <−e t a −t 1 * ( s d e t a 1 ) IC4LS4<−e t a −t 2 * ( s d e t a 1 ) 101 # I n t e r v a l o de c o n f i a n ç a b o o t s t r a p −t c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a p r o p o s t o p o r D’ A u l í s i o , P i m e n t e l −Gomes e N o g u e i r a ( 1 9 7 6 ) q u a n o r d 2 <− s o r t ( quan2 ) t 1 1 <−q u a n o r d 2 [ 0 . 9 7 5 * B] t 2 2 <−q u a n o r d 2 [ 0 . 0 2 5 * B] s d e t a 2 <− s q r t ( ( 1 / 4 ) * ( ( ( VT1 [ 2 , 2 ] ) / ( ( c0 ) ^ 2 ) ) + ( ( b0 ^ 2 ) * VT1 [ 3 , 3 ] ) / ( c0 ^ 4 ) ) ) IC5LI5 <−e t a −t 1 1 * ( s d e t a 2 ) IC5LS5<−e t a −t 2 2 * ( s d e t a 2 ) # C o e f i c i e n t e s de a s s i m e t r i a e c u r t o s e ma2<−(sum ( ( e t a e s t −mean ( e t a e s t ) ) ^ 2 ) ) / l e n g t h ( e t a e s t ) ma3<−(sum ( ( e t a e s t −mean ( e t a e s t ) ) ^ 3 ) ) / l e n g t h ( e t a e s t ) ma4<−(sum ( ( e t a e s t −mean ( e t a e s t ) ) ^ 4 ) ) / l e n g t h ( e t a e s t ) a s s <−ma3 / ( ma2 ^ ( 3 / 2 ) ) c u r <−(ma4 / ( ma2 ^ ( 2 ) ) ) − 3 a s s t a b <−qnorm ( 0 . 9 5 , 0 , ( 6 / B ) ^ ( 1 / 2 ) ) c u r t a b <−qnorm ( 0 . 9 5 , 0 , ( 2 4 / B ) ^ ( 1 / 2 ) ) 102 APÊNDICE B - Rotina R, programa utilizado para a análise bayesiana. l i b r a r y ( boa ) l i b r a r y ( MCMCpack ) # Dados o r i g i n a i s d o s e s <−c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 5 0 , 1 5 0 , 1 5 0 , 150 ,200 ,200 ,200 ,200) p r o d u c a o <−c ( 7 6 , 8 1 , 9 1 , 5 7 , 1 1 5 , 1 1 9 , 1 2 4 , 1 0 2 , 1 2 9 , 1 6 7 , 1 5 0 , 1 7 0 , 160 ,189 ,170 ,165 ,156 ,174 ,160 ,150) dados <−c b i n d ( d o s e s , p r o d u c a o ) x<−d a d o s [ , 1 ] y<−d a d o s [ , 2 ] n<− l e n g t h ( y ) # Definindo as p r i o r i s meta <−163 v e t a < −0.001 mbeta0 <−73 v b e t a 0 < −0.001 mbeta2 <−−0.003 v b e t a 2 < −0.001 a l p h a <−10 b e t a <−1800 # D e f i n i n d o o número de i t e r a ç õ e s n i t <−10000 b e t a 0 <− m a t r i x ( 0 , n i t , 1 ) e t a 1 <− m a t r i x ( 0 , n i t , 1 ) b e t a 2 <− m a t r i x ( 0 , n i t , 1 ) sigma2 <− m a t r i x ( 0 , n i t , 1 ) # Chutes i n i c i a i s b e t a 0 [1 ,1] < −73 e t a 1 [1 ,1] < −163 b e t a 2 [1 ,1] < − −0.003 s i g m a 2 [1 ,1] < −182 i r <−0 103 # I n í c i o da a m o s t r a g e m for ( i r in 2: n i t ) { # para o parâmetro eta soma1<−0 soma2<−0 soma3<−0 soma4<−0 i <−0 for ( i in 1: n) { soma1 <−(y [ i ]− b e t a 0 [ i r −1,1]− b e t a 2 [ i r − 1 , 1 ] * ( x [ i ] ^ 2 ) ) * x [ i ] soma2<−soma2+soma1 soma3 <−(x [ i ] ^ 2 ) soma4<−soma4+soma3 } m e d i a e t a <−( s i g m a 2 [ i r −1 ,1] * meta−v e t a * b e t a 2 [ i r −1 ,1] * soma2 ) / ( 4 * v e t a * ( b e t a 2 [ i r − 1 , 1 ] ^ 2 ) * soma4+ s i g m a 2 [ i r − 1 , 1 ] ) d e s v e t a <− s q r t ( ( s i g m a 2 [ i r −1 ,1] * v e t a ) / ( 4 * v e t a * ( b e t a 2 [ i r − 1 , 1 ] ^ 2 ) * soma4+ s i g m a 2 [ i r − 1 , 1 ] ) ) e t a 0 <−rnorm ( 1 , mean= m e d i a e t a , s d = d e s v e t a ) e t a 1 [ i r ,1] < − e t a 0 # para o parâmetro beta0 soma5<−0 soma6<−0 i <−0 for ( i in 1: n) { soma5<−y [ i ]+ 2 * b e t a 2 [ i r −1 ,1] * e t a 1 [ i r , 1 ] * x [ i ]− b e t a 2 [ i r −1 ,1] * (x[ i ]^2) soma6<−soma6+soma5 } m e d i a b e t a 0 <−(soma6 * v b e t a 0 + s i g m a 2 [ i r −1 ,1] * mbeta0 ) / ( v b e t a 0 * n+ sigma2 [ i r −1 ,1]) d e s v b e t a 0 <− s q r t ( ( s i g m a 2 [ i r −1 ,1] * v b e t a 0 ) / ( v b e t a 0 * n+ sigma2 [ i r −1 ,1])) b e t a 0 0 <−rnorm ( 1 , mean= m e d i a b e t a 0 , s d = d e s v b e t a 0 ) b e t a 0 [ i r ,1] < − b e t a 0 0 # p a r a o p a r â m e t r o sigma2 104 soma11 <−0 soma12 <−0 i <−0 for ( i in 1: n) { soma11 <−(y [ i ]− b e t a 0 [ i r , 1 ] + 2 * b e t a 2 [ i r −1 ,1] * e t a 1 [ i r , 1 ] * x [ i ] −b e t a 2 [ i r − 1 , 1 ] * ( x [ i ] ^ 2 ) ) ^ 2 soma12<−soma12+soma11 } a l p h a a <−(n / 2 ) + a l p h a b e t a a < −0.5 * soma12+ b e t a sigma20 <−rinvgamma ( 1 , a l p h a a , b e t a a ) s i g m a 2 [ i r ,1] < − s i g m a 2 0 # para o parâmetro beta2 soma7<−0 soma8<−0 soma9<−0 soma10 <−0 i <−0 for ( i in 1: n) { soma7 <−(y [ i ]− b e t a 0 [ i r , 1 ] ) * x [ i ] * ( 2 * e t a 1 [ i r ,1] − x [ i ] ) soma8<−soma8+soma7 soma9 <−(x [ i ] ^ 2 ) * ( ( 2 * e t a 1 [ i r ,1] − x [ i ] ) ^ 2 ) soma10<−soma10+soma9 } m e d i a b e t a 2 < −(( s i g m a 2 [ i r , 1 ] * mbeta2 )−soma8 * ( v b e t a 2 ) ) / ( soma10 * ( v b e t a 2 )+ sigma2 [ i r , 1 ] ) d e s v b e t a 2 <− s q r t ( ( s i g m a 2 [ i r , 1 ] * v b e t a 2 ) / ( soma10 * ( v b e t a 2 ) + sigma2 [ i r , 1 ] ) ) b e t a 2 0 <−rnorm ( 1 , mean= m e d i a b e t a 2 , s d = d e s v b e t a 2 ) b e t a 2 [ i r ,1] < − b e t a 2 0 } #Fim da a m o s t r a g e m # A n á l i s e de C o n v e r g ê n c i a Conv <− m a t r i x ( 0 , n i t , 4 , dimnames= l i s t ( c ( 1 : n i t ) , c ( " b e t a 0 " , " e t a 1 " , " b e t a 2 " , " sigma2 " ) ) ) Conv [ ,1] < − b e t a 0 105 Conv [ ,2] < − e t a 1 Conv [ ,3] < − b e t a 2 Conv [ ,4] < − s i g m a 2 boa . r a n d l ( Conv , 0 . 0 2 5 , 0 . 0 0 5 , 0 . 9 5 , 0 . 0 0 1 ) boa . geweke ( Conv , 0 . 1 , 0 . 5 ) # Lendo o s d a d o s b e t a 0 <−a s . m a t r i x ( b e t a 0 ) e t a 1 <−a s . m a t r i x ( e t a 1 ) b e t a 2 <−a s . m a t r i x ( b e t a 2 ) sigma2 <−a s . m a t r i x ( s i g m a 2 ) # D e f i n i n d o o " burn−i n " e o " t h i n " n i t <− l e n g t h ( b e t a 0 ) burn <−3000 p u l o <−1 # D e f i n i n d o os p a r â m e t r o s b e t a 0 <−b e t a 0 [ ( b u r n + 1 ) : n i t , 1 ] e t a 1 <− e t a 1 [ ( b u r n + 1 ) : n i t , 1 ] b e t a 2 <−b e t a 2 [ ( b u r n + 1 ) : n i t , 1 ] sigma2 <−s i g m a 2 [ ( b u r n + 1 ) : n i t , 1 ] # I n í c i o do p u l o n i t _ n o v o < −(( n i t −b u r n )%/% p u l o ) b e t a 0 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 ) e t a 1 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 ) b e t a 2 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 ) s i g m a 2 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 ) # Realizando o " t h i n " ( pulo ) i n d i v i d u a l m e n t e para cada parâmetro i <−0 i r r <−0 f o r ( i r r i n 1 : ( n i t −b u r n ) ) { i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 ) i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( b e t a 0 _ p u l o [ i ,1] < − b e t a 0 [ i r r ] ) } i <−0 i r r <−0 f o r ( i r r i n 1 : ( n i t −b u r n ) ) 106 { i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 ) i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( e t a 1 _ p u l o [ i ,1] < − e t a 1 [ i r r ] ) } i <−0 i r r <−0 f o r ( i r r i n 1 : ( n i t −b u r n ) ) { i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 ) i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( b e t a 2 _ p u l o [ i ,1] < − b e t a 2 [ i r r ] ) } i <−0 i r r <−0 f o r ( i r r i n 1 : ( n i t −b u r n ) ) { i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 ) i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( s i g m a 2 _ p u l o [ i ,1] < − s i g m a 2 [ i r r ] ) } # I n t e r v a l o de c r e d i b i l i d a d e HPD p r i n t ( boa . hpd ( b e t a 0 _ p u l o , 0 . 0 5 ) ) p r i n t ( boa . hpd ( e t a 1 _ p u l o , 0 . 0 5 ) ) p r i n t ( boa . hpd ( b e t a 2 _ p u l o , 0 . 0 5 ) ) p r i n t ( boa . hpd ( s i g m a 2 _ p u l o , 0 . 0 5 ) ) 107 APÊNDICE C - Rotina C++, programa utilizado para a análise fuzzy 1. # include # include # include # include # include # include # include <iostream > <fstream > <cmath > <iomanip > < s t d i o . h> <vector > <algorithm > u s i n g namespace s t d ; struct quinteto { long double valorx , valorfx , valorpa , valorpb , valorpc ; }; struct trinca { long double valorx , valorfx , valorp ; }; double p e r t i n e n c i a ( double , double , double , double ) ; long double operaminimo ( double , double ) ; v o i d o r d e n a c a o ( v e c t o r < t r i n c a > &v e t ) ; v o i d p r i n c i p i o e x t e n s a o ( v e c t o r < t r i n c a > &v e t ) ; v o i d c o n v e x o ( v e c t o r < t r i n c a > &v e t ) ; l o n g d o u b l e c e n t r o i d e ( v e c t o r < t r i n c a > &v e t o ) ; o f s t r e a m defuzzy ( "C : / Users / Leandro F e r r e i r a / Desktop / d e f u . gnu " , i o s : : o u t ) ; o f s t r e a m p r i n c ( "C : / Users / Leandro F e r r e i r a / Desktop / e x t e n s a o . gnu " , i o s : : o u t ) ; o f s t r e a m convex ( "C : / Users / Leandro F e r r e i r a / Desktop / a p o s a l g o r i t m o . gnu " , i o s : : o u t ) ; o f s t r e a m c l a ( "C : / Users / Leandro F e r r e i r a / Desktop / c l a s s i c a . gnu " , i o s : : o u t ) ; o f s t r e a m d i f e r e a l ( "C : / Users / Leandro F e r r e i r a / Desktop / d i f e r e n c a . gnu " , i o s : : o u t ) ; o f s t r e a m e n t r a d a ( "C : / Users / Leandro F e r r e i r a / Desktop / f u z z y b r u t o . gnu " , i o s : : o u t ) ; 108 i n t main ( ) { vector < quinteto > gvetor ; vector < trinca > vetorPonto ; quinteto controltotal ; t r i n c a armazena ; d o u b l e u , p i c , a , x , c o n t , b , aa , bb , cc , o , auxa , auxb ; l o n g d o u b l e p a s s o , p a s s o 1 , p a s s o 2 , pon , c o n t a d o r , c , i n f , sup , c o n t a d o r t o t a l , z , r , i n f 1 , p i c 1 , sup1 , i n f 2 , p i c 2 , sup2 , f x ; const double loop= 200; const double i n i c i o = 0; c o u t < <" I n s i r a o i n t e r v a l o i n f e r i o r , o p i c o e o i n t e r v a l o s u p e r i o r da p e r t i n e n c i a t r i a n g u l a , p a r a c a d a p a r a m e t r o : "<< e n d l ; / / i n c e r t e z a s c o n s i d e r a d a s no modelo inf =67.109; pic =73.1929; sup =79.2768; inf1 =0.9972; pic1 =1.1413; sup1 = 1 . 2 8 5 4 ; i n f 2 = −0.0042; p i c 2 = −0.0035; s u p 2 = −0.0028; c o u t < <" D i g i t e um numero i n t e i r o de p o n t o s a v a l i a d o s ( p r e f e r e n c i a m a i s de 1 0 ) d e n t r o da função de p e r t i n e n c i a : "<< e n d l ; c i n >>pon ; / / p a s s o s d a s f u n c o e s de p e r t i n e n c i a p a s s o = ( sup−i n f ) / ( pon − 1 . 0 ) ; p a s s o 1 = ( sup1−i n f 1 ) / ( pon − 1 . 0 ) ; p a s s o 2 = ( sup2−i n f 2 ) / ( pon − 1 . 0 ) ; a= p i c ; b= p i c 1 ; 109 c= p i c 2 ; x= i n i c i o ; c o n t a d o r t o t a l = −1.0; w h i l e ( x<= l o o p ) { contador =0.0; / / i n i c i o funcao c l a s s i c a z=a+b * x+c * x * x ; c l a << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < < setprecision (14.0); c l a <<x < <" "<<z << e n d l ; / / fim funcao c l a s s i c a / / i n i c i o parametros fuzzy aa= i n f ; w h i l e ( aa <=( s u p + 0 . 0 1 ) ) { a u x a = p e r t i n e n c i a ( i n f , p i c , sup , a a ) ; bb= i n f 1 ; w h i l e ( bb <= s u p 1 ) { auxb = p e r t i n e n c i a ( i n f 1 , p i c 1 , sup1 , bb ) ; cc= i n f 2 ; w h i l e ( cc <= s u p 2 ) { f x = a a +bb * x+ c c * x * x ; c o n t r o l t o t a l . valorx = x ; c o n t r o l t o t a l . v a l o r f x = fx ; c o n t r o l t o t a l . v a l o r p a = auxa ; c o n t r o l t o t a l . v a l o r p b = auxb ; c o n t r o l t o t a l . valorpc = p e r t i n e n c i a ( i n f 2 , p i c 2 , sup2 , c c ) ; g v e t o r . push_back ( c o n t r o l t o t a l ) ; armazena . v a l o r x = x ; armazena . v a l o r f x = fx ; armazena . v a l o r p = operaminimo ( c o n t r o l t o t a l . valorpa , operaminimo ( c o n t r o l t o t a l . valorpb , 110 c o n t r o l t o t a l . valorpc ) ) ; v e t o r P o n t o . push_back ( armazena ) ; e n t r a d a << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : showpoint )<< s e t p r e c i s i o n ( 1 5 ) ; e n t r a d a <<x < <" "<< fx < <" "<< a r m a z e n a . v a l o r p << e n d l ; c c += p a s s o 2 ; } bb+= p a s s o 1 ; } a a += p a s s o ; } e n t r a d a < <" "<< e n d l ; / / fim p a r a m e t r o s fuzzy principioextensao ( vetorPonto ) ; p r i n c << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < < setprecision (15); f o r ( i n t v = 0 ; v< v e t o r P o n t o . s i z e ( ) ; v ++) { p r i n c << v e t o r P o n t o [ v ] . v a l o r x < <" "<< v e t o r P o n t o [ v ] . v a l o r f x < <" "<< v e t o r P o n t o [ v ] . v a l o r p << e n d l ; } p r i n c < <" "<< e n d l ; convexo ( v e t o r P o n t o ) ; convex << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < < setprecision (15); f o r ( i n t v = 0 ; v< v e t o r P o n t o . s i z e ( ) ; v ++) { convex << v e t o r P o n t o [ v ] . v a l o r x < <" "<< v e t o r P o n t o [ v ] . v a l o r f x < <" "<< v e t o r P o n t o [ v ] . v a l o r p << e n d l ; } convex < <" "<< e n d l ; r=centroide ( vetorPonto ) ; d e f u z z y << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < < setprecision (8.0); d e f u z z y << a r m a z e n a . v a l o r x < <" "<< r << e n d l ; u= a b s ( r−z ) ; 111 i f ( u < 1 . e −6) { c o u t <<u<< e n d l ; u =0.0; c o u t < <" e n t r e i " < <" "<<u<< e n d l ; } d i f e r e a l << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < < setprecision (5); d i f e r e a l << a r m a z e n a . v a l o r x < <" " < < ( 1 0 0 . 0 * u / a b s ( z )) < < e n d l ; c o n t a d o r t o t a l +=1.0; c o u t << c o n t a d o r t o t a l < <" "<<x<< e n d l ; x +=0.1; vetorPonto . clear ( ) ; } return 0; } / / algoritmo − ordenacao void ordenacao ( vector < t r i n c a { double b , i ; t r i n c a orden ; b =1; w h i l e ( b< v e t . s i z e ( ) ) { orden . valorx = vet [ b ] . orden . v a l o r f x = vet [ b ] . orden . valorp = vet [ b ] . i = ( b −1); w h i l e ( ( i >=0)&&( v e t [ i ] . { v e t [ i +1] = v e t [ i ] ; i = ( i − 1); } v e t [ i +1]= o r d e n ; b +=1; } } > &v e t ) valorx ; valorfx ; valorp ; v a l o r f x > orden . v a l o r f x ) ) 112 / / a l g o r i t m o − p r i n c i p i o de e x t e n s a o v o i d p r i n c i p i o e x t e n s a o ( v e c t o r < t r i n c a > &v e t ) { int i , j ; double apagado ; j =1; apagado = 0 . 0 ; while ( j <vet . s i z e ( ) ) { i = ( j −1); i f ( ( vet [ j ] . v a l o r f x )==( vet [ i ] . v a l o r f x ) ) { i f ( v e t [ j ] . v a l o r p >= v e t [ i ] . v a l o r p ) { a p a g a d o +=1; vet . erase ( vet . begin ()+ i ) ; } else { a p a g a d o +=1; vet . erase ( vet . begin ()+ j ) ; } continue ; } j +=1; } } / / a l g o r i t m o − c o n j u n t o convexo v o i d c o n v e x o ( v e c t o r < t r i n c a > &v e t ) { double i , j , l , deletado , r ; j , l , r =1; deletado =0.0; while ( l <( v e t . s i z e ( ) − 1 . 0 ) ) { i = j −1; l = j +1; i f ( ( v e t [ i ] . v a l o r p >= v e t [ j ] . v a l o r p )&& ( v e t [ j ] . v a l o r p <= v e t [ l ] . v a l o r p ) ) 113 { vet . erase ( vet . begin ()+ j ) ; d e l e t a d o +=1; j =1; continue ; } j +=1; } } / / algoritmo − defuzzificacao l o n g d o u b l e c e n t r o i d e ( v e c t o r < t r i n c a > &v e t o ) { l o n g d o u b l e numerador , d i f e r e n , d e n o m i n a d o r , p e r t i n e n , c , numerador1 , numerador2 , d e n o m i n a d o r 1 , d e n o m i n a d o r 2 ; denominador1 = 0 . 0 ; denominador2 = 0 . 0 ; numerador = 0 . 0 ; denominador = 0 . 0 ; numerador1 = 0 . 0 ; numerador2 = 0 . 0 ; c =0.0; w h i l e ( c <=( v e t o . s i z e ( ) ) ) { diferen =((( veto [ c ] . valorp )) −1.0); n u m e r a d o r 1 +=( d i f e r e n * ( v e t o [ c ] . v a l o r f x ) ) ; n u m e r a d o r 2 +=( v e t o [ c ] . v a l o r f x ) ; d e n o m i n a d o r 1 +=( d i f e r e n ) ; denominador2 +=1.0; c +=1.0; } denominador=denominador1+denominador2 ; numerador=numerador1+numerador2 ; r e t u r n ( numerador / denominador ) ; } / / a l g o r i t m o − f u n c a o de p e r t i n e n c i a t r i a n g u l a r d o u b l e p e r t i n e n c i a ( d o u b l e a , d o u b l e b , d o u b l e c , d o u b l e w) { long double p e r t ; i f (w < a ) 114 p e r t =0; else { i f ( ( a <=w)&&(w<=b ) ) { p e r t = (w−a ) / ( b−a ) ; } else { i f ( ( b<w)&&(w<= c ) ) { p e r t = ( c−w ) / ( c−b ) ; } else { p e r t =0;} } } return pert ; } / / a l g o r i t m o − o p e r a c a o de minimo long double operaminimo ( double i , double j ) { d o u b l e minimo , aux ; aux = i −j ; i f ( aux <=0){ minimo= i ; } e l s e { minimo= j ; } r e t u r n minimo ; } 115 APÊNDICE D - Rotina MAPLE, programa utilizado para a análise fuzzy 2. with ( p l o t s ) ; with ( s t a t s ) ; f 1 : = 163.0429 − 14.3653 * s t a t e v a l f [ i c d f , s t u d e n t s t [ 1 5 ] ] ( 1 − ( 1 / 2 ) * y ) ; f2 := 163.0429+14.3653* s t a t e v a l f [ icdf , s t u d e n t s t [15]](1 −(1/2)* y ) ; eq1 : = x = f 1 ( y ) ; eq2 : = x = f 2 ( y ) ; i m p l i c i t p l o t ( { eq1 , eq2 } , x = 0 . . 2 0 0 , y = 0 . . 1 , c o l o r = black , t h i c k n e s s = 3 , l a b e l s = [ x , alpha ] ) ;