LEANDRO FERREIRA
INTERVALOS DE CONFIANÇA PARA O PONTO
CRÍTICO DE MODELOS DE REGRESSÃO
QUADRÁTICA: ABORDAGENS BOOTSTRAP,
BAYESIANA E FUZZY
LAVRAS - MG
2012
LEANDRO FERREIRA
INTERVALOS DE CONFIANÇA PARA O PONTO CRÍTICO DE
MODELOS DE REGRESSÃO QUADRÁTICA: ABORDAGENS
BOOTSTRAP, BAYESIANA E FUZZY
Tese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de
Pós-Graduação em Estatística e Experimentação
Agropecuária, área de concentração em Estatística
e Experimentação Agropecuária, para a obtenção
do título de Doutor.
Orientador
Dr. Augusto Ramalho de Morais
LAVRAS - MG
2012
Fabíola
Ficha Catalográfica Preparada pela Divisão de Processos Técnicos da
Biblioteca da UFLA
Ferreira, Leandro.
Intervalos de confiança para o ponto crítico de modelos de
regressão quadrática: abordagens bootstrap, bayesiana e fuzzy /
Leandro Ferreira. – Lavras : UFLA, 2012.
115 p. : il.
Tese (doutorado) – Universidade Federal de Lavras, 2012.
Orientador: Augusto Ramalho de Morais.
Bibliografia.
1. Análise de regressão. 2. Boostrap paramétrico. 3. Inferência
bayesiana. 4. Lógica fuzzy. I. Universidade Federal de Lavras. II.
Título.
CDD – 519.536
LEANDRO FERREIRA
INTERVALOS DE CONFIANÇA PARA O PONTO CRÍTICO DE
MODELOS DE REGRESSÃO QUADRÁTICA: ABORDAGENS
BOOTSTRAP, BAYESIANA E FUZZY
Tese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de
Pós-Graduação em Estatística e Experimentação
Agropecuária, área de concentração em Estatística
e Experimentação Agropecuária, para a obtenção
do título de Doutor.
APROVADA em 30 de agosto de 2012.
Dra. Thelma Sáfadi
UFLA
Dr. Sérgio Martins de Souza
UFLA
Dr. Tadayuki Yanagi Junior
UFLA
Dra. Carla Regina Guimarães Brighenti
UFSJ
Dr. Augusto Ramalho de Morais
Orientador
LAVRAS - MG
2012
À minha mãe, Nenzinha, por ter sempre acreditado em minhas escolhas com seu
imenso amor.
DEDICO
AGRADECIMENTOS
À Força maior que rege todo o universo, ao grande Mestre, à grande Mãe
e aos grandes Amigos espirituais, por mais esta oportunidade de crescimento.
À companheira Simone, presente em todos os momentos, nos quais, aprendemos e crescemos.
Ao meu pai Silvio Ferreira, pelo aprendizado especial.
À madrinha Vilma, pelo seu amor de mãe.
Agradeço ao Eli e à Constança, pela confiança depositada em mim. Obrigado por cada prece.
À família, queridas primas e irmãs Nêm e Damiana, Tio Paulo, Tia Neli,
Tio Hélcio, Maikon e tantos outros, pelo grande carinho.
Ao professor e orientador Augusto Ramalho de Morais, por ter acreditado
em meu trabalho. Em cada conversa, eu me lembrava que “a ciência e a religião
são duas alavancas da humanidade, uma revela as leis do mundo material e a
outra as do mundo moral”.
À Universidade Federal de Lavras (UFLA), por intermédio do Departamento de Ciências Exatas, pela oportunidade e apoio.
À CAPES, pela concessão da bolsa de estudos.
À banca examinadora, composta pelos professores, Thelma Sáfadi, Sérgio
Martins de Souza, Tadayuki Yanagi Junior e Carla Regina Guimarães Brighenti,
pela participação, procedentes correções e sábias sugestões.
Ao amigo Augusto Maciel da Silva, pelo grande companherismo. Nunca
esquecerei o que fizeste por mim. Foram tantas idas e vindas, e sempre do meu
lado, auxiliando-me, superando indiferenças. É verdade que “amizade só faz sentido se traz o céu para mais perto da gente, e se inaugura aqui mesmo o seu
começo”.
De maneira muito especial, à amiga Ana Lúcia Souza Silva Mateus, pela
grande amizade. É uma das pessoas responsáveis por uma grande conquista em
minha vida.
À amiga Giselle Borges, pela grande amizade ao longo de toda vida acadêmica.
Ao amigo Danilo Machado Pires, pelo grande auxílio no desenvolvimento
deste trabalho.
Ao amigo, Crysttian Arantes Paixão, pelo grande companherismo.
Aos grandes amigos, Luiz Gustavo Fernandes Julião, Liliam Helena, Bebel, Marilena, Cristiane, Carlos Eduardo, Ana Paula Vicente, Fábio Martins, Daysa,
Lucélia e Álvaro, pela grande amizade.
Aos colegas do curso de Estatística e Experimentação Agropecuária, Ana
Paula Coelho Madeira, Paulo César, Edcarlos, Paulo Henrique, Vanessa Siqueira
Peres, Felipe, Manoel, Juliano e Walmes, pela amizade e apoio.
Aos amigos Lola, Júlia, Marilda, Domingos, Erlene, Márcia e Carlinho,
pelo auxílio especial.
Aos professores da UFLA, em particular, Renato Ribeiro de Lima, Maria do Carmo Pacheco de Toledo e Costa, Elaine das Graças Frade, Rosana Maria
Mendes, Andréia da Silva Coutinho, José Antônio Araújo Andrade, Osnel Broche Cristo, Onofre Rojas Santos, Luiz Eurico Junqueira Coli e Vicente Gualberto,
pelos ensinamentos e oportunidades.
Agradeço de maneira muito especial ao professor Tadayuki Yanagi Junior,
pela orientação, dedicação e paciência durante toda a minha vida acadêmica.
Ao professor Sérgio Martins de Souza, pelo incentivo e apoio dados para
prosseguir com os estudos.
Às funcionárias do Departamento de Ciências Exatas, Josi, Edila, Selminha e Maria, pela atenção e carinho.
Muito obrigado a todos que contribuíram por mais esta importante conquista!
RESUMO
Em um modelo de regressão quadrática em que, por exemplo, a produção de determinada cultura é avaliada em função de diferentes doses de nutrientes,
pode haver interesse em obter um intervalo de confiança para o ponto crítico que
represente os valores de doses que proporcionam aproximadamente a produção
máxima da cultura. O presente trabalho tem, como objetivo, propor a construção
de intervalos de confiança para o ponto crítico, utilizando a metodologia bootstrap
paramétrico, inferência bayesiana e lógica fuzzy, considerando dados de produção
de matéria seca do sistema radicular de braquiária em função de diferentes doses de
adubação fosfatada. Para a análise bootstrap paramétrico, foram consideradas diferentes variâncias teóricas para o erro e intervalos de confiança foram construídos
de acordo com diferentes expressões de variâncias para o ponto crítico, além do
intervalo de confiança bootstrap-t. Na análise bayesiana, intervalos de confiança
bayesiano (intervalos de credibilidade de máxima densidade a posteriori - HPD)
foram encontrados para o ponto crítico, sendo que, para isso, foram definidas prioris para cada parâmetro do modelo de regressão quadrática, inclusive para o ponto
crítico, e por meio do amostrador de Gibbs, foram realizadas inferências. Na análise fuzzy, por intermédio do princípio de extensão de Zadeh, um modelo fuzzy de
regressão quadrática foi encontrado, considerando incertezas presentes nas estimativas dos parâmetros obtidas pelo método dos mínimos quadrados. Dessa maneira,
foram obtidos um ponto crítico fuzzy e intervalos de confiança fuzzy por intermédio de operações intervalares e α-níveis. Uma segunda análise fuzzy foi realizada
considerando a metodologia de Buckley, na qual um estimador fuzzy para o ponto
crítico foi construído com base em um intervalo de confiança convencional. Pela
análise boostrap paramétrico, os intervalos de confiança que consideraram a expressão da variância com covariância entre os parâmetros do modelo de regressão
apresentaram maior precisão, sendo que a distribuição de frequência do ponto crítico tende a uma distribuição assimétrica positiva e formato do tipo leptocúrtico
com o aumento da variância teórica. De acordo com as prioris assumidas, os
intervalos de confiança bayesiano encontrados para o ponto crítico apresentaram
alta precisão. Considerando as incertezas tratadas pela análise fuzzy, o aumento
dos níveis de confiança, baseados em α-níveis, resultaram em maior precisão dos
intervalos de confiança fuzzy. A metodologia de Buckley apresentou mais informações do que uma estimativa intervalar convencional.
Palavras-chave: Análise de regressão. Bootstrap paramétrico. Inferência bayesiana. Lógica fuzzy.
ABSTRACT
Using a quadratic regression model where, for example, the production of
a certain culture is assessed by different doses of nutrients, might be interesting
to obtain a confidence interval for the critical point that represents the value of
doses that provide approximately the maximum production culture. This paper
has as a main goal, proposes a construction of confidence intervals for the critical
point using parametric bootstrap methodology, bayesian inference and fuzzy logic
considering data from dry matter production of signal grass at different doses of
phosphorus. For the parametric bootstrap analysis were considered different theoretical variances for the error and confidence intervals were constructed according
to different expressions of variances of the critical point, beyond the bootstrap-t
confidence interval.In bayesian analysis, bayesian confidence intervals (Highest
Posterior Density - HPD) were found for the critical point. Thus, priors were defined for each parameter, including the critical point, and through the Gibbs sampler
were made inferences. In fuzzy analysis, by the Zadeh’s extension principle, a
fuzzy quadratic regression model was found considering uncertainties on estimates of the parameters obtained by the least squares method. Thus, a fuzzy critical
point and fuzzy confidence intervals were obtained using interval operations and
α-cuts. A second fuzzy analysis was performed considering the Buckley’s methodology, in which a fuzzy estimator to the critical point were constructed based
on a classical confidence interval. For parametric bootstrap analysis, confidence
intervals considered that the expression of the variance, which take into consideration the covariance between the parameters of the regression model showed higher
precision, and the frequency distribution of the critical point tends to a positive
asymmetric distribution and leptokurtic shape with increasing variance of theoretical. According to the priors assumed, the bayesian confidence intervals found
for the critical point showed high precision. Considering the uncertainties treated
by the fuzzy analysis, the increased levels of confidence, based on α-cuts, resulted
in higher precision of the fuzzy confidence intervals. The Buckley’s methodology
provided more information than a interval estimate conventional.
Keywords: Regression analysis. Parametric bootstrap. Bayesian inference. Fuzzy
logic.
LISTA DE FIGURAS
Figura1 Representação de uma função de pertinência triangular . . . . . .
Figura2 Princípio de extensão . . . . . . . . . . . . . . . . . . . . . . . .
Figura3 Dados de produção de matéria seca em função de diferentes doses
de adubação fosfatada . . . . . . . . . . . . . . . . . . . . . . .
Figura4 Fluxograma para obter os intervalos de confiança, considerando a
metodologia bootstrap . . . . . . . . . . . . . . . . . . . . . . .
Figura5 Fluxograma referente à análise fuzzy 1 . . . . . . . . . . . . . . .
Figura6 Fluxograma referente à análise fuzzy 2 . . . . . . . . . . . . . . .
Figura7 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 18,25 . . . . . . . . . . . . . . . .
Figura8 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 22,81 . . . . . . . . . . . . . . . .
Figura9 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 30,41 . . . . . . . . . . . . . . . .
Figura10 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 45,61 . . . . . . . . . . . . . . . .
Figura11 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 91,23 . . . . . . . . . . . . . . . .
Figura12 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 182,45 . . . . . . . . . . . . . . . .
Figura13 Distribuição de frequência dos valores simulados do ponto crítico
para variância teórica igual a 273,68 . . . . . . . . . . . . . . . .
Figura14 Traço da cadeia e gráfico da distribuição a posteriori marginal
para o parâmetro β0 . . . . . . . . . . . . . . . . . . . . . . . .
Figura15 Traço da cadeia e gráfico da distribuição a posteriori marginal
para o parâmetro β2 . . . . . . . . . . . . . . . . . . . . . . . .
Figura16 Traço da cadeia e gráfico da distribuição a posteriori marginal
para o parâmetro η . . . . . . . . . . . . . . . . . . . . . . . . .
Figura17 Traço da cadeia e gráfico da distribuição a posteriori marginal
para o parâmetro σ 2 . . . . . . . . . . . . . . . . . . . . . . . .
Figura18 Solução do modelo fuzzy de regressão quadrática, considerando
os dados de produção de matéria seca (y) em função de diferentes
doses de adubação fosfata (x) . . . . . . . . . . . . . . . . . . .
42
43
49
55
60
63
70
70
71
71
72
72
73
81
81
82
82
85
Figura19 Solução defuzzificada do modelo fuzzy de regressão quadrática
e solução clássica obtida pelo método dos mínimos quadrados,
considerando os dados de produção de matéria seca (y) em função
de diferentes doses de adubação fosfata (x) . . . . . . . . . . . .
Figura20 Representação gráfica da função de pertinência do ponto crítico
fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Figura21 Representação gráfica da função de pertinência da estimativa fuzzy
do ponto crítico, utilizando a metodologia de Buckley . . . . . .
85
87
90
LISTA DE TABELAS
Tabela1 Análise de variância para um modelo de regressão quadrática. . .
Tabela2 Valores estimados da produção de matéria seca na primeira amostra bootstrap para variância teórica igual a 18,25 e, estimativas
dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática,
dos intervalos de confiança dos parâmetros, estimativa do ponto
crítico (η) e intervalos de confiança (IC11 e IC21 ) para o ponto
crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela3 Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 18,25 e, estimativas
dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática,
dos intervalos de confiança dos parâmetros, estimativa do ponto
crítico (η) e intervalos de confiança (IC12 e IC22 ) para o ponto
crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela4 Valores estimados da produção de matéria seca na primeira amostra bootstrap para variância teórica igual a 91,23 e, estimativas
dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática,
dos intervalos de confiança dos parâmetros, estimativa do ponto
crítico (η) e intervalos de confiança (IC11 e IC21 ) para o ponto
crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela5 Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 91,23 e, estimativas
dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática,
dos intervalos de confiança dos parâmetros, estimativa do ponto
crítico (η) e intervalos de confiança (IC12 e IC22 ) para o ponto
crítico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela6 Valores médios do ponto crítico e dos diferentes intervalos de confiança, de acordo com as variâncias teóricas consideradas, utilizando o método de reamostragem. . . . . . . . . . . . . . . . . .
Tabela7 Resultados para o teste de assimetria assintótico (g1 ), excesso de
curtose assintótico (g2 ) e estatística W de Shapiro-Wilk referentes
aos valores simulados do ponto crítico. . . . . . . . . . . . . . .
Tabela8 Estimativas dos critérios de Raftery e Lewis e, Geweke, utilizados
na avaliação da convergência das cadeias amostradas. . . . . . . .
24
65
65
66
66
68
69
79
Tabela9 Valores médios obtidos pela distribuição a posteriori dos parâmetros e seus respectivos limites inferior e superior dos intervalos de
confiança bayesianos (HPD). . . . . . . . . . . . . . . . . . . . .
Tabela10 Estimativas dos parâmetros do modelo de regressão quadrática e
respectivos erros padrão das estimativas. . . . . . . . . . . . . . .
Tabela11 Limites inferior (η1α ) e superior (η2α ) do intervalo de confiança
fuzzy para o ponto crítico fuzzy, considerando α-níveis entre 0,20
e 1,00. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabela12 Estimativa fuzzy Ê do ponto crítico considerando α-níveis enα
tre 0,65 e 1,00. . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
83
88
89
SUMÁRIO
1
2
2.1
2.1.1
2.1.2
2.1.3
2.2
2.2.1
2.3
2.3.1
2.3.2
2.3.3
2.3.4
2.3.5
2.4
2.4.1
2.4.2
2.4.3
2.4.4
2.4.5
2.4.6
2.4.7
3
3.1
3.2
3.3
3.4
3.4.1
3.4.2
INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . .
REFERENCIAL TEÓRICO . . . . . . . . . . . . . . . . . . . . .
Modelos de regressão . . . . . . . . . . . . . . . . . . . . . . . . .
Modelo de regressão quadrática . . . . . . . . . . . . . . . . . . .
Ponto crítico de modelo de regressão quadrática . . . . . . . . . .
Intervalos de confiança para o ponto crítico . . . . . . . . . . . . .
Metodologia bootstrap . . . . . . . . . . . . . . . . . . . . . . . . .
Metodologia bootstrap aplicada em regressão . . . . . . . . . . . .
Inferência bayesiana . . . . . . . . . . . . . . . . . . . . . . . . .
Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuições a priori . . . . . . . . . . . . . . . . . . . . . . . . .
Distribuições a posteriori . . . . . . . . . . . . . . . . . . . . . . .
Intervalos de credibilidade . . . . . . . . . . . . . . . . . . . . . .
Métodos de simulação . . . . . . . . . . . . . . . . . . . . . . . . .
Lógica fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Conjunto fuzzy e função de pertinência . . . . . . . . . . . . . . .
Níveis de um conjunto fuzzy . . . . . . . . . . . . . . . . . . . . .
Números fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Princípio de extensão de Zadeh . . . . . . . . . . . . . . . . . . . .
Métodos de defuzzificação . . . . . . . . . . . . . . . . . . . . . .
Teoria da possibilidade . . . . . . . . . . . . . . . . . . . . . . . .
Estatística e lógica fuzzy . . . . . . . . . . . . . . . . . . . . . . . .
MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . .
Dados de produção de matéria seca . . . . . . . . . . . . . . . . .
Análise bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Análise bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . .
Análise fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy
Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de Buckley . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . .
4.1 Análise bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Análise bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Análise fuzzy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy
15
17
17
19
25
25
30
32
33
33
34
35
35
36
38
38
40
41
43
44
45
46
48
48
49
56
57
57
61
64
64
73
83
83
4.3.2 Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de Buckley . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
5
CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
APÊNDICE A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
APÊNDICE B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
APÊNDICE C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
APÊNDICE D . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
15
1
INTRODUÇÃO
Em diversas pesquisas, pode haver interesse em avaliar a produção de determinada cultura em função de diferentes doses de nutrientes. Considerando que
o comportamento dos dados pode ser descrito por meio de um modelo de regressão
quadrática, um dos resultados a ser analisado é a estimativa do ponto de máximo
ou de mínimo do modelo, denominado de ponto crítico, o qual se refere, respectivamente, à estimativa da dose de nutriente que proporciona uma produção máxima
ou mínima da cultura.
Um modelo de regressão quadrática, com uma variável independente, pode
ser dado por ŷi = β̂0 + β̂1 xi + β̂2 x2i , no qual um estimador para o ponto crítico
pode ser encontrado, derivando-se ŷi em relação a x e fazendo sua derivada igual
a zero. Dependendo da forma do modelo, o ponto crítico pode ser caracterizado
como um ponto de máximo, quando β̂2 < 0, ou ponto de mínimo, quando β̂2 > 0.
Admitindo que a curva do modelo apresente uma região suave em torno de
um ponto de máximo, o pesquisador, por questão de economia, pode sugerir, por
exemplo, a retirada de 10% de dose de nutriente a ser aplicada, obtendo aproximadamente a produção máxima da cultura. Atentando para tratamentos estatístico e
fuzzy de tal situação, intervalos de confiança podem ser construídos para o ponto
crítico. Dessa maneira, com certo nível de confiança, o pesquisador pode sugerir uma dose de nutriente que resulte num valor entre os limites do intervalo de
confiança.
Diante disso, diversas metodologias podem ser utilizadas para auxiliar na
construção dos intervalos de confiança para o ponto crítico, como: metodologia
bootstrap, que consiste na obtenção de um novo conjunto de dados por reamostragem do conjunto de dados original; metodologia bayesiana, na qual intervalos
de confiança baseados na máxima densidade a posteriori podem ser determinados para parâmetros de um modelo e; metodologia fuzzy, em que operações intervalares fuzzy podem ser realizadas para avaliar incertezas presentes em modelos
estatísticos.
16
Dessa maneira, os objetivos deste trabalho são:
1. obter intervalos de confiança para o ponto crítico, considerando diferentes
situações experimentais através da metodologia bootstrap paramétrico, de
acordo com diferentes variâncias teóricas para o erro e diferentes fórmulas
de variância do ponto crítico;
2. determinar intervalos de confiança bayesiano para o ponto crítico, considerando intervalos de máxima densidade a posteriori;
3. obter intervalos de confiança fuzzy, considerando um ponto crítico fuzzy baseado na divisão intervalar de números fuzzy;
4. realizar uma análise fuzzy com base na metodologia de Buckley para determinar um estimador fuzzy para o ponto crítico baseado em um intervalo de
confiança convencional.
17
2
REFERENCIAL TEÓRICO
2.1
Modelos de regressão
Com o objetivo de analisar a produção de uma cultura, um pesquisador
pode fixar doses crescentes de um determinado nutriente e avaliar a influência destas na produção da cultura. Tal análise pode ser realizada por meio de uma relação
funcional entre as doses de nutriente, denominada de variável independente ou variável regressora, x, e a produção da cultura, denominada de variável independente
ou variável resposta, y, por meio de um modelo de regressão.
Draper e Smith (1998) classificaram os modelos de regressão, em relação
aos seus parâmetros, em lineares, linearizáveis e não-lineares:
a) modelos lineares: aqueles que são lineares em relação aos parâmetros, ou
seja, as derivadas parciais da variável resposta y = f (x,θ), em relação a
cada parâmetro, não dependem dos próprios parâmetros:
∂
fi (x,θ) = g (x)
∂θj
(1)
para i = 1,2,...,n e j = 1,2,...,p, sendo que n é o número total de observações e p é o número de parâmetros do modelo;
b) modelos linearizáveis: aqueles que podem ser transformados em lineares,
por meio de alguma transformação, por exemplo:
y = λx ε
(2)
na qual o erro ε é denominado multiplicativo;
c) modelos não lineares: são aqueles que não se enquadram nos casos a) e b),
por exemplo:
y = λx + ε
(3)
18
em que o erro ε é denominado aditivo e não existe transformação capaz
de tornar o modelo linear. O modelo é dito não-linear, pois a derivada em
relação ao parâmetro é dependente do parâmetro.
De acordo com Hoffmann e Vieira (1998), um modelo linear, denominado
de modelo de regressão linear múltipla. pode ser expresso como:
yi = β0 + β1 xi1 + β2 xi2 + ... + βp−1 xi,p−1 + εi
(4)
em que:
yi representa os valores observados da variável dependente;
β0 , β1 , ..., βp−1 são os parâmetros a serem estimados;
xi1 , xi2 , ..., xi,p−1 representa o i-ésimo valor fixo de uma variável independente;
εi são os erros experimentais relacionados com os valores observados yi
que, em geral, são considerados independentes e normalmente distribuídos com
média zero e variância constante.
Existem vários métodos que podem ser utilizados para a estimação dos
parâmetros, sendo que os mais comumente empregados são o método dos mínimos
quadrados e o da máxima verossimilhança.
Draper e Smith (1998) distinguiram os modelos de regressão em função
das suposições do erro da seguinte maneira:
a) modelos ordinários: aqueles cuja estrutura dos erros não viola nenhuma
das pressuposições. Pode ser escrito de forma mais eficiente como ∼ε ∼
N µ,Iσ 2 , em que ∼ε é um vetor de erros aleatórios independentes e normalmente distribuídos;
b) modelos ponderados: são aqueles cuja estrutura dos erros viola a pressuposição de homogeneidade de variâncias. Nesse caso, diz-se que os erros
são heterocedásticos. Escreve-se ∼ε ∼ N µ,Dσ 2 , em que D é uma matriz
19
diagonal, positiva definida, que pondera a variância σ 2 ;
c) modelos generalizados: são aqueles cuja estrutura dos erros viola a pressuposição de independência dos erros e possivelmente a de homogeneidade de
variâncias. Diz-se que os erros são correlacionados (e possivelmente hete
rocedásticos). Escreve-se ∼ε ∼ N µ,W σ 2 , sendo W uma matriz simétrica,
positiva definida, que representa as variâncas e covariâncias dos erros.
2.1.1
Modelo de regressão quadrática
Segundo Kutner, Nachtsheim e Neter (2005), o modelo de regressão quadrática, com uma variável independente, é:
yi = β0 + β1 xi + β2 x2i + εi
(5)
em que:
yi representa o i-ésimo valor observado de uma variável dependente;
β0 , β1 , β2 são os parâmetros a serem estimados;
xi representa o i-ésimo valor fixo de uma variável independente;
εi representa o i-ésimo erro aleatório, associado à observação yi que, em
geral, são considerados independentes e normalmente distribuídos com média zero
e variância constante σ 2 .
Em termos matriciais, pode-se escrevê-lo como:
Y∼ = Xβ
+ ∼ε
∼
(6)
20

y1


1 x1
x21








y2
..
.
..
.
 
 
 
 
=
 
 
 
1 x2
.. ..
. .
.. ..
. .
x22
..
.
..
.
yn
1 xn


ε1


 
 
 ε2 

β0
 . 


 
 
 .  β1  +  .. 



 .. 

β2
 . 

εn
x2n
(7)
em que:
Y∼ é um vetor de realizações da variável dependente, de dimensões nx1;
X é a matriz dos coeficientes associados aos parâmetros ou matriz do
planejamento, de dimensões nx3;
β
é o vetor de parâmetros, de dimensões 3x1;
∼
ε é o vetor de variáveis aleatórias não observáveis (erros experimentais),
∼
com dimensões nx1, os quais são assumidos serem independentes e normalmente
distribuídos.
Para estimar os parâmetros do modelo, pode-se utilizar o método dos mínimos quadrados, que consiste em minimizar a soma de quadrados dos erros (SQE),
obtendo o sistema de equações normais (SEN). Para tanto, tem-se o vetor de erros
e o SQE, conforme apresentado a seguir:
ε = Y∼ − Xβ
∼
(8)
∼
0 SQE = ∼ε ∼ε = Y∼ − Xβ
Y∼ − Xβ
∼
∼
0 0
= Y∼ 0 − β
X
Y∼ − Xβ
∼
∼
0
0
0
0
0
0
(9)
0
= Y∼ Y∼ − Y∼ Xβ
−β
X Y∼ + β
X Xβ
∼
∼
∼
∼
0 0
0 0
= Y∼ 0 Y∼ − 2β
X Y∼ + β
X Xβ
∼
∼
∼
21
Derivando SQE em relação a β
, obtém-se:
∼
∂Y∼ 0 Y∼
∂β
∼
−2
0 0
∂β
X Y∼
∼
∂β
∼
+
0 0
∂β
X Xβ
∼
∼
∂β
∼
= −2X 0 Y∼ + 2X 0 Xβ
∼
(10)
b como o vetor que anula a derivada, obtém-se o SEN, de
na qual, denominando β
∼
acordo com Searle (1971):
b = X 0Y
X 0X β
∼
∼
(11)
Para o caso do modelo de regressão quadrática em questão, as matrizes
que constituem o SEN são as seguintes:

 n
 n
 P
0
XX=
 i=1 xi
 n
 P 2
xi
i=1

n
P
i=1
n
P
i=1
n
P
i=1
n
P
xi
x2i
x3i
yi

 ni=1
 P
X 0 Y∼ = 
 i=1 xi yi
 n
 P 2
xi yi
n
P
x2i




3
xi 

i=1

n
P

4
xi
i=1
n
P
(12)
i=1








(13)
i=1
b = X 0 Y tem a seguinte
Assim, o sistema de equações normais X 0 X β
∼
∼
22
forma:

 n
 n
 P

 i=1 xi
 n
 P 2
xi
i=1
n
P
i=1
n
P
i=1
n
P
i=1
xi
x2i
x3i
n
P
x2i
n
P


yi
 
 
β0

 ni=1
 
  Pxy
x3i 
.  β1  = 
 i=1 i i

i=1

 n
n
P
β2

 P 2
x4i
xi yi
i=1
n
P
i=1








(14)
i=1
Segundo Kutner, Nachtsheim e Neter (2005), o sistema de equações normais pode também ser escrito da seguinte maneira:
n
P
i=1
n
P
i=1
n
P
i=1
n
P
yi = β̂0 + β̂1
xi yi = β̂0
x2i yi = β̂0
n
P
i=1
i=1
n
P
i=1
n
P
xi + β̂2
n
P
xi + β̂1
i=1
i=1
n
P
x2i + β̂1
x2i
x2i + β̂2
i=1
n
P
i=1
n
P
x3i + β̂2
x3i
i=1
(15)
x4i
Dado que a matriz X possui posto coluna completo, então X 0 X é uma matriz positiva definida e, portanto, invertível. Assim, como em Kutner, Nachtsheim
e Neter (2005), a solução única é dada por:
b = X 0Y
X 0X β
∼
∼
X 0X
−1
b = X 0X
X 0X β
∼
b = X 0X
β
∼
−1
X 0 Y∼
−1
X 0 Y∼
(16)
23
b são dadas por:
Dessa maneira, a esperança e variância de β
∼
h
i
b = E X 0 X −1 X 0 Y
E β
∼
∼
h
i
−1 0
= X 0X
X E Y∼
−1 0
= X 0X
X Xβ
∼
(17)
=β
∼
h
i
b = V X 0 X −1 X 0 Y
V β
∼
∼
h
ih
−1 0
−1 0 i0
= X 0X
X V Y∼
X 0X
X
−1 0 h 0 −1 0 i0
= σ2 X 0X
X XX
X
−1 0
−1
= σ2 X 0X
X X X 0X
−1
= σ2 X 0X
(18)
b , βk e βj , para k,j = 0,1,2, k 6= j,
A covariância entre dois elementos de β
∼
é dada por σ 2 (X 0 X)−1 = σ 2 Tk+1,j+1 , sendo Tk+1,j+1 o elemento da (k + 1)ésima linha e (j + 1)-ésima coluna de (X 0 X)−1 .
Encontrada a solução do SEN, pode-se determinar as somas de quadrados
do modelo de regressão quadrática, obtendo a análise de variância. De acordo com
Charnet et al. (2008), pode-se definir:
n
X
2
(yi − ȳ) =
n
X
i=1
i=1
2
(yi − ŷi ) +
n
X
(ŷi − ȳ)2
(19)
i=1
em que:
n
P
i=1
(yi − ȳ)2 =
n
P
i=1
yi2 −
n
P
2
yi
i=1
n
= Y∼ 0 Y∼ − Y∼ 0 JY∼ = Y∼ 0 Y∼ − C é a soma de qua-
drados total corrigida pela média, denominada por SQT , representando a variação
24
total de Y∼ em torno de sua média;
n
P
i=1
0
b X 0 Y é a soma de quadrados do erro, denominada por
(yi − ŷi )2 = Y∼ 0 Y∼ − β
∼
∼
SQE;
n
P
i=1
b 0 X 0 Y − C é a soma de quadrados de regressão, denominada por
(ŷi − ȳ)2 = β
∼
∼
SQReg, representando a variação das esperanças específicas de Y∼ , dado X, em
torno da média.
Dessa maneira, tem-se que:
SQT = SQE + SQ Re g
(20)
Na Tabela 1, tem-se o esquema de análise de variância para o modelo de
regressão quadrática, na qual o número de graus de liberdade (G.L.), expressões
para o cálculo das somas de quadrados (S.Q.), quadrados médios (Q.M.) e teste F
são apresentados, sendo que:
σ̂ 2 =
SQE
= QM E
n−3
(21)
em que QME é o quadrado médio dos erros.
Tabela 1
Análise de variância para um modelo de regressão quadrática.
F.V.
G.L.
Regressão
2
S.Q.
0 0
b
β
X Y∼ − C
∼
Erro
n-3
b X 0Y
Y∼ 0 Y∼ − β
∼
∼
Total
n-1
Y∼ 0 Y∼ − C
0
Q.M
F
SQ Re g
2
QM Re g
QM E
SQE
n−3
25
2.1.2
Ponto crítico de modelo de regressão quadrática
Seja o modelo de regressão quadrática, com uma variável independente:
ŷi = β̂0 + β̂1 xi + β̂2 x2i
(22)
A obtenção de um ponto crítico de uma dada função é feita conforme
Guidorizzi (2001), derivando-se o modelo (22) em relação a x e igualando a zero:
dŷi
=
dx
d β̂0 + β̂1 xi + β̂2 x2i
dx
= β̂1 + 2β̂2 xi = 0
(23)
Dessa maneira, o estimador do ponto crítico é dado por:
x̂i = η̂ = −
β̂1
2β̂2
(24)
De acordo com a derivada segunda do modelo (22), dada por:
d2 ŷi
= 2β̂2
dx2
o estimador do ponto crítico será a abscissa de um ponto de máximo se β̂2 for
negativo e será de mínimo se β̂2 for positivo.
2.1.3
Intervalos de confiança para o ponto crítico
Considerando que a estimativa pontual do ponto crítico é dada por η̂, toda
a inferência estatística pode ser realizada com base nessa estimativa. O problema
da estimação pontual é que ela não avalia a precisão da estimativa obtida. Dessa
maneira, pode-se associar medidas de precisão, como o erro padrão e intervalos de
confiança, traduzindo incertezas presente na estimação pontual.
De acordo com Casella e Berger (2010), considerando uma amostra x =
26
(x1 ,x2 ,...,xn ), intervalos de confiança podem ser construídos da forma:
[L (x) , U (x)]
(25)
em que L (x) e U (x) são, respectivamente, os limites inferior e superior do intervalo de confiança.
Dessa maneira, para um parâmetro θ, tem-se:
P [L (x) 6 θ 6 U (x)] = 1 − α
(26)
para 0 6 α 6 1, ou seja, diante de várias realizações do experimento, 100 (1 − α) %
dos intervalos de confiança obtidos conterão o verdadeiro valor do parâmetro θ.
Com isso, tem-se que o intervalo de confiança é uma quantidade aleatória e o parâmetro uma quantidade fixa.
Intervalos de confiança para o ponto crítico, cujo estimador envolve um
quociente de variáveis aleatórias, podem ser construídos considerando diferentes
metodologias.
Fieller (1954) propôs um método para construção de intervalos de confiança para um quociente de variáveis aleatórias, na qual, de acordo com o quociente
x1
x2
em que x1 ∼ N m1 ,σ12 , x2 ∼ N m2 ,σ22 e µ =
z=
(27)
m1
m2 ,
a variável u = x1 − µx2
terá distribuição normal com média zero e variância V (u) = σ12 + µ2 σ22 . Sendo
s21 e s22 estimadores não viesados de σ12 e σ22 , respectivamente, o quociente
x1 − µx2
u
p
=p 2
V (û)
s1 + µ2 s22
(28)
tem distribuição t de Student. Dessa maneira, a um certo nível de probabilidade
27
α, tem-se:
"
#
x1 − µx2
P −t 6 p 2
6t =1−α
s1 + µ2 s22
(29)
x − µx2
p1
6t
s21 + µ2 s22
(30)
na qual a inequação:
fornece os extremos do intervalo de confiança.
D’Aulísio, Pimentel-Gomes e Nogueira (1976) estudaram a distribuição
do quociente:
x=−
b̂
2ĉ
(31)
que se refere ao ponto de máximo ou de mínimo da função de produção estimada:
ŷ = â + b̂P1 (x) + ĉP2 (x)
(32)
na qual:
P1 (x) = x − x̄ e P1 (x) = x2 − k são polinômios ortogonais, sendo x̄ a
média dos valores de x e k um número real;
â, b̂ e ĉ são os estimadores dos parâmetros, sendo b̂ e ĉ independentes;
ŷ são os valores preditos.
Para tanto, foram gerados 16000 dados de distribuição normal. Após ajustados através de variâncias teóricas, foram obtidos 8000 valores para x. As variâncias utilizadas foram 0,015625; 0,0625; 0,25; 1,00; 2,00; 4,00; 6,25 e 9,00.
Verificou-se que a distribuição de x foge completamente da normalidade, exceto
talvez para o valor mais baixo de σ 2 estudado, e que à medida que crescem os
valores das variâncias teóricas estudadas, a distribuição tende a ser leptocúrtica.
Além da análise da distribuição, intervalos de confiança foram obtidos para x,
28
considerando o método de Fieller; a fórmula da variância comum, dada por:
n
P
V1 (x) =
i=1
x2i −
n
P
2
xi
i=1
N
N −1
(33)
em que xi são os valores simulados e; a fórmula da variância obtida pela diferenb̂
ciação de x = − 2ĉ
:

2
1 1
b̂
V2 (x) =  2 V b̂ + 4 V (ĉ)
4 ĉ
ĉ

(34)
em que V b̂ e V (ĉ) foram obtidas pelas fórmulas de variâncias usuais e, ĉ e b̂
são as médias das estimativas dos valores simulados. Para σ 2 > 0,25, o método
de Fieller resultou em intervalos de confiança com extremos infinitos, sendo que
os intervalos construídos, considerando V2 (x), apresentaram maior precisão.
Freitas (1978) estudou a distribuição dos erros experimentais associados
ao ponto que determina a produção máxima da cultura de algodão, dado por:
√
b̂
2ĉ
(35)
+ cxi + ei
(36)
x=−
para o modelo de produção:
1/2
yi = a + bxi
em que:
yi representa a produção obtida na i-ésima dose de nutriente, em quilogramas por hectare;
xi representa a i-ésima quantidade de dose de nutriente (N , P2 O5 ou
K2 O), em quilogramas por hectare.
Dessa maneira, os erros foram considerados aleatórios e independentes
com distribuição normal de média zero e variância σ 2 . Verificou-se que a dis-
29
tribuição do quociente foi aproximadamente normal para as variâncias σ 2 = 5 e
σ 2 = 10. Já para as variâncias σ 2 = 15, 20, 25, 30, 35, 40, 45 e 50, a distribuição caracterizou-se por ser leptocúrtica e com assimetria positiva. Considerando
os valores simulados, intervalos de confiança considerando o método de Fieller,
√
√
V1 ( x) e V2 ( x), conforme D’Aulísio, Pimentel-Gomes e Nogueira (1976), foram construídos, sendo que diante dos resultados obtidos, os intervalos conside√
rando V2 ( x) apresentaram maior precisão.
De acordo com o trabalho desenvolvido por Freitas (1978), Nunes et al.
(2004) utilizaram simulação Monte Carlo para avaliar diferentes fórmulas de variâncias para o ponto crítico de um modelo de regressão quadrática, dado por:
ŷ = â + b̂x + ĉx2
(37)
no qual o estimador do ponto é dado por:
x̂ =
b̂
−2ĉ
(38)
Para tanto, consideraram-se as variâncias teóricas σ 2 = 0,1, 0,5, 1,0, 5,
10, 15, 20 e 50 para o erro. As estimativas da variância do ponto crítico foram obtidas por meio das fórmulas da variância comum, por diferenciação do estimador
do ponto crítico (D’AULÍSIO; PIMENTEL-GOMES; NOGUEIRA, 1976) e pela
fórmula demonstrada para o cálculo da variância de uma razão, considerando a covariância entre b̂ e ĉ (MOOD; GRAYBILL; BOES, 1974). Intervalos de confiança
para o ponto crítico foram encontrados considerando as diferentes fórmulas de variâncias. Pôde-se concluir que a variância do ponto crítico calculada, usando-se a
expressão que leva em consideração a covariância entre b̂ e ĉ, apresentaram resultados mais satisfatórios, assim como os intervalos de confiança que utilizaram tal
fórmula. A variância teórica afetou as estimativas do ponto crítico, sendo que maiores variâncias foram relacionadas com maiores valores médios. A distribuição do
ponto crítico apresentou uma forte tendência de assimetria à direita e ao formato
leptocúrtico para σ 2 > 10.
Hirschberg e Lye (2005) investigaram a construção de intervalos de confi-
30
ança para o ponto crítico de modelos de regressão quadrática, utilizando o método
Delta; método de Fieller; a primeira derivada do modelo de regressão quadrática;
inferência bayesiana, na qual uma priori de Jeffreys foi assumida para o ponto
crítico; teste de razão de verossimilhança e; metódo bootstrap, no qual intervalos
de confiança percentil e bootstrap-t foram construídos, sendo que a estimativa do
erro padrão do ponto crítico foi obtida utilizando o método Delta. Diante das simulações realizadas, os métodos bootstrap-t e Delta apresentaram maior precisão,
sendo que o método de Fieller e o teste de razão de verossimilhança apresentaram
intervalos de confiança com extremos infinitos.
2.2
Metodologia bootstrap
Em inferência estatística, características da população são analisadas com
base em amostras. Considerando que a inferência é realizada admitindo o Teorema
Central do Limite, em que amostras suficientemente grandes são consideradas, a
metodologia bootstrap surge como alternativa para analisar situações em que as
amostras não são suficientemente grandes, assim como, para obter aproximações
de distribuições amostrais de determinadas estatísticas.
A metodologia bootstrap, desenvolvida por Efron (1979), consiste em admitir a amostra orginal como se fosse a própria população, sendo que para isso,
a amostra original deve representar bem a população em estudo. Dessa maneira,
novas amostras com reposição são obtidas a partir de reamostragem da amostra
original, denominadas de amostras bootstrap, na qual representam diferentes situações experimentais com a idéia de que o experimento é repetido por diversas
vezes.
Para cada amostra bootstrap, é calculada uma estimativa para a estatística
de interesse. Ao final do processo de reamostragem, o conjunto das estimativas
obtidas, denominadas de estimativas bootstrap, dá origem à distribuição bootstrap,
que tem aproximadamente a mesma forma e dispersão da distribuição amostral da
estatística, porém está centrada no valor da estatística original e não no valor do
parâmetro de interesse (EFRON; TIBSHIRANI, 1993). Com base nas estimativas
31
bootstrap, intervalos de confiança bootstrap podem ser encontrados, realizando
milhares de remostragens para que as oscilações provocadas pela aleatoriedade do
processo sejam minimizadas. O número de reamostragem mínimo é igual a 1000
e para a grande maioria das situações, um número de reamostragem igual a 2000
fornece excelentes resultados (FERREIRA, 2009).
A metodologia bootstrap pode ser implementada tanto de forma não paramétrica quanto de forma paramétrica. No caso do bootstrap não paramétrico, a
amostragem é feita com reposição da amostra original, supondo que as observações são obtidas a partir de uma distribuição empírica que designa uma probabilidade igual a 1/n para cada uma das observações y1 ,y2 ,...,yn . No caso paramétrico,
a amostragem é realizada com base numa distribuição ajustada às observações
amostrais.
A partir de uma amostra bootstrap Bb = {y1∗ ,y2∗ ,...,yn∗ }, em que yi∗ é
uma escolha aleatória de {y1 ,y2 ,...,yn }, calcula-se uma estimativa da estatística
de interesse, θ̂b∗ . Realizando esse processo para b = 1,...,B vezes, pode-se obter, conforme Efron e Tibshirani (1993), a estimativa bootstrap do erro padrão da
estatística de interesse:
∗
σ̂B
θ̂ =
v
u B 2
uP ∗
u
θ̂b − θ̂∗
t b=1
(39)
B−1
B
P
em que θ̂b∗ é o estimador calculado a partir da b-ésima amostra e θ̂∗ =
b=1
θ̂b∗
B
éa
média dos valores reamostrados.
Dessa maneira, a metodologia bootstrap oferece um meio alternativo para
calcular erros padrão, com a grande vantagem de que a fórmula apresentada anteriormente é aplicável a qualquer estimador (CASELLA; BERGER, 2010).
32
2.2.1
Metodologia bootstrap aplicada em regressão
De acordo com Draper e Smith (1998), dois métodos de reamostragem
bootstrap não paramétricos podem ser utilizados em modelos de regressão, que
são: Bootstrap residual e Bootstrap de pares. Ambos os métodos são descritos a
seguir:
a) Bootstrap residual:
1. ajuste um modelo de regressão, considerando os dados da amostra original
e obtenha os n resíduos, b
ε;
∼
2. selecione uma amostra aleatória de tamanho n dos resíduos b
ε obtidos no
∼
passo 1, utilizando reamostragem com reposição, com probabilidade 1/n
para cada resíduo selecionado, obtendo ∼ε∗ ;
3. gere novos valores de Y∼ fazendo:
b + ε∗
Y∼ ∗ = X β
∼
∼
b são as estimativas dos
em que ∼ε∗ são os resíduos obtidos no passo 2 e β
∼
parâmetros obtidas no passo 1;
4. ajuste um modelo de regressão, considerando Y∼ ∗ , pelo método dos mínimos
b∗ ;
quadrados, obtendo novas estimativas para os parâmetros, β
∼
5. Repita os passos 1 a 4, R vezes.
b) Bootstrap de pares:
1. reamostre com reposição n pares dos valores originais (yi ,xi ), com probabilidade 1/n para cada par;
2. ajuste um modelo de regressão, considerando os n pares reamostrados no
passo 1, pelo método dos mínimos quadrados, obtendo novas estimativas
b∗ ;
para os parâmetros, β
∼
33
3. Repita os passos 1 a 4, R vezes.
Para modelos de regressão, a metodologia bootstrap paramétrico (EFRON;
TIBSHIRANI, 1993) consiste em, sob hipótese de normalidade, tomar amostras ∼ε∗
da distribuição N 0,σ 2 , em que σ 2 é o quadrado médio do erro da regressão, geb + ε∗ ,
rando novos valores da variável resposta, Y , por meio do modelo Y ∗ = X β
∼
∼
∼
∼
b são os valores estimados dos parâmetros obtidos pelo método dos míniem que β
∼
mos quadrados, considerando os dados originais.
2.3
Inferência bayesiana
Na inferência frequentista, um determinado parâmetro θ é considerado
como um valor fixo ou constante, enquanto que na inferência bayesiana, θ é considerado como uma variável aleatória. Dessa maneira, a inferência bayesiana consiste em assumir uma distribuição a priori para θ, traduzir informações referentes
aos dados amostrais através de uma função de verossimilhança, e obter por meio
do teorema de Bayes, a distribuição a posteriori para θ. O grau de incerteza ou
informação que se tem a respeito de θ é representado pela sua distribuição a priori,
sendo que ocorrido o experimento, a inferência é realizada com base na distribuição a posteriori .
2.3.1
Teorema de Bayes
De acordo com Paulino, Turkman e Murteira (2003), o teorema de Bayes
é um dos resultados da matemática que se propõe a caracterizar a aprendizagem
com a experiência, isto é, modificar a atitude inicial em relação aos "antecedentes",
depois de ter a informação adicional de que certo evento se realizou.
Considerando Ai como eventos disjuntos de um espaço amostral e B como
34
um evento do espaço amostral, o teorema de Bayes é dado por:
P (Ai |B) =
P (B|Ai ) P (Ai )
P (B|Ai ) P (Ai )
= n
P
P (B)
P (B|Ai ) P (Ai )
(40)
i=1
em que, considerando A como parâmetros desconhecidos e B como variáveis aleatórias correspondentes à amostra, P (B|A) representa a função de verossimilhança
relacionada à distribuição probabilística dos dados amostrais, P (A) são distribuições a priori, que representam o conhecimento prévio a respeito dos parâmetros
e P (A|B) corresponde à distribuição a posteriori dos parâmetros, considerando
que o experimento ocorreu.
Com isso, a informação que se tem a respeito de um parâmetro θ, representada pela sua distribuição a priori, p (θ), pode ser aumentada, observandose uma variável aleatória X relacionada com θ, obtendo a distribuição amostral
p (x|θ), na qual para um valor fixo de x, a função L (θ; x) = p (x|θ) fornece a
verossimilhança de cada um dos possíveis valores de θ (PAULINO; TURKMAN;
MURTEIRA, 2003). Assim, o teorema de Bayes é dado da seguinte maneira:
p (θ|x) =
p (x|θ) p (θ)
p (x|θ) p (θ)
= R
p (x)
p (θ,x) dθ
(41)
em que θ é contínuo.
Como o denominador não depende de θ, servindo apenas como uma constante normalizadora de p (θ|x), o teorema pode ser reecrito como:
p (θ|x) ∝ p (x|θ) p (θ)
2.3.2
(42)
Distribuições a priori
A informação prévia que se tem a respeito de um determinado parâmetro
é representada pela sua distribuição a priori. Quando o pesquisador tem alguma
informação sobre o parâmetro em estudo, ele pode trabalhar com uma priori de-
35
nominada de priori informativa. Uma priori é caracterizada como não informativa
quando a informação dos dados é dominante ou quando se deseja representar o
desconhecimento sobre θ (BOX; TIAO, 1992). Uma das prioris não informativas
mais utilizada é a priori de Jeffreys (1961).
2.3.3
Distribuições a posteriori
Considerando θ como um vetor de parâmetros e θi como um parâmetro
específico, a distribuição a posteriori conjunta, dada por p (θ|x), deve ser integrada
em relação a todos os parâmetros, exceto a θi . Dessa maneira, encontra-se uma
distribuição para θi , denominada de distribuição marginal de θi , sendo expressa
por:
Z
p (θi |x) =
Z
...
p (θi, θ−i |x) dθ−i
(43)
em que θ−i = (θ1 ,...,θi−1 ,θi+1 ,...,θj ) é o conjunto complementar de parâmetros
para θi (PAULINO; TURKMAN; MURTEIRA, 2003).
Com base na distribuição marginal a posteriori, que contém toda a informação probabilística a respeito do parâmetro, estimativas bayesianas pontuais
podem ser encontradas, por exemplo, moda, média e mediana a posteriori, além
de estimativas bayesianas intervalares, através da construção de intervalos de credibilidade (BOX; TIAO, 1992).
2.3.4
Intervalos de credibilidade
Uma alternativa aos intervalos de confiança abordados na estatística convencional, considerados como intervalos aleatórios, é o intervalo de confiança
bayesiano, denominado de intervalo de credibilidade, no qual a quantidade aleatória é o parâmeto.
O intervalo C será um intervalo de credibilidade de 100 (1 − α) %, ou
36
nível de credibilidade 1 − α, para θ se P (θ ∈ C) > 1 − α. Dessa maneira, a
definição probabilística expressa a pertinência ou não de θ ao intervalo C. Com o
mesmo grau de crebilidade, existe uma infinidade de regiões de credibilidade, surgindo o intervalo de máxima densidade a posteriori (Highest Posterior Density)
ou intervalo HPD, no qual é um intervalo de credibilidade de comprimento mínimo, tomando-se os valores de θ com maior densidade a posteriori (PAULINO;
TURKMAN; MURTEIRA, 2003).
2.3.5
Métodos de simulação
Em diversas situações, a distribuição marginal a posteriori de um determinado parâmetro θ é difícil de ser encontrada, devido à impossibilidade de calcular
analiticamente as integrais envolvidas. Dessa maneira, pode-se utilizar métodos
aproximados baseados em simulação estocástica, como os métodos não iterativos
e iterativos.
Dentre os métodos não iterativos, têm-se os métodos de reamostragem por
rejeição e ponderada e, os métodos de Monte Carlo. Como métodos iterativos,
têm-se os métodos de Monte Carlo via cadeias de Markov (MCMC), que consistem em gerar valores de uma distribuição condicional a posteriori para cada parâmetro, como os algoritmos Gibbs (GELFAND; SMITH, 1990) e de MetropolisHastings (HASTINGS, 1970).
De acordo com Paulino, Turkman e Murteira (2003), o algoritmo Gibbs
ou método de amostragem Gibbs é baseado no fato de que se a distribuição a
posteriori conjunta, p (θ|x) for positiva, então, é unicamente determinada pelas
distribuições condicionais completas, p (θi |θ−i ,x). Segundo Gamerman (1997), a
amostragem Gibbs pode ser descrita da seguinte forma:
1. inicie o contador de iterações da cadeia l = 1 e escolha valores iniciais
(0)
(0)
0
θ = θ1 ,...,θj ;
(l)
(l)
2. obtenha um novo valor θl = θ1 ,...,θj , a partir de θ(l−1) , por meio de
37
sucessivas gerações de valores:
(l)
(l−1) (l−1)
(l−1)
θ1 ∼ p θ1 |θ2
,θ3
,...,θj
,x
(l)
(l) (l−1)
(l−1)
θ2 ∼ p θ2 |θ1 ,θ3
,...,θj
,x
..
.
(l)
(l) (l)
(l)
θj ∼ p θj |θ1 ,θ2 ,...,θj−1 ,x
3. mude o contador l para l + 1 e retorne ao passo 2, até atingir a convergência.
No caso em que a forma da distribuição condicional completa não é reconhecida, pode-se utilizar o algoritmo de Metropolis-Hastings. De acordo com
Chib e Greenberg (1995), o algoritmo de Metropolis-Hastings pode ser descrito da
seguinte maneira:
1. inicie o contador de
iterações da cadeia v = 1 e especifique valores iniciais
(0)
(0)
0
θ = θ1 ,...,θj ;
2. gere um novo valor θ∗ de uma distribuição auxiliar proposta q (.|θ);
∗ |x)q(θ|θ ∗ )
3. calcule a probabilidade de aceitação α (θ,θ∗ ) = min 1, p(θ
∗
p(θ|x)q(θ |θ) , em
que p é a distribuição de interesse, e gere u ∼ U (0,1);
4. se u < α (θ,θ∗ ), então, aceite o novo valor, θ∗ , e faça θ(v+1) = θ∗ , caso
contrário, rejeite e faça θ(v+1) = θ(v) ;
5. incremente o contador de v para v + 1 e volte ao passo 2.
Nos métodos de Monte Carlo via cadeias de Markov, tem-se a necessidade de diagnosticar a convergência das cadeias para a distribuição original. Para
tanto, têm-se os métodos informais e formais. Os métodos informais foram inicialmente propostos por Gelfand e Smith (1990), na qual sugeriram, por exemplo,
a técnica gráfica que consiste em observar a trajetória da cadeia ao longo das iterações, sendo que após um período inicial, se a cadeia apresentar o mesmo comportamento, então, pode-se concluir a convergência. Dentre os métodos formais,
38
podem-se destacar os critérios propostos por Raftery e Lewis (1992) e Geweke
(1992).
O critério de Raftery e Lewis (1992) estima o número de iterações necessárias para que o algoritmo Gibbs apresente convergência, sendo que o método
fornece as estimativas do burn-in, o número total de iterações que devem ser computadas e a distância mínima de uma iteração à outra (thin), para se obter a subamostra aproximadamente independente. A regra de decisão é baseada no fator de
dependência, que é responsável pelo acréscimo multiplicativo ao número de iterações necessárias para se alcançar a convergência. Se o fator de dependência for
maior que cinco, pode-se concluir que a cadeia não atingiu convergência.
O critério de Geweke (1992) propõe uma análise da convergência baseada
no teste de igualdade de médias da primeira e da última parte da cadeia de tamanho
N , geralmente, as primeiras 0,1N iterações e as últimas 0,5N iterações. Para
tanto, técnicas de análise espectral são utilizadas para avaliar a convergência da
cadeia. A regra de decisão é baseada na estimativa de um valor p, sendo que
se esse valor for menor que um nível de significância adotado pelo pesquisador,
conclui-se que a cadeia não atingiu convergência.
2.4
2.4.1
Lógica fuzzy
Conjunto fuzzy e função de pertinência
A lógica fuzzy, também conhecida como lógica nebulosa, lógica difusa ou
teoria das possibilidades, é uma extensão da lógica clássica, a qual se baseia na
teoria dos conjuntos fuzzy. A lógica fuzzy foi inicialmente introduzida por Zadeh
(1965), tendo como objetivo, trabalhar informações imprecisas.
Um conjunto clássico pode ser caracterizado por sua função característica.
De acordo com Barros e Bassanezi (2010), sejam U um conjunto universo e A um
39
subconjunto de U , a função característica de A é definida como:
χA : U → {0,1}
(44)
em que:
(
χA (x) =
1 se x ∈ A
0 se x ∈
/A
sendo que χA é uma função cujo domínio é U e a imagem está contida no conjunto
{0,1}, com χA (x) = 1 indicando que o elemento x está em A, enquanto χA (x) =
0 indica que x não é elemento de A.
De acordo com Tanaka (1997), um conjunto ou subconjunto fuzzy A de
um conjunto universo U é definido por uma função de pertinência µA representada
por:
µA : U → [0,1]
(45)
na qual µA (x) ∈ [0,1] é o grau de pertinência com que o elemento x de U pertence
ao conjunto fuzzy A.
Os conjuntos fuzzy podem ser expressados de maneira discreta ou contínua. Quando o conjunto universo U é discreto, um conjunto fuzzy A pode ser
representado como:
A = µA (x1 )/x1 + µA (x2 )/x2 + ... + µA (xn )/xn =
N
X
µA (xi )/xi
(46)
i=1
em que o símbolo / é apenas usado para associar o elemento do conjunto universo
U e seu grau de pertinência ao conjunto fuzzy A, assim como o sinal + que não
significa soma, mas sim conexão entre os elementos.
Quando o conjunto universo U é contínuo, um conjunto fuzzy A pode ser
40
representado como:
Z
µA (xi )/xi
A=
(47)
U
em que o símbolo ∫ não tem nenhuma conexão com integral, assim como
P
com
somatório, no caso discreto.
Operações que envolvem conjuntos clássicos como união, intersecção e
complemento também podem ser realizadas por meio de conjuntos fuzzy. Sejam
A e B conjuntos fuzzy. De acordo com Tanaka (1997), as funções de pertinência
que representam os conjuntos fuzzy união, intersecção e complementar são dadas,
respectivamente, por:
2.4.2
µA∪B (x) = max {µA (x) ,µB (x)}
(48)
µA∩B (x) = min {µA (x) ,µB (x)}
(49)
µA0 (x) = 1 − µA (x) ,∀x ∈ U
(50)
µB 0 (x) = 1 − µB (x) ,∀x ∈ U
(51)
Níveis de um conjunto fuzzy
De acordo com Tsoukalas e Uhrig (1997), com qualquer conjunto fuzzy A,
pode-se associar uma coleção de conjuntos clássicos denominados de α - níveis de
A. Um α - nível é um conjunto clássico que consiste de elementos que pertencem
ao conjunto fuzzy A com grau de pertinência maior ou igual a α, isto é:
[A]α = {x ∈ U/µA (x) > α}
para 0 < α 6 1.
(52)
41
2.4.3
Números fuzzy
Com o objetivo de se trabalhar com operações aritméticas que envolvem
incertezas, foram definidos os números fuzzy. Tanaka (1997) define um conjunto
fuzzy A como número fuzzy quando o conjunto universo no qual µA (x) está definida é o conjunto dos números reais e satisfaz às seguintes condições:
• A é um conjunto convexo;
• existe pelo menos um valor de x que admite pertinência máxima (µA (x) = 1);
• µA (x) é contínua em um dado intervalo.
Sejam A e B números fuzzy com α - níveis dados, respectivamente, por
α
[A] = [aα1 , aα2 ] e [B]α = [bα1 , bα2 ]. Conforme Barros e Bassanezi (2010), valem as
seguintes operações intervalares:
a) A soma entre A e B é o número fuzzy A + B, cujos α - níveis são
[A + B]α = [A]α + [B]α = [aα1 + bα1 , aα2 + bα2 ]
(53)
b) A diferença entre A e B é o número fuzzy A − B, cujos α - níveis são
[A − B]α = [A]α − [B]α = [aα1 − bα2 , aα2 − bα1 ]
(54)
c) A multiplicação de λ por A é o número fuzzy λA, cujos α - níveis são
(
[λA]α = λ[A]α =
[λaα1 , λaα2 ] se λ > 0
[λaα2 , λaα1 ] se λ < 0
(55)
d) A multiplicação de A por B é o número fuzzy A.B, cujos α - níveis são
[AB]α = [A]α [B]α = [min P, max P ]
em que P = {aα1 bα1 ,aα1 bα2 ,aα2 bα1 ,aα2 bα2 }.
(56)
42
e) A divisão de A por B é o número fuzzy cujos α - níveis são
A
B
α
α α
a1 a2
[A]α
=
,
α =
[B]
bα2 bα1
(57)
Considerando um número fuzzy triangular A, sua função de pertinência é
da seguinte forma:
µA (x) =



x−a
u−a ,
b−x
b−u ,
se u 6 x 6 b


0,
caso contrario
se a 6 x 6 u
(58)
em que µA (u) = 1, podendo ser representado de maneira simplificada por A =
(a; u; b).
A Figura 1 apresenta uma função de pertinência triangular. Os α - níveis
desses números fuzzy são os intervalos:
[aα1 , aα2 ] = [(u − a) α + a, (u − b) α + b]
Figura 1
Representação de uma função de pertinência triangular
(59)
43
2.4.4
Princípio de extensão de Zadeh
O princípio de extensão de Zadeh tem como finalidade ampliar operações
matemáticas do domínio clássico ao domínio fuzzy.
Sejam X e Y conjuntos e f uma aplicação de X em Y , seja A um conjunto
fuzzy em X, o princípio de extensão afirma que a imagem de A pela função f
é um conjunto fuzzy B = f (A) em Y , cuja função de pertinência é dada por
µB (y) = sup µA (x), sendo ilustrado na Figura 2 (PEDRYCZ; GOMIDE, 1998).
x
Figura 2
Princípio de extensão
Segundo Jafelice (2004), o princípio de extensão pode ser descrito como:
• o grau de pertinência de um valor do contradomínio é definido diretamente
pelo grau de pertinência de sua pré imagem;
• quando um valor do contradomínio é mapeado por vários do domínio, o seu
grau de pertinência é obtido pelo valor máximo dos graus de pertinência dos
valores da entrada.
O princípio de extensão pode ser facilmente generalizado para funções
de várias variáveis. Sejam X = X1 × X2 × ... × Xn e Y conjuntos universos,
considere os conjuntos Ai em Xi , i = 1,...,n, e uma função f : X → Y . Os
44
conjuntos fuzzy A1 , A2 ,...,An são então transformados pela f , produzindo o conjunto fuzzy B = f (A1 ,A2 ,...,An ) em Y , cuja função de pertinência é µB (y) =
sup min [µA1 (x1 ) ,µA2 (x2 ) ,...,µAn (xn )] para x ∈ X, x = (x1 ,x2 ,...,xn ) ∈
x
X1 × X2 × ... × Xn e y = f (x).
Melo (2009) apresentou uma metodologia computacional que permitiu
aplicar o princípio de extensão para funções não monótonas com dois parâmetros
fuzzy. Para tanto, analisou o problema do Oscilador Harmônico Unidimensional,
considerando os parâmetros amplitude e frequência como incertos. Os resultados
obtidos mostraram que a solução fuzzy aproximou a solução clássica do Oscilador
Harmônico Amortecido.
Com o objetivo de apresentar uma metodologia computacional para aplicar lógica fuzzy a funções matemáticas gerais, Pires (2010) utilizou o princípio
de extensão de Zadeh em grandezas termodinâmicas e em equações de difusão,
que são exemplos de equações diferenciais parciais importantes em engenharia.
Verificou-se que os resultados tenderam à solução clássica à medida que a incerteza diminuía, concluindo que o processo de construção de funções de pertinência,
etapa de fuzzificação, foi bem estruturado.
2.4.5
Métodos de defuzzificação
Uma das etapas importantes, que envolve um estudo baseado em lógica
fuzzy, é a etapa da defuzzificação. A defuzzificação consiste em traduzir um conjunto fuzzy em um número real. Existem diversos métodos de defuzzificação,
sendo que o mais utilizado é o método do Centro de Gravidade, também chamado
de Centróide ou Centro de Área (MAMDANI, 1974).
De acordo com Barros e Bassanezi (2010), o método do Centro de Gravidade (G) é semelhante à média ponderada para distribuição de dados, com a
diferença de que os pesos são os valores µA (x), que indicam o grau de pertinência
do valor xi no conjunto fuzzy A.
45
Para um domínio discreto, tem-se:
n
P
G (A) =
xi µA (xi )
i=0
n
P
(60)
µA (xi )
i=0
Para um domínio contínuo, tem-se:
R
xµA (x) dx
R
G (A) = R
µA (x) dx
(61)
R
em que R é a região de integração.
2.4.6
Teoria da possibilidade
Na teoria estatística, as informações são tratadas, considerando funções de
probabilidade ou funções densidade de probabilidade. A probabilidade está relacionada com a incerteza do resultado futuro de um experimento aleatório, sendo
que nesse caso, os eventos são bem definidos e a dúvida está na ocorrência dos
mesmos.
Na teoria fuzzy, as informações são tratadas por meio de funções de pertinência, µ (x) : Ω → [0,1], na qual µ (x) indica a pertinência ou possibilidade de x
ser igual a um determinado valor.
Enquanto que, na teoria de probabilidade, os eventos são bem definidos,
na teoria da possibilidade, tem-se imprecisão quanto a definição dos eventos.
De acordo com Zadeh (1978), uma distribuição de possibilidade sobre o
conjunto Ω 6= ∅ é uma função µ (x) : Ω → [0,1], satisfazendo sup µ (x) = 1.
x∈Ω
46
2.4.7
Estatística e lógica fuzzy
Com o avanço da teoria dos conjuntos fuzzy, envolvendo números fuzzy
e princípio de extensão, muitas pesquisas têm sido desenvolvidas, combinando
métodos estatísticos com lógica fuzzy (TAHERI, 2003), como no estudo de variáveis aleatórias (GONZALEZ-RODRIGUES; COLUBI; GIL, 2006; AKBARI;
REZAEI, 2009), testes de hipóteses (GRZEGORZEWSKI; HRYNIEWICZ, 1997)
e análises de regressão (WU, 2003; BARGIELA; PEDRYCZ; NAKASHIMA,
2007).
Uma das principais aplicações envolvendo estatística e lógica fuzzy, foi
introduzida por Zadeh (1968), a qual propôs o estudo da probabilidade de um
evento fuzzy. Seja A um evento fuzzy, em que µA (x) : Ω → [0,1], a probabilidade
de A é dada por:
m
P
P (A) =
µA (xi )
i=1
n
(62)
em que m e n são, respectivamente, os números de elementos de A e Ω.
Tanaka, Uejima e Asai (1982) apresentaram a primeira regressão linear
fuzzy, na qual consideraram a variável dependente como fuzzy. Dessa maneira, as
observações foram representadas por números fuzzy através de funções de pertinência triangulares simétricas, denotados por Ȳi = (ȳi ,ei ), i = 1,2,...M , em que
ȳi é o centro e ei é a largura do i-ésimo dado coletado, dado como:
(
µȲi (yi ) =
1−
0
|ȳi −yi |
ei
se ȳi − ei 6 yi 6 ȳi + ei
caso contrario
(63)
Nesse caso, o modelo básico assumiu uma função linear fuzzy, como se
segue:
yi = A0 + A1 xi1 + ... + AN xiN = Yi = AXi
(64)
47
sendo que Xi = [Xi0 ,Xi1 ,...,XiN ]T é um vetor de variáveis independentes do
i-ésimo dado, A = [A0 ,A1 ,...,AN ] é um vetor de parâmetros fuzzy presente na
forma de números fuzzy triangulares simétricos, denotados por Aj = (αj ,cj ), j =
1,...,N , na qual αj é o centro e cj a largura. Pelo princípio de extensão, obteve-se
a função de pertinência do número fuzzy estimado:
µyi∗ (yi ) =

|yi −αT Xi |


1 − cT X

i





1







 0
se Xi 6= 0
se Xi = 0, yi = 0
(65)
caso contrrio
em que cT = (c0 ,c1 ,...,cN ) e αT = (α0 ,α1 ,...,αN ).
Buckley (2005) apresentou estimadores fuzzy baseados em α - níveis, estabelecendo uma relação com níveis de confiança de intervalos convencionais. Falsafain, Taheri e Mashinchi (2008) utilizaram a metodologia proposta por Buckley
(2005), apresentando funções de pertinência únicas para estimadores fuzzy de parâmetros de distribuições Normal, Exponencial e Poisson.
Considerando um sistema baseado em regras fuzzy (SBRF), Missio e Barros (2009) trataram a variável de entrada do sistema como uma variável aleatória,
sendo que seus valores foram estimados pelo método de Monte Carlo. Para isso,
geraram-se amostras de valores aleatórios através da distribuição uniforme e, em
seguida, tais amostras foram transformadas através da função de distribuição de
Weibull truncada. Dessa maneira, os valores de entrada do sistema foram dados
pelas médias das amostras obtidas. Como resultado, verificaram a existência de
uma aproximação da solução obtida pelo SBRF com a solução apresentada pela
literatura. A dificuldade encontrada foi a de determinar uma distribuição de probabilidade para a variável incerta.
48
3
3.1
MATERIAL E MÉTODOS
Dados de produção de matéria seca
Para a realização deste trabalho, foram considerados dados adaptados da
pesquisa desenvolvida por Santos et al. (2002), na qual avaliaram as respostas de
fungo micorrízico arbuscular, adubações fosfatada e nitrogenada na produção e
qualidade da forragem de braquiarão e amendoim forrageiro consorciados. Para
tanto, foi utilizado o delineamento inteiramente casualizado em um esquema fatorial 5x2x2, com 4 repetições, perfazendo um total de 20 tratamentos, sendo 5
doses de adubação fosfatada, 2 tratamentos de inoculação (inoculado e não inoculado com fungo micorrízico arbuscular) e 2 tratamentos de adubação nitrogenada
(com e sem adubação nitrogenada em cobertura).
Dentre as variáveis avaliadas, a produção de matéria seca do sistema radicular do braquiarão (g.vaso−1 ) foi influenciada significativamente pelas doses
de adubação fosfatada (mg.kg−1 ) quando não inoculada com fungo micorrízico
arbuscular e com adubação nitrogenada em cobertura. Dessa maneira, foi considerado o seguinte modelo de regressão quadrática:
yi = β0 + β1 xi + β2 x2i + εi
(66)
em que:
yi representa o i-ésimo valor observado da produção de matéria seca;
β0 , β1 e β2 são os parâmetros a serem estimados;
xi representa o i-ésimo valor fixo da dose de adubação fosfatada;
εi é o erro experimental associado a observação yi , εi ∼ N 0,σ 2 .
Como suposição básica para a realização do estudo, considerou-se que
todos os parâmetros são significativamente diferentes de zero, principalmente para
β2 .
49
A Figura 3 apresenta o comportamento da produção de matéria seca (y)
em função de diferentes doses de adubação fosfatada (x).
Figura 3
3.2
Dados de produção de matéria seca em função de diferentes doses de
adubação fosfatada
Análise bootstrap
A análise bootstrap paramétrico foi realizada, considerando as estimativas
obtidas via método dos mínimos quadrados, β̂0 , β̂1 , β̂2 , η̂ e σ̂ 2 , como os verdadeiros valores de β0 , β1 , β2 , η e σ 2 , sendo η̂ = −
β̂1
,
2β̂2
o estimador do ponto crítico.
Dessa maneira, 4000 reamostragens foram realizadas, caracterizando diferentes
situações experimentais, em que os erros assumiram uma distribuição normal com
média zero e as seguintes variâncias teóricas: σ 2 10, σ 2 8, σ 2 6, σ 2 4, σ 2 2, σ 2
e 1,5σ 2 .
50
Intervalos de confiança para o ponto crítico foram obtidos, considerando as
fórmulas das variâncias apresentadas por Mood, Graybill e Boes (1974) e D’Aulísio,
Pimentel-Gomes e Nogueira (1976).
Como o estimador do ponto crítico envolve um quociente de variáveis
aleatórias, Mood, Graybill e Boes (1974) propuseram analisar a variância de tal
quociente por meio da expansão da função f (x,y) =
x
y
em série de Taylor. Assim,
de acordo com Lima (2009), a expansão de f (x,y) em torno de (µx ,µy ) é dada
por:
∂f
∂f
f (x,y) = f (µx ,µy ) +
(µx ,µy ) (x − µx ) +
(µx ,µy ) (y − µy ) +
∂x
∂y
2
1 ∂ f
∂2f
2
+
(µ
,µ
)
(x
−
µ
)
+
(µx ,µy ) (x − µx ) (y − µy ) + (67)
x
y
x
2! ∂x2
∂y∂x
∂2f
∂2f
2
+
(µx ,µy ) (y − µy ) +
(µx ,µy ) (x − µx ) (y − µy ) + ...
∂y 2
∂x∂y
Fazendo as derivadas parciais e uma aproximação para funções de duas
variáveis, tem-se:
f (x,y) ≈
+
1
µx
1
µx
+
(x − µx ) − 2 (y − µy ) − 2 (x − µx ) (y − µy ) +
µy
µy
µy
µy
µx
(y − µy )2
µ3y
(68)
A partir da definição de variância, Mood, Graybill e Boes (1974) afirmam
que:
" # x 2
x
x 2
=E
− E
V
y
y
y
(69)
Da aproximação obtida anteriormente, tem-se que:
x
µx
1
µx
E
≈
− 2 Cov [x,y] + 3 V [y]
y
µy
µy
µy
(70)
51
2
Para obter E xy
, foi realizada a expansão de f (x,y) =
x2
y2
em série
de Taylor, obtendo para funções com duas variáves:
f (x,y) ≈
µ2x 2µx
2µ2x
1
+
(x
−
µ
)
−
(y − µy ) + 2 (x − µx )2 −
x
2
2
3
µy
µy
µy
µy
4µx
3µ2
− 3 (x − µx ) (y − µy ) + 4x (y − µy )2
µy
µy
(71)
Aplicando-se o operador esperança matemática, obtém-se:
" #
µ2
1
3µ2
4µx
x 2
≈ x2 + 2 V [x] + 4x V [y] − 3 Cov [x,y]
E
y
µy
µy
µy
µy
(72)
Dessa maneira, tem-se que:
2 x
µx
1
2
1
V
≈
V [x] + 3 V [y] −
Cov [x,y]
y
µy
µ2x
µy
µx µy
(73)
que é a expressão dada por Mood, Graybill e Boes (1974) para o cálculo da variância de um quociente de duas variáveis aleatórias. Assim, a variância do estimador
do ponto crítico pode ser dada por:
V1 (η̂) = V1
−
β̂1
2β̂2

!
=
1  µβ̂1
4
µβ̂2
!2 
h i
V β̂1

h i
V β̂2
+
µ2
β̂1
µ2
β̂2
−
h
2Cov β̂1 ,β̂2
i 
µβ̂1 µβ̂2

(74)
i
h
Para o caso em que a covariância entre β̂1 e β̂2 é nula Cov β̂1 ,β̂2 = 0 ,
a fórmula anterior pode ser simplificada, resultando na mesma fórmula apresenta
por D’Aulísio, Pimentel-Gomes e Nogueira (1976), a qual foi obtida através da
primeira derivada do estimador do ponto crítico em relação a x, sendo dada por:
V2 (η̂) = V2
−
β̂1
2β̂2

!
=
h i
V β̂1
1
4
µ2
β̂2
h i
µ2β̂ V β̂2

+ 1 4
µ
β̂2
(75)
52
Dessa maneira, para cada reamostragem, que originou novas amostras denominadas de amostras bootstrap, intervalos de confiança, considerando V1 (η̂) e
V2 (η̂), foram obtidos:
IC1r (η) = η̂ r ± t(v,α/2)
q
V1r (η̂ r )
(76)
IC2r (η) = η̂ r ± t(v,α/2)
q
V2r (η̂ r )
(77)
para r = 1,...,4000, em que t(v,α/2) é o valor crítico da distribuição t de Student
para v = 15 e α = 5%.
Ao término das 4000 reamostragens, as médias dos intervalos IC1r (η)
e IC2r (η) foram encontradas, obtendo os intervalos IC1 (η) = LI 1 ; LS 1 e
IC2 (η) = LI 2 ; LS 2 , em que LI 1 e LS 1 são as médias dos limites inferior e
superior referentes aos IC1r (η) e LI 2 e LS 2 são as médias dos limites inferior e
superior referentes aos IC2r (η).
Considerando η̂ como a média dos 4000 valores simulados do ponto crítico e a fórmula da variância comum, V3 (η̂), obteve-se o seguinte intervalo de
confiança:
IC3 (η) = η̂ ± t(v,α/2)
p
V3 (η̂)
(78)
em que:
R
P
V3 (η̂) =
i=1
R
P
η̂i2 −
!2
η̂i
i=1
R−1
R
(79)
para v = 3999, R = 4000 e α = 5%.
Intervalos de confiança bootstrap-t foram gerados de acordo com Efron e
Tibshirani (1993), considerando as variâncias V1 (η̂) e V2 (η̂), obtendo, respectiva-
53
mente, IC4 (η) e IC5 (η) com 95% de confiança:
h
i
p
p
IC4 (η) = η̂ − t11−α/2 V1 (η̂); η̂ − t1α/2 V1 (η̂)
(80)
h
i
p
p
IC5 (η) = η̂ − t21−α/2 V2 (η̂); η̂ − t2α/2 V2 (η̂)
(81)
em que η̂ é a estimativa obtida considerando os dados originais e, t1 e t2 são os
valores padronizados e ordenados dos 4000 pontos críticos simulados, na qual t1
e t2 resultam, respectivamente, das padronizações T 1r e T 2r :
η̂ r − η̂
T 1r = p r
V1 (η̂ r )
η̂ r − η̂
T 2r = p r
V2 (η̂ r )
para r = 1,...,4000.
Com os 4000 valores simulados do ponto crítico foram construídos histogramas da distribuição de frequência e realizados os testes de normalidade de
Shapiro-Wilk, assimetria e excesso de curtose assintótico.
Para tanto, os momentos amostrais foram encontrados conforme Mood,
Graybill e Boes (1974), no qual, para os valores simuladosdo ponto crítico, o tR
t
P
ésimo momento amostral é dado por mt =
R. O estimador do
η̂ r − η̂
r=1.
3/2
coeficiente de assimetria é dado por g1 = m3 m2 , sendo que para g1 = 0
a distribuição é simétrica, g1 > 0 a distribuição é assimétrica a direita (assimetria positiva) e para g1 < 0, a distribuição é assimétrica a esquerda (assimetria
negativa). O estimador do coeficiente para avaliar o excesso de curtose é dado
por g2 = m4 m22 − 3. Tendo como referência a distribuição normal, que possui
coeficiente de curtose igual a 0, para g2 = 0, a distribuição é denominada de mesocúrtica, g2 > 0 a distribuição é denominada de leptocúrtica, na qual a curva é
mais afilada e para g2 < 0, a distribuição é denominada de platicúrtica, na qual a
54
curva é mais achatada. Dessa maneira, os testes foram realizados , considerando
que g1 ∼N
˙ (0,6/4000) e g2 ∼N
˙ (0,24/4000) (SNEDECOR; COCHRAN, 1980).
A Figura 4 apresenta, resumidamente, os passos utilizados para a obtenção
dos intervalos de confiança, considerando a metodologia bootstrap para variância
teórica igual a σ 2 8. A análise bootstrap foi realizada no software R (R DEVELOPMENT CORE TEAM, 2012), cuja rotina está apresentada no APÊNDICE A.
Figura 4
Fluxograma para obter os intervalos de confiança, considerando a metodologia bootstrap
55
56
3.3
Análise bayesiana
Considerando que o ponto crítico do modelo de regressão quadrática é
β1
dado por η = − 2β
, o modelo yi = β0 + β1 xi + β2 x2i + εi pode ser reescrito da
2
forma:
yi = β0 − 2ηβ2 xi + β2 x2i + εi
(82)
Dessa maneira, com a finalidade de obter intervalos de confiança bayesianos para os parâmetros do modelo, considerando os dados de produção de matéria
seca em função de diferentes doses de adubação fosfatada, foi analisado o vetor de
parâmetros desconhecidos λ0 = β0 ,β2 ,η,σ 2 .
Para a estimativa dos parâmetros, obteve-se a distribuição a posteriori conjunta, sendo
para isso foram
assumidas
as seguintes distribuições a priori:
que 2
2
β0 ∼ N µβ0 ,σβ0 , β2 ∼ N µβ2 ,σβ2 , η ∼ N µη ,ση2 e σ 2 ∼ IG (α,β).
Pelo teorema de Bayes, a distribuição a posteriori conjunta pode ser descrita da seguinte maneira:
p β0 ,β 2 ,η,σ 2 |y ∝ L y|β0 ,β 2 ,η,σ 2 .p (β0 ) .p (β2 ) .p (η) .p σ 2
−( n +α+1)
2
.
p β0 ,β 2 ,η,σ 2 |y ∝ σ 2
(
2)
n
1 X
2
. exp − 2
yi − β0 + 2ηβ2 xi − β2 xi
.
2σ
i=1
"
#
)
(
1 (β0 − µβ0 )2 (β2 − µβ2 )2 (η − µη )2
β
+
+
− 2
. exp −
2
ση2
σ
σβ20
σβ22
(83)
Com o objetivo de obter aproximações das distribuições marginais dos parâmetros, métodos MCMC foram utilizados para gerar valores das distribuições a
57
posteriori condicionais completas para cada parâmetro. Tais distribuições condicionais foram obtidas a partir da distribuição a posteriori conjunta. A monitoração
da convergência das cadeias foi realizada através de análise gráfica e considerando
os critérios de Raftery e Lewis (1992), por meio do fator de dependência, e de
Geweke (1992), com base na estimativa de um valor p.
Os métodos MCMC foram implementados no software R (R DEVELOPMENT CORE TEAM, 2012) como apresentado no APÊNDICE B, sendo que o
pacote Bayesian Output Analysis (BOA) foi utilizado para avaliar a convergência
das cadeias e realizar a inferência sobre os parâmetros do modelo.
3.4
3.4.1
Análise fuzzy
Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy
Para a análise fuzzy 1, as estimativas dos parâmetros do modelo de regressão quadrática foram consideradas como incertas, sendo que para isso, foram
definidos os números fuzzy β̃0 , β̃1 e β̃2 referentes às estimativas β̂0 , β̂1 e β̂2 , respectivamente. Tais números fuzzy foram representados por meio das seguintes
funções de pertinência triangulares:
µβ̃0 (a) =











µβ̃1 (b) =











0, se
a−a0 +δ1
,
δ1
a0 +δ1 −a
,
δ1
a 6 a0 − δ1
se a0 − δ1 < a 6 a0
se a0 6 a < a0 + δ1
0, se
a > a0 + δ1
0, se
b 6 b0 − δ2
b−b0 +δ2
,
δ2
b0 +δ2 −b
,
δ2
se b0 − δ2 < b 6 b0
se b0 6 b < b0 + δ2
0, se
b > b0 + δ2
(84)
(85)
58
µβ̃2 (c) =











c 6 c0 − δ3
0, se
c−c0 +δ3
,
δ3
c0 +δ3 −c
,
δ3
se c0 − δ3 < c 6 c0
se c0 6 c < c0 + δ3
0, se
(86)
c > c0 + δ3
em que a0 , b0 e c0 são, respectivamente, as estimativas dos parâmetros β0 , β1 e
β2 obtidas via método dos mínimos quadrados que assumem grau de pertinência
máximo igual a 1 em cada função de pertinência e,δ1 , δ2 e δ3 são, respectivamente,
os erros padrão das estimativas β̂0 , β̂1 e β̂2 .
Para realizar a discretização dos números fuzzy, foram considerados ∆,
como sendo um passo no intervalo de cada função de pertinência, e n, como o
número de pontos a serem analisados, tendo, respectivamente, para β̃0 , β̃1 e β̃2 :
∆1 =
(a0 + δ1 ) − (a0 − δ1 )
2δ1
=
n−1
n−1
(87)
∆2 =
(b0 + δ2 ) − (b0 − δ2 )
2δ2
=
n−1
n−1
(88)
∆3 =
2δ3
(c0 + δ3 ) − (c0 − δ3 )
=
n−1
n−1
(89)
O princípio de extensão de Zadeh foi implementado utilizando a linguagem de programação C++ (APÊNDICE C), sendo que as análises gráficas foram
realizadas por meio do software GNUPLOT 4.6. Para tanto, foi considerado o
seguinte modelo, denominado de modelo fuzzy de regressão quadrática:
ỹ = β̃0 + F β̃1 + F β̃2
(90)
em que:
β̃0 =
n
X
µβ̃0 (ai )
i=1
ai
(91)
59
n
X
µβ̃1 (bi )
F β̃1 =
bi x
(92)
n
X
µβ̃2 (ci )
F β̃2 =
ci x2
(93)
i=1
i=1
Assim, de acordo com Pedrycz e Gomide (1998), obteve-se a seguinte
função de pertinência de ỹ:
µ(β̃0 +F (β̃1 )+F (β̃2 )) (z) =
max
{(a,b,c):a+b+c=z}
h
i
min µβ̃0 (a) ,µβ̃1 (b) ,µβ̃2 (c) (94)
Em seguida, para obter uma curva representativa do modelo fuzzy, foi utilizado o método de defuzzificação do Centro de Gravidade para cada valor de x.
Considerando que as estimativas β̂1 e β̂2 são incertas, surge o ponto crítico
fuzzy baseado na divisão de números fuzzy, que é dado por:
η̃ = −
β̃1
2β̃2
(95)
Com o objetivo de determinar η̃ em termos de α-níveis, foram realizadas
operações intervalares de multiplicação e divisão conforme Barros e Bassanezi
(2010), obtendo:
h iα
h
i
"
#
(α)
(α)
(α)
(α)
β11 ; β12
β̃1
β
β
11
i =−
[η̃]α = − h iα = − h
; 12(α) =
(α)
(α)
(α)
2β22 2β21
2β21 ; 2β22
2 β̃2
"
#
(α)
(α)
β
β
= − 12(α) ; − 11(α)
2β21
2β22
(96)
Dessa maneira, os α-níveis obtidos foram denominados de intervalos de
confiança fuzzy com α% de confiança para o ponto crítico fuzzy.
A Figura 5 apresenta um fluxograma referente a análise fuzzy 1.
60
Análise fuzzy 1
Modelo de regressão quadrática
ŷ = βˆ0 + βˆ1x + βˆ2 x 2
Estimativas
β̂ 0 β̂1 β̂ 2
Números fuzzy
β0 β1 β2
Modelo fuzzy de regressão quadrática
y = β0 + β1x + β2 x 2
Ponto crítico fuzzy
β
η = − 1
2β
2
Intervalo de confiança
fuzzy para
o ponto crítico fuzzy
α
[η]
Figura 5
Fluxograma referente à análise fuzzy 1
61
3.4.2
Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de
Buckley
A metodologia de Buckley (2005) consiste em considerar uma estimativa
pontual de um determinado parâmetro como incerta, sendo que tal incerteza é
definida com base em um intervalo de confiança convencional. Para isso, é estabelecida uma relação entre um conjunto composto por todos intervalos de confiança
convencionais 100 (1 − β) %, com 0 < β 6 1, e α-níveis, com 0 < α 6 1 . Dessa
maneira, o conjunto de intervalos de confiança convencionais é transformado em
um número fuzzy, sendo denominado de estimador fuzzy.
Um estimador fuzzy do ponto crítico pode ser obtido de acordo com o
seguinte intervalo de confiança convencional:
IC1−β (η) = η̂ ± t(v,β/2)
p
V (η̂)
(97)
em que v é o grau de liberdade do resíduo do modelo de regressão quadrática e
V (η̂) = V1
−
!
β̂1
2β̂2
h i
h
i 
!2  h i
V
2Cov
β̂
β̂
,
β̂
V
β̂
2
1
2
1
1


= 
+
−
4
µβ̂2
µβ̂1 µβ̂2
µ2
µ2

µβ̂1
β̂1
β̂2
como a variância do ponto crítico de acordo com Mood, Graybill e Boes (1974).
Com isso, obteve-se o seguinte estimador fuzzy para η em termos de αníveis:
Ê = [E1 (α) ; E2 (α)]
(98)
i
h
p
p
Ê = η̂ − t(v,α/2) V (η̂); η̂ + t(v,α/2) V (η̂)
(99)
α
α
para 0 < α 6 1.
Dessa maneira, considerando as estimativas obtidas para os parâmetros via
método dos mínimos quadrados, uma estimativa fuzzy do ponto crítico foi obtida
62
por meio do software MAPLE 12, cuja rotina está apresentada no APÊNDICE D.
A Figura 6 apresenta um fluxograma referente a análise fuzzy 2.
63
Análise fuzzy 2
Intervalo de confiança convencional
IC1− β (η )
Conjunto de intervalos de confiança
convencionais
ࢻ-níveis
Estimador fuzzy do ponto crítico
= ηˆ − t ( v,α 2) V (ηˆ ) ;ηˆ + t ( v,α 2) V (ηˆ ) 


α
( Eˆ )
Figura 6
Fluxograma referente à análise fuzzy 2
64
4
RESULTADOS E DISCUSSÃO
De acordo com o método dos mínimos quadrados, o modelo de regressão quadrática ajustado foi igual a ŷ = 73,1929 + 1,1413x − 0,0035x2 , com
R2 = 0,9864, que explica 98,64% da variabilidade dos dados, denotando um modelo adequado para os dados de produção de matéria seca (y) em função das doses
crescentes (x) de adubação fosfatada, e σ 2 = σ̂ 2 = 182,45. A estimativa pontual do ponto crítico foi de 163,0429 mg.kg−1 de adubo fosfatado, resultando na
produção máxima de matéria seca.
4.1
Análise bootstrap
As Tabelas 2 a 5 apresentam, como exemplos, as 1a e 2a amostras boots
trap para as variâncias teóricas σ 2 10 = 18,25 e σ 2 2 = 91,23, assim como as
estimativas obtidas para cada parâmetro do modelo e os intervalos de confiança,
considerando as fórmulas de variâncias de Mood, Graybill e Boes (1974), IC1r ,
dada em (74), e de D’Aulísio, Pimentel-Gomes e Nogueira (1976), IC2r , dada em
(75), para o ponto crítico.
65
Tabela 2
Valores estimados da produção de matéria seca na primeira amostra
bootstrap para variância teórica igual a 18,25 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos
de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos
de confiança (IC11 e IC21 ) para o ponto crítico.
Doses
(x)
0
50
100
150
200
Parâmetro
β0
β1
β2
η
Tabela 3
1
76,2735
122,0854
155,1065
164,9605
161,6751
Estimativas
74,4186
1,1481
-0,0036
Esimativa
160,4942
Repetição
Média
2
3
4
(ȳ)
81,6374
74,6918
68,4722
75,2687
123,6193 116,5861 121,5176 120,9521
155,0959 149,3904 157,0042 154,1493
178,2223 160,6313 164,8602 167,1686
157,2155 167,8994 154,5995 160,3474
IC
[69,0783; 79,7589]
[1,0216; 1,2746]
[-0,0042; -0,0030]
IC21
IC11
[149,0735; 171,9149] [128,0329; 192,9555]
Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 18,25 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de
confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos
de confiança (IC12 e IC22 ) para o ponto crítico.
Doses
(x)
0
50
100
150
200
Parâmetros
β0
β1
β2
η
1
75,2814
119,8854
148,9168
165,9986
175,2504
Esimativas
74,4201
1,1509
-0,0034
Esimativa
168,0744
Repetição
Média
2
3
4
(ȳ)
72,8466
75,0123
66,3474
72,3719
127,1537 125,2472 116,6153 122,2254
152,8784 152,2791 150,3163 151,0977
167,9876 172,8200 173,5792 170,0964
164,3434 156,0028 164,2843 164,9702
IC
[67,5066; 77,3336]
[1,0345; 1,2673]
[-0,0040; -0,0029]
IC12
IC22
[155,9744; 180,1743] [135,8293; 200,3195]
66
Tabela 4
Valores estimados da produção de matéria seca na primeira amostra
bootstrap para variância teórica igual a 91,23 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos
de confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos
de confiança (IC11 e IC21 ) para o ponto crítico.
Doses
(x)
0
50
100
150
200
Parâmetro
β0
β1
β2
η
Tabela 5
1
77,1017
109,8889
125,8993
148,7863
160,9462
Esimativas
76,0534
1,0546
-0,0032
Esimativa
166,6423
Repetição
Média
2
3
4
(ȳ)
68,6865
72,0974
83,4879
75,3434
126,4010 137,1387 120,4432 123,4680
145,9273 155,8368 157,7338 146,3493
170,7925 166,2197 174,8097 165,1521
160,3773 154,0380 164,3993 159,9402
IC
[65,6905; 86,4163]
[0,8091; 1,3001]
[-0,0043; -0,0020]
IC21
IC11
[139,5185; 193,7660] [93,5125; 239,7720]
Valores estimados da produção de matéria seca na segunda amostra bootstrap para variância teórica igual a 91,23 e, estimativas dos parâmetros (β0 , β1 e β2 ) do modelo de regressão quadrática, dos intervalos de
confiança dos parâmetros, estimativa do ponto crítico (η) e intervalos
de confiança (IC12 e IC22 ) para o ponto crítico.
Doses
(x)
0
50
100
150
200
Parâmetro
β0
β1
β2
η
1
71,3733
107,3854
149,1595
145,3169
155,0243
Estimativas
67,5119
1,1723
-0,0034
Estimativa
172,9682
Repetição
Média
2
3
4
(ȳ)
73,1046
64,4405
72,9719
70,4726
122,8377 102,3631 104,9031 109,3723
147,4707 175,1896 159,9557 157,9439
171,7679 171,9503 174,7480 165,9458
180,0145 170,2966 157,9658 165,8253
IC
[56,6297; 78,3941]
[0,9145; 1,4301]
[-0,0046; -0,0022]
IC12
IC22
[144,2482; 201,6882] [99,2959; 246,6404]
67
Dando continuidade ao processo de reamostragem, a Tabela 6 apresenta os
valores médios das estimativas obtidas nas 4000 reamostragens para o ponto crítico
(η) e para os cinco diferentes intervalos de confiança propostos (IC1 , IC2 , IC3 ,
IC4 e IC5 ) em função das diferentes variâncias teóricas do erro experimental.
Constata-se que as estimativas do ponto crítico não se alteraram muito, sendo que
ligeiro aumento ocorreu com o incremento da variância teórica. Os resultados da
Tabela 6 mostram que a variância residual afeta grandemente na estimação dos
IC para o ponto crítico. À medida em que a variância foi aumentada, os IC
tenderam a apresentar maior amplitude, sugerindo a existência de menor precisão.
Tal resultado também foi verificado por Nunes et al. (2004), ao trabalharem com
diferentes fórmulas de variância do ponto crítico na avaliação da produção máxima
de cultura de algodão. Esse fato vem alertar os pesquisadores na condução do
experimento com adubação, na qual tem-se o interesse de estimar a dose ótima.
Para se ter uma confiança maior na estimação e provavelmente na indicação dessa
dose ótima, maior precisão deve ser buscada no experimento.
Dentre os intervalos de confiança IC1 e IC2 , que consideram a média
dos intervalos obtidos ao longo das amostras bootstrap, o intervalo IC1 apresenta
maior precisão; isso pode ser verificado pela menor amplitude do intervalo, talvez
devido ao fato de que o seu estimador leva em consideração a covariância entre
β1 e β2 . De acordo com o método bootstrap-t, o intervalo de confiança IC5 , que
adota a fórmula da variância do ponto crítico proposta por D’Aulísio, PimentelGomes e Nogueira (1976), apresenta maior precisão nas diferentes variâncias teóricas. Dentre os intervalos analisados, o intervalo IC3 , que considera a fórmula
da variância comum, apresenta maior precisão, sendo plausível de uso apenas nos
estudos simulados, já que seu cálculo é realizado com as estimativas obtidas em
cada reamostragem.
Tabela 6
η̂
163,3530
163,4712
163,7060
163,8023
164,3920
166,3862
168,8741
163,3530
163,4712
163,7060
163,8023
164,3920
166,3862
168,8741
Variância teórica
18,25
22,81
30,41
45,61
91,23
182,45
273,68
18,25
22,81
30,41
45,61
91,23
182,45
273,68
IC1
[154,8201; 174,6262]
[153,5733; 175,5041]
[151,7800; 177,4687]
[149,1687; 181,0721]
[142,4399; 188,9732]
[131,9563; 203,6495]
[121,0386; 217,8047]
IC4
[136,6507; 198,6299]
[137,8673; 201,6671]
[137,9856; 200,6145]
[138,6562; 202,1101]
[140,8762; 204,3448]
[144,4611; 207,6514]
[146,6550; 208,9989]
IC2
[137,6701; 191,7763]
[134,5575; 194,5199]
[129,5610; 199,6877]
[121,8582; 208,3826]
[103,4622 227,9509]
[75,2951; 260,3107]
[50,3690; 288,4744]
IC5
[134,4101; 196,3963]
[135,3851; 198,6848]
[134,8911; 197,3944]
[134,9878; 198,0169]
[135,8579; 198,8485]
[138,6340; 199,7231]
[140,2485; 199,2429]
IC3
[155,1041; 174,3423]
[153,8705; 175,2070]
[152,4681; 176,7806]
[149,6936; 180,5473]
[142,5117; 188,9015]
[132,3825; 203,2233]
[117,5615; 221,2819]
Valores médios do ponto crítico e dos diferentes intervalos de confiança, de acordo com as variâncias teóricas
consideradas, utilizando o método de reamostragem.
68
69
A Tabela 7 apresenta os resultados referentes ao teste de assimetria assintótico (g1 ) e excesso de curtose assintótico (g2 ), além da estatística W de ShapiroWilk para os valores do ponto crítico nas diversas simulações. As estimativas dos
coeficientes de assimetria e curtose aumentaram com o incremento da variância
teórica. Os testes de assimetria e curtose indicam que, com o aumento da variância
teórica, as estimativas do ponto crítico tendem a não seguir ao de uma distribuição
normal, sendo tal resultado verificado pela estatística W de Shapiro-Wilk.
As Figuras 7 a 13 apresentam os histogramas dos valores simulados do
ponto crítico, considerando as diferentes variâncias teóricas. Pode-se visualizar
que nas menores variâncias, os gráficos sugerem certa aproximação da curva normal. Pode-se observar que a partir da variância teórica igual a 30,41, o ponto
crítico apresenta maior tendência a uma distribuição de frequência com assimetria
positiva e formato do tipo leptocúrtico.
Tabela 7
Resultados para o teste de assimetria assintótico (g1 ), excesso de curtose assintótico (g2 ) e estatística W de Shapiro-Wilk referentes aos valores simulados do ponto crítico.
Variância teórica σ 2
18,25
22,81
30,41
45,61
91,23
182,45
273,68
*significativo a 5%
Assimetria (g1 )
0,41704∗
0,4337∗
0,4372∗
0,5884∗
1,1794∗
1,4561∗
3,2498∗
Curtose (g2 )
0,31307∗
0,5822∗
0,2574∗
0,9597∗
3,6228∗
4,2560∗
25,1194∗
W
0,9904∗
0,9899∗
0,9890∗
0,9823∗
0,9437∗
0,9151∗
0,7858∗
70
Figura 7
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 18,25
Figura 8
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 22,81
71
Figura 9
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 30,41
Figura 10
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 45,61
72
Figura 11
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 91,23
Figura 12
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 182,45
73
Figura 13
4.2
Distribuição de frequência dos valores simulados do ponto crítico para
variância teórica igual a 273,68
Análise bayesiana
A partir da distribuição a posteriori conjunta dada em (83), a distribuição
a posteriori condicional completa para o parâmetro β0 é dada por:
n
2
1 X
2
p β0 |β2 ,η,σ ,y ∝ exp − 2
yi − β0 + 2β2 ηxi − β2 x2i
2σ
i=1
)
(
1
. exp − 2 [β0 − µβ0 ]2
2σβ0
(
)
Fazendo yi∗ = yi + 2β2 ηxi − β2 x2i , obtém-se:
n
1 X ∗
∝ exp − 2
[yi − β0 ]2
2σ
(
i=1
)
(
1
. exp − 2 [β0 − µβ0 ]2
2σβ0
)
.
(100)
74
Desenvolvendo-se os quadrados, tem-se:
n
1 X ∗2
∝ exp − 2
yi − 2yi∗ β0 + β02
2σ
(
i=1
)
(
1 . exp − 2 β02 − 2β0 µβ0 + µ2β0
2σβ0
)
Resolvendo o somatório e rearranjando-se os termos, considerando que os
termos que não dependem de β0 são constantes, obtém-se:
)
"
#
n
X
1
1
∝ exp − 2 −2β0
yi∗ + nβ02 −
β02 − 2β0 µβ0 + µ2β0
2
2σ
2σ
β0
i=1
(
"
#)
n
X
1
∝ exp − 2 2 −2β0 σβ20
yi∗ + nβ02 σβ20 + β02 σ 2 − 2β0 σ 2 µβ0 + σ 2 µ2β0
2σ σβ0
i=1
(
(
"
1
∝ exp − 2 2 β02 nσβ20 + σ 2 − 2β0
2σ σβ0
σβ20
n
X
#)
!
yi∗
2
+ σ µβ0
+
σ 2 µ2β0
i=1


2 
n
P


2
∗
2



σβ0
yi + σ µβ0 

 nσ 2 + σ 2 

β0
i=1


β
−
∝ exp −
0
 

2σ 2 σβ20 
nσβ20 + σ 2






que é o núcleo de uma distribuição normal. Dessa maneira, a distribuição a posteriori condicional completa para β0 é uma normal:


β0 |β2 ,η,σ 2 ,y ∼ N 

σβ20
n
P
i=1
yi + 2β2 ηxi − β2 x2i + σ 2 µβ0
nσβ20 + σ 2

σ 2 σβ20 

, 2
nσβ0 + σ 2 
(101)
A distribuição a posteriori condicional completa para o parâmetro β2 é
75
dada por:
n
2
1 X
p β2 |β0 ,η,σ 2 ,y ∝ exp − 2
yi − β0 + 2β2 ηxi − β2 x2i
2σ
i=1
)
(
1
2
. exp − 2 [β2 − µβ2 ]
2σβ2
(
)
.
(102)
Fazendo yi∗ = yi − β0 , obtém-se:
n
2
1 X ∗
∝ exp − 2
yi + 2β2 ηxi − β2 x2i
2σ
(
)
i=1
n
1 X ∗
∝ exp − 2
[yi + β2 xi (2η − xi )]2
2σ
(
)
i=1
(
)
(
)
1
. exp − 2 [β2 − µβ2 ]2
2σβ2
1
. exp − 2 [β2 − µβ2 ]2
2σβ2
Desenvolvendo-se os quadrados, tem-se:
)
n
i
1 X h ∗2
yi + 2yi∗ β2 xi (2η − xi ) + β22 x2i (2η − xi )2 .
∝ exp − 2
2σ
i=1
(
)
1 2
2
. exp − 2 β2 − 2β2 µβ2 + µβ2
2σβ2
(
Resolvendo o somatório e rearranjando-se os termos, considerando que os
termos que não dependem de β2 são constantes, obtém-se:
"
#
n
n
X
X
1
yi∗ xi (2η − xi ) + β22
x2i (2η − xi )2
∝ exp − 2 2β2
2σ
i=1
i=1
)
1 − 2 β22 − 2β2 µβ2 + µ2β2
2σβ2
(
76
ou
"
n
X
1
2
yi∗ xi (2η − xi )+
∝ exp − 2 2 2β2 σβ2
2σ σβ2
i=1
(
+β22 σβ22
n
X
#)
x2i (2η − xi )2 + β22 σ 2 − 2β2 σ 2 µβ2 + σ 2 µ2β2
i=1
ou ainda
(
"
1
∝ exp − 2 2 β22
2σ σβ2
−2β2
−σβ22
n
X
σβ22
n
X
!
x2i (2η − xi )2 + σ 2
−
i=1
#)
!
yi∗ xi (2η
2
− xi ) + σ µβ2
+
σ 2 µ2β2
i=1
reagrupando

n
P
2


x2i (2η − xi )2 + σ 2
 σβ2
i=1
∝ exp −

2σ 2 σβ22




β2 −

n
P


yi∗ xi (2η − xi ) + σ 2 µβ2 

i=1

n

P


σβ22
x2i (2η − xi )2 + σ 2
−σβ22
i=1
que é o núcleo de uma distribuição normal. Dessa maneira, a distribuição a posteriori condicional completa para β2 é uma normal:

2

β2 |β0 ,η,σ ,y ∼ N 

−σβ22
n
P
(yi − β0 ) xi (2η − xi ) + σ 2 µβ2
i=1
σβ22
n
P
i=1
,
x2i (2η
2
− xi ) +

σ 2 σβ22
,
σβ22
n
P
i=1
x2i (2η − xi )2 + σ 2
σ2
(103)



A distribuição a posteriori condicional completa para o parâmetro η é dada
77
por:
n
(
2
1 X
p η|β0 ,β2 ,σ 2 ,y ∝ exp − 2
yi − β0 + 2β2 ηxi − β2 x2i
2σ
i=1
1
2
. exp − 2 [η − µη ]
2ση
)
.
(104)
Fazendo yi∗ = yi − β0 − β2 x2i , obtém-se:
n
1 X ∗
∝ exp − 2
[yi + 2β2 ηxi ]2
2σ
(
)
i=1
1
. exp − 2 [η − µη ]2
2ση
Desenvolvendo-se os quadrados, tem-se:
n
(
1 X ∗2
∝ exp − 2
yi + 2yi∗ β2 ηxi + 4β22 η 2 x2i
2σ
i=1
1 . exp − 2 η 2 − 2ηµη + µ2η
2ση
)
.
Resolvendo o somatório e rearranjando-se os termos, considerando que os
termos que não dependem de η são constantes, obtém-se:
"
#
n
n
X
X
1
1 2
2
∗
2 2
2
∝ exp − 2 2β2 η
yi xi + 4β2 η
xi − 2 η − 2ηµη + µη
2σ
2ση
(
i=1
i=1
ou
"
n
X
1
yi∗ xi +
∝ exp − 2 2 2β2 ηση2
2σ ση
(
i=1
+
4β22 η 2 ση2
n
X
i=1
#)
x2i
2 2
2
+ η σ − 2ησ µη +
σ 2 µ2η
78
agrupando
1
∝ exp − 2 2
2σ ση
−2η
"
η2
−β2 ση2
4β22 ση2
n
X
!
x2i + σ 2
−
i=1
n
X
!
yi∗ xi
2
#)
+
+ σ µη
σ 2 µ2η
i=1
reagrupando, obtém-se:

2 

n
n
P
P


2
2
2
2
2
∗
2



−β2 ση
yi x i + σ µη 
xi + σ

 4β2 ση


i=1
i=1


∝ exp −
n
 
η −
P

2σ 2 ση2
2σ2




4β
x2i + σ 2
2 η


i=1
que é o núcleo de uma distribuição normal. Dessa maneira, a distribuição a posteriori condicional completa para η é uma normal:

−β2 ση2
n
P
yi − β0 − β2 x2i xi + σ 2 µη
i=1

η|β0 ,β2 ,σ 2 ,y ∼ N 

4β22 ση2
,
n
P
i=1
x2i

,
+
σ2
(105)

σ 2 ση2

n

P
2
2
2
2
4β2 ση
xi + σ
i=1
A distribuição a posteriori condicional completa para o parâmetro σ 2 é
dada por:
(
n
1 X
exp − 2
p σ |β0 ,β2 ,η,y ∝ σ
[yi − β0 + 2β2 ηxi −
2σ
i=1
(106)
o
β
2
−β2 x2i
. exp − 2
σ
2
n
2 − 2 −α−1
Dessa maneira, rearranjando-se os termos, a distribuição a posteriori con-
79
dicional completa para σ 2 é uma gama inversa:
∝ σ
n
2 −( +α+1)
2
(
1
exp − 2
σ
n
2
1 X
yi − β0 + 2β2 ηxi − β2 x2i + β
2
!)
i=1
n
σ 2 |β0 ,β2 ,η,y ∼ IG α∗ = + α,
2
!
n
1 X
∗
2 2
,β =
yi − β0 + 2β2 ηxi − β2 xi + β
2
i=1
(107)
Como as distribuições a posteriori condicionais completas são de formas
conhecidas, no caso, distribuição normal para β0 , β2 e η e, distribuição gama
inversa para σ 2 , utilizou-se o algoritmo Gibbs para amostrar tais distribuições.
A Tabela 8 apresenta os critérios de Raftery e Lewis e, Geweke, utilizados
na análise da convergência das cadeias de cada um dos parâmetros. De acordo com
o critério de Raftery e Lewis, os fatores de dependência (FD) de cada parâmetro
apresentam valores menores do que cinco, denotando a convergência das cadeias.
Pelo critério de Geweke, observa-se que os valores de p são maiores que o nível
de significância pré-fixado de 5%, não apresentando, dessa maneira, evidências
contra a convergência.
Tabela 8
Estimativas dos critérios de Raftery e Lewis e, Geweke, utilizados na
avaliação da convergência das cadeias amostradas.
Parâmetros
β0
β2
η
σ2
Raftery e Lewis (FD)
1,0149
1,0149
0,9904
0,9824
Geweke (valor p)
0,4230
0,9748
0,3514
0,6503
Os resultados apresentados na Tabela 8 podem ser confirmados por meio
da visualização gráfica do traço da cadeia, nas Figuras 14 a 17, justificando que as
cadeias se encontram em equilíbrio. Ainda nas Figuras 14 a 17, têm-se os gráficos
80
das distribuições a posteriori marginais para cada parâmetro.
A Tabela 9 apresenta as média a posteriori para os parâmetros, assim como
o intervalo de confiança bayesiano (HPD) com coeficiente de credibilidade de 95%
para cada parâmetro do modelo. O intervalo de confiança bayesiano encontrado
para η apresenta alta precisão, com magnitude igual a 0,1217. Intervalos de confiança bayesiano com alta precisão também foram encontrados por Buonaccorsi e
Gatsonis (1988), na qual utilizaram prioris normais para avaliar a razão de coeficientes de modelos de regressão linear simples no estudo de biodisponibilidade de
nutrientes em alimentos.
Tabela 9
Valores médios obtidos pela distribuição a posteriori dos parâmetros e
seus respectivos limites inferior e superior dos intervalos de confiança
bayesianos (HPD).
Parâmetros
Média
β0
β2
η
σ2
73,0006
-0,0035
162,9932
180,0873
HPD
LI
LS
72,9395
73,0614
-0,0038
-0,0032
162,9295 163,0547
107,2225 267,1666
81
Figura 14
Traço da cadeia e gráfico da distribuição a posteriori marginal para o
parâmetro β0
Figura 15
Traço da cadeia e gráfico da distribuição a posteriori marginal para o
parâmetro β2
82
Figura 16
Traço da cadeia e gráfico da distribuição a posteriori marginal para o
parâmetro η
Figura 17
Traço da cadeia e gráfico da distribuição a posteriori marginal para o
parâmetro σ 2
83
4.3
4.3.1
Análise fuzzy
Análise 1: ponto crítico fuzzy baseado na divisão de números fuzzy
A Tabela 10 apresenta as estimativas dos parâmetros do modelo de regressão quadrática por meio do método dos mínimos quadrados e os erros padrão
das estimativas, considerando os dados de produção de matéria seca em função de
diferentes doses de adubação fosfatada.
Tabela 10
Estimativas dos parâmetros do modelo de regressão quadrática e respectivos erros padrão das estimativas.
Parâmetro
β0
β1
β2
Estimativa
73,1929
1,1413
-0,0035
Erro padrão
6,0839
0,1441
0,0007
Considerando os erros padrão das estimativas como incertezas no modelo
fuzzy de regressão quadrática, as seguintes funções de pertinência triangulares foram obtidas:
µβ̃0 (a) =











µβ̃1 (b) =
0, se
a−67,1090
6,0839 ,
79,2768−a
6,0839 ,











a 6 67,1090
se 67,1090 < a 6 73,1929
se 73,1929 6 a < 79,2768
0, se
a > 79,2768
0, se
b 6 0,9972
b−0,9972
0,1441 ,
1,2854−b
0,1441 ,
se 0,9972 < b 6 1,1413
se 1,1413 6 b < 1,2854
0, se
b > 1,2854
(108)
(109)
84
µβ̃2 (c) =











0, se
c+0,0042
0,0007 ,
−0,0028−c
0,0007 ,
c 6 −0,0042
se −0,0042 < c 6 −0,0035
se −0,0035 6 c < −0,0028
0, se
(110)
c > −0,0028
A Figura 18 apresenta a solução do modelo fuzzy de regressão quadrática
através do princípio de extensão de Zadeh, em que a escala entre 0 e 1 representa
os graus de pertinência de y (produção de matéria seca, g.vaso−1 ), sendo que a
região amarela representa os valores de y com pertinência em torno de 1. Pode-se
observar que para cada valor de x (dose de adubação fosfatada, mg.kg−1 ) têm-se
incertezas quanto ao valor de y. Como exemplo, em x = 160, tem-se pertinência
em torno de 0 para y = 120 e, para y = 165, tem-se pertinência em torno de 1.
Ainda pode-se verificar que incertezas quanto a y são menos presentes para valores
menores de x. A Figura 19 apresenta a solução defuzzificada do modelo fuzzy
pelo método do Centro de Gravidade e a solução clássica obtida pelo método dos
mínimos quadrados.
85
Figura 18
Solução do modelo fuzzy de regressão quadrática, considerando os dados de produção de matéria seca (y) em função de diferentes doses de
adubação fosfata (x)
Figura 19
Solução defuzzificada do modelo fuzzy de regressão quadrática e solução clássica obtida pelo método dos mínimos quadrados, considerando
os dados de produção de matéria seca (y) em função de diferentes doses de adubação fosfata (x)
86
De acordo com os números fuzzy β̃1 e β̃2 , foi obtido o ponto crítico fuzzy
em termos de α-nível:
[0,1441α + 0,9972; −0,1441α + 1,2854]
[η̃]α =
=
[0,0014α + 0,0056; −0,0014α + 0,0084]
0,1441α + 0,9972 −0,1441α + 1,2854
=
;
−0,0014α + 0,0084 0,0014α + 0,0056
(111)
Expressando [η̃]α em termos de função de pertinência, obteve-se:
µη̃ (x) =











0, se
0,9972−0,0084x
−0,1441−0,0014x ,
1,2854−0,0056x
0,1441+0,0014x ,
x 6 118,7143
se 118,7143 < x 6 163,0429
se 163,0429 6 x < 229,5357
0, se
(112)
x > 229,5357
A Figura 20 apresenta a função de pertinência de η̃, representado as incertezas quanto ao ponto crítico. Como exemplo, para um ponto crítico igual a 180,
tem-se grau de pertinência igual a 0,70 no conjunto η̃, sendo que para um ponto
crítico igual a 125, tem-se grau de pertinência igual a 0,17.
87
Figura 20
Representação gráfica da função de pertinência do ponto crítico fuzzy
A Tabela 11 apresenta intervalos de confiança fuzzy para o ponto crítico
fuzzy para α-níveis entre 0,20 e 1,00 . Tem-se, por exemplo, de acordo com a definição de α-nível, valores de x entre 160,4095 e 165,7294 pertencem ao conjunto
clássico [η̃]0,95 ; nesse caso, o intervalo [η̃]0,95 = [160,4095; 165,7294] é definido
como um intervalo de confiança fuzzy com 95% de confiança para o ponto crítico fuzzy. Com isso, têm-se 95% de possibilidade de obter aproximadamente a
produção máxima de matéria seca considerando doses entre 160,4095 e 165,7294
mg.kg−1 de adubação fosfatada. Para α = 1,00, em que se tem a pertinência máxima, [η̃]1,00 = [163,0429; 163,0429] representa um intervalo de confiança fuzzy
com 100% de confiança para o ponto crítico fuzzy, sendo que diante das incertezas
consideradas, uma dose igual a 163,0429 mg.kg−1 de adubação fosfatada proporciona aproximadamente a produção máxima de matéria seca, sendo que tal dose
corresponde a estimativa pontual obtida utilizando o método dos mínimos quadrados. Como a maior dose de adubação fosfatada utilizada no experimento foi igual
a 200 mg.kg−1 , os intervalos de confiança fuzzy com α-níveis menores do que 0,40
não fazem sentido prático, pois extrapolam o limite superior utilizado.
Diante dos resultados apresentados, operações intervalares fuzzy se mostram como uma alternativa apropriada para analisar estimadores, como verificado
88
por Lee (2001).
Tabela 11
Limites inferior (η1α ) e superior (η2α ) do intervalo de confiança fuzzy
para o ponto crítico fuzzy, considerando α-níveis entre 0,20 e 1,00.
[η̃]α
α
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
4.3.2
η1α
126,3571
128,3509
130,3797
132,4444
134,5459
136,6853
138,8636
141,0819
143,3413
145,6429
147,9879
150,3776
152,8132
155,2961
157,8277
160,4095
163,0429
η2α
213,7041
209,9790
206,3405
202,7857
199,3117
195,9157
192,5952
189,3477
186,1708
183,0622
180,0198
177,0414
174,1250
171,2688
168,4708
165,7294
163,0429
Análise 2: estimador fuzzy do ponto crítico baseado na metodologia de
Buckley
De acordo com as estimativas dos parâmetros do modelo de regressão quadrática, considerando os dados de produção de matéria seca em função de diferentes doses de adubação fosfatada, obteve-se a estimativa fuzzy do ponto crítico em
termos de α-níveis:
Ê = 163,0429 − t(15,α/2) .14,3653; 163,0429 + t(15,α/2) .14,3653 (113)
α
em que t(v,α/2) é o valor crítico da distribuição t de Student para v = 15.
89
Por exemplo, para α = 0,95, tem-se que:
Ê
0,95
= [162,1269; 163,9589]
na qual, com grau de possibilidade igual a 0,95, valores do ponto crítico entre
162,1269 e 163,9589 mg.kg−1 de adubação fosfatada fornecem aproximadamente
a produção máxima da cultura. A Tabela 12 apresenta a estimativa fuzzy Ê
ponto crítico considerando α-níveis entre 0,65 e 1,00.
α
do
A Figura 21 apresenta a função de pertinência da estimativa fuzzy, na qual
pode-se observar que a estimativa pontual do ponto crítico obtida pelo método dos
mínimos quadrados, x = η̂ = 163,0429, apresenta grau de pertinência igual a
1,00. Dessa maneira, a estimativa fuzzy oferece, com certo grau de pertinência,
valores do ponto crítico que resultam aproximadamente na produção máxima da
cultura.
De acordo com Buckley (2005), a estimativa fuzzy do ponto crítico contém mais informações do que uma simples estimativa pontual ou intervalar convencional, sendo que a estimativa fuzzy contém a estimativa pontual η̂ e todos
os 100 (1 − β) %. Tal resultado também é enfatizado por Parchami e Mashinchi
(2007), na qual utilizaram a metodologia de Buckley em índices de capacidade de
processos no controle da qualidade de produtos e serviços.
Tabela 12 Estimativa fuzzy Ê
do ponto crítico considerando α-níveis entre
α
0,65 e 1,00.
α
Ê
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
[156,3916; 169,6942]
[157,4004; 168,6854]
[158,3807; 167,7052]
[159,3383; 166,7475]
[160,2788; 165,8070]
[161,2069; 164,8789]
[162,1269; 163,9589]
[163,0429; 163,0429]
α
90
Figura 21
Representação gráfica da função de pertinência da estimativa fuzzy do
ponto crítico, utilizando a metodologia de Buckley
91
5
CONCLUSÃO
Na estimação de intervalos de confiança para o ponto crítico do modelo de
regressão quadrática, conclui-se que:
1. a metodologia bootstrap paramétrico mostrou-se como uma excelente alternativa para a construção de intervalos de confiança para o ponto crítico, cujo
estimador envolve um quociente de variáveis aleatórias, e para a análise da
distribuição de frequência diante de diferentes situações experimentais. Diante das simulações realizadas, sugere-se usar intervalos de confiança que
consideram a covariância entre os parâmetros do modelo;
2. como alternativa a construção de intervalos de confiança convencionais, a
análise bayesiana mostrou-se de fácil aplicação de acordo com as prioris
adotadas para os parâmetros do modelo de regressão quadrática, sendo que
o intervalo de confiança bayesiano obtido para o ponto crítico apresenta uma
interpretação mais direta do que a de um intervalo de confiança convencional, pois todas as informações da inferência estão resumidas na distribuição
a posteriori;
3. as incertezas incorporadas no modelo de regressão quadrática proporcionaram a obtenção do ponto crítico fuzzy, na qual por meio de operações aritméticas intervalares, resultou na construção de intervalos de confiança fuzzy
satisfatórios. Diante da metodologia apresentada, o pesquisador pode analisar incertezas advindas de especialistas e dados estatísticos no modelo de
regressão, e avaliar níveis de possibilidade para se obter um intervalo para o
ponto crítico;
4. a metodologia de Buckley fornece uma análise mais completa de um intervalo de confiança convencional por meio de um estimador fuzzy. Dessa
maneira, o pesquisador pode avaliar o comportamento de tal estimador diante de diferentes incertezas.
92
REFERÊNCIAS
AKBARI, M. GH.; REZAEI, A. H. Order statistics using fuzzy random variables.
Statistics and Probability Letters, n. 79, p. 1031-1037, 2009.
BARGIELA, A.; PEDRYCZ, W.; NAKASHIMA, T. Multiple regression with
fuzzy data. Fuzzy Sets and Systems, n. 158, p. 2169-2188, 2007.
BARROS, L. C.; BASSANEZI, R. C. Tópicos de lógica fuzzy e biomatemática.
2. ed. Campinas: IMECC-UNICAMP, 2010. 404 p.
BOX, G. E. P.; TIAO, G. C. Bayesian inference in statistical analysis. New
York: John Wiley, 1992. 558 p.
BUCKLEY, J. J. Fuzzy statistics: hypothesis testing. Soft Comput, n. 9, p.
512-518, 2005.
BUONACCORSI, J. P.; GATSONIS, C. Bayesian inference for ratios of
coefficients in a linear model. Biometrics, Oxford, v. 44, n. 1, p. 87-101, 1988.
CASELLA, G.; BERGER, R. L. Inferência estatística. São Paulo: Cengage
Learning, 2010. 588 p.
CHARNET, R. et al. Análise de modelos de regressão linear com aplicação. 2.
ed. Campinas: UNICAMP, 2008. 368 p.
CHIB, S.; GREENBERG, E. Understanding the Metropolis-Hastings Algorithm.
The American Statistician, Alexandria, v. 49, n. 4, p. 327-335, Nov. 1995.
D’AULISIO, M. B. G.; PIMENTEL-GOMES, F.; NOGUEIRA, I. R. Estudo da
distribuição dos pontos de máximo ou de mínimo de equações de regressão de
segundo grau. Anais da Escola Superior de Agricultura "Luiz de Queiroz",
Piracicaba, v. 38, p. 291-307, 1976.
93
DRAPER, N. R.; SMITH, H. Applied regression analysis. 3. ed. New York:
John Wiley & Sons, 1998. 706 p.
EFRON, B. Bootstrap methods: Another look at the Jackkinef. The Annals of
Statistics, n. 1, p. 1-20, 1979.
EFRON, B.; TIBSHIRANI, R. An introduction to the Bootstrap. London:
Chapman & Hall, 1993. 436 p.
FALSAFAIN, A.; TAHERI, S. M.; MASHINCHI, M. Fuzzy estimation of
parameters in statistical models. International Journal of Computational and
Mathematical Sciences, v. 2, n. 2, p. 79-85, 2008.
FERREIRA, D. Estatística básica. 2. ed. Lavras: UFLA, 2009. 664 p.
FIELLER, E. C. Some Problems in Interval Estimation. Journal of the Royal
Statistical Society - Series B, v. 16, n. 2, p. 175-185, 1954.
FREITAS, A. R. A variância dos pontos de máximo ou de mínimo de
equações de regressão de segundo grau, 1978. 81 p. Dissertação (Mestrado em
Estatística e Experimentação Agronômica) - Escola Superior de Agricultura Luiz
de Queiroz. Universidade de São Paulo, Piracicaba, SP.
GAMERMAN, D. Markov Chain Monte Carlo: Stochastic Simulation for
Bayesian Inference. Londres: Chapman & Hall, 1997. 245 p.
GELFAND, A. E.; SMITH, A. F. M. Sampling based approaches for calculating
marginal desities. Journal of the American Statistical Association, London, v.
85, n. 410, p. 398-409, Jun. 1990.
GEWEKE, J. Evaluating the accuracy of sampling-based approaches to the
calculation of posterior moments. In: BERNARDO, J. M.; BERGER, J. O.;
DAWID, A. P.; SMITH, A. F. M. (Ed.). Bayesian Statistics 4. New York: Oxford
University Press, 1992. 526 p.
94
GONZALEZ-RODRIGUES, G.; COLUBI, A.; GIL, A. M. A fuzzy
representation of random variables: an operacional tool in exploratory analysis
and hypothesis testings. Computational Statistics and Data Analysis, n. 51, p.
163-176, 2006.
GRZEGORZEWSKI, P.; HRYNIEWICZ, O. Testing statistical hypotheses in
fuzzy environment. Mathware and Soft Computing, n. 4, p. 203-217, 1997.
GUIDORIZZI, H. L. Um curso de cálculo Vol. 1. Rio de Janeiro: Livros
Técnicos e Científicos, 2001. 658 p.
HASTING, W. K. Monte Carlos Sampling methods using Markov chains and
their applications. Biometrika, London, v. 57, n. 1, p. 97-109, 1970.
HIRSCHBERG, J. G.; LYE, J. N. Inferences for the extremum of quadratic
regression models. Research paper/ The University of Melbourne/
Department of Economics, Melbourne, n. 906, p. 1-23, 2005.
HOFFMANN, R., VIEIRA, S. Análise de regressão: uma introdução à
econometria. 3. ed. São Paulo: HUCITEC, 1998. 379 p.
JAFELICE, R. M. Modelagem fuzzy para dinâmica de transferência de
soropositivos para HIV em doença plenamente manifesta. 2004. 187 p. Tese
(Doutorado em Engenharia Elétrica) - Faculdade de Engenharia Elétrica e
Computação. Unversidade Estadual de Campinas, Campinas, SP.
JEFFREYS, H. Theory of probability. Oxford: Claredon, 1961. 325 p.
KUTNER, M. H.; NACHTSHEIM, C. J.; NETER, J.; LI, W. Applied linear
statistical models. 5. ed. Boston: McGraw-Hill, 2005. 1396 p.
LEE, H. T. Cpk index estimation using fuzzy numbers. European Journal of
Operational research, v. 129, p. 683-688, 2001.
95
LIMA, E. L. Análise real - Volume 1. 10. ed. Rio de Janeiro: IMPA, 2009. 189
p.
MAMDANI, E. H. Applications of fuzzy algorithms for control of a simple
ynamic plant. Proceedings of the IEEE, New York, v. 121, n. 12, p. 1585-1588,
1974.
MELO, G. J. A. Princípio de extensão de Zadeh aplicado a funções não
monótonas com dois parâmetros fuzzy. 2009. 69 p. Dissertação (Mestrado em
Engenharia de Sistemas) - Universidade Federal de Lavras, Lavras, MG.
MISSIO, M.; BARROS, L. C. Modelo probabilístico para uma variável fuzzy.
Biomatemática, Campinas, v. 19, p. 25-38, Nov. 2009.
MOOD, A. M.; GRAYBILL, F. A.; BOES, D.C. Introduction to the theory of
statistics. 3. ed. Tokio: McGraw-Hill, 1974. 564 p.
NUNES, C. C. F. et al. Variâncias do ponto crítico de equações de regressão
quadrática. Ciência e Agrotecnologia, Lavras, v. 28, n. 2, p. 389-396, 2004.
PARCHAMI, A.; MASHINCHI, M. Fuzzy estimation for process capability
indices. Information Sciences, v. 177, p. 1452-1462, 2007.
PAULINO, C. D.; TURKMAN, M. A.; MURTEIRA, B. Estatística Bayesiana.
Lisboa: Fundação Calouste Gulbenkian, 2003. 446 p.
PEDRYCZ, W.; GOMIDE, F. An introduction to fuzzy sets: analysis and
design. Cambridge: MIT, 1998. 461 p.
PIRES, D. M. Implementação computacional do princípio de extensão de
Zadeh. 2010. 59 p. Dissertação (Mestrado em Engenharia de Sistemas) Universidade Federal de Lavras, Lavras, MG.
96
RAFTERY, A. L.; LEWIS, S. Comment: one long run with diagnostics:
implementation strategies for Markov chain Monte Carlo. Statistical Science,
Hayward, v. 7, n. 4, p. 493-497, Nov. 1992.
R DEVELOPMENT CORE TEAM (2012). R: A language and enviroment for
statistical computing. Disponível em: http://www.R-project.org. Acesso em: 20
Mai. 2012.
SANTOS, I. P. A. et al. Influência do fósforo, micorriza e nitrogênio no conteúdo
de minerais de Brachiaria brizantha e Arachis pintoi consorciados. Revista
Brasileira de Zootecnia, v. 31, n. 2, p. 605-616, 2002.
SEARLE, S. R. Linear Models. New York: John Wiley, 1971. 532 p.
SNEDECOR, G. W.; COCHRAN, W. G. Statistical methods. 7. ed. Ames: Iowa
State University, 1980. 507 p.
TAHERI, S. M. Trends in fuzzy statistics. Austrian Journal of Statistics, v. 32,
n. 3, p. 239-257, 2003.
TANAKA, K. An introduction to fuzzy logic for practical applications.
Tokyo: Springer, 1997. 138 p.
TANAKA, H.; UEJIMA, S.; ASAI, K. Linear regression analysis with fuzzy
model. IEEE Transactions on Systems, n. 6, p. 903-907, 1982.
TSOUKALAS, C. D.; UHRIG, M. A. Fuzzy and neural approaches in
engineering. New York: John Wiley, 1997. 587 p.
WU, H. C. Fuzzy estimates of regression parameters in linear regression models
for imprecise input and output data. Computational Statistics and Data
Analysis, n. 42, p. 203-217, 2003.
97
ZADEH, L. A. Fuzzy Sets. Journal Information and Control, n. 8, p. 338-353,
1965.
——· Fuzzy Sets as a basis for a theory of possibility. Fuzzy Sets and Systems,
n. 1, p. 3-28, 1978.
——· Probability measures of fuzzy events. Journal of Mathematical Analysis
and Applications, v. 23, n. 2, p. 421-427, 1968.
98
APÊNDICE A - Rotina R, programa utilizado para a análise bootstrap
paramétrico.
#Número de r e a m o s t r a g e n s b o o t s t r a p
B<−4000
# Variância teórica
s2T < −18.25
# Dados o r i g i n a i s
d o s e s <−c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 5 0 , 1 5 0 , 1 5 0 ,
150 ,200 ,200 ,200 ,200)
p r o d u c a o <−c ( 7 6 , 8 1 , 9 1 , 5 7 , 1 1 5 , 1 1 9 , 1 2 4 , 1 0 2 , 1 2 9 , 1 6 7 , 1 5 0 , 1 7 0 ,
160 ,189 ,170 ,165 ,156 ,174 ,160 ,150)
r e g <−lm ( p r o d u c a o ~ d o s e s + I ( d o s e s ^ 2 ) )
a0<−r o u n d ( r e g $ c o e f f [ 1 ] , 4 )
b0<−r o u n d ( r e g $ c o e f f [ 2 ] , 4 )
c0<−r o u n d ( r e g $ c o e f f [ 3 ] , 4 )
e t a <−r o u n d ( b0 /( −2 * c0 ) , 4 )
X<−c b i n d ( r e p ( 1 , 2 0 ) , c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 ,
150 ,150 ,150 ,150 ,200 ,200 ,200 ,200) , c (0 ,0 ,0 ,0 ,50^2 ,50^2 ,50^2 ,
50^2 ,100^2 ,100^2 ,100^2 ,100^2 ,150^2 ,150^2 ,150^2 ,150^2 ,200^2 ,
200^2 ,200^2 ,200^2))
iXX<− s o l v e ( t (X)%*%X)
y e s t <− m a t r i x ( , 5 , 4 )
a e s t <−b e s t <−c e s t <− e t a e s t <− v e c t o r ( )
sd1 <−quan1 <−LI1 <−LS1<−AMP1<− v e c t o r ( )
sd2 <−quan2 <−LI2 <−LS2<−AMP2<− v e c t o r ( )
LIa <−LSa<− v e c t o r ( )
LIb <−LSb<− v e c t o r ( )
LIc <−LSc<− v e c t o r ( )
d o s e s 2 <−c ( 0 , 5 0 , 1 0 0 , 1 5 0 , 2 0 0 )
p r o d u c a o 0 <−c ( 7 6 , 8 1 , 9 1 , 5 7 )
p r o d u c a o 5 0 <−c ( 1 1 5 , 1 1 9 , 1 2 4 , 1 0 2 )
p r o d u c a o 1 0 0 <−c ( 1 2 9 , 1 6 7 , 1 5 0 , 1 7 0 )
p r o d u c a o 1 5 0 <−c ( 1 6 0 , 1 8 9 , 1 7 0 , 1 6 5 )
p r o d u c a o 2 0 0 <−c ( 1 5 6 , 1 7 4 , 1 6 0 , 1 5 0 )
99
dados <−c b i n d ( p r o d u c a o 0 , p r o d u c a o 5 0 , p r o d u c a o 1 0 0 ,
producao150 , producao200 )
d a d o s e s <− m a t r i x ( , B , 2 0 )
c o e f <− m a t r i x ( , B , 3 )
f o r ( i i n 1 : B)
{
f o r ( j in 1: ncol ( dados ) )
{
f o r ( k i n 1 : nrow ( d a d o s ) )
{
e<−rnorm ( 1 , 0 , s q r t ( s2T ) )
y e s t [ j , k]<− a0 +b0 * d o s e s 2 [ j ] + c0 * ( ( d o s e s 2 [ j ] ) ^ 2 ) + e
}
}
d r e s <−c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 5 0 , 1 5 0 ,
150 ,150 ,200 ,200 ,200 ,200)
y r e s <−c ( y e s t [ 1 , ] , y e s t [ 2 , ] , y e s t [ 3 , ] , y e s t [ 4 , ] , y e s t [ 5 , ] )
mod<−lm ( y r e s ~ d r e s + I ( d r e s ^ 2 ) )
d a d o s e s [ i ,] < − r o u n d ( c b i n d ( y r e s ) , 4 )
c o e f [ i ,] < − c b i n d ( mod$coef [ 1 ] , mod$coef [ 2 ] , mod$coef [ 3 ] )
a e s t [ i ]<− r o u n d ( mod$coef [ 1 ] , 4 )
b e s t [ i ]<− r o u n d ( mod$coef [ 2 ] , 4 )
c e s t [ i ]<− r o u n d ( mod$coef [ 3 ] , 4 )
e t a e s t [ i ]<− r o u n d (( − b e s t [ i ] ) / ( 2 * c e s t [ i ] ) )
f a c . d o s e s <− f a c t o r ( d r e s )
r e g <−lm ( y r e s ~ d r e s + I ( d r e s ^ 2 ) + I ( d r e s ^ 3 ) + I ( d r e s ^ 4 ) )
anova2 <−a n o v a ( r e g )
VT<−a n o v a 2 [ 5 , 3 ] * iXX
L I a [ i ]<− a e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 1 , 1 ] ) )
LSa [ i ]<− a e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 1 , 1 ] ) )
LIb [ i ]<− b e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 2 , 2 ] ) )
LSb [ i ]<− b e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 2 , 2 ] ) )
L I c [ i ]<− c e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 3 , 3 ] ) )
LSc [ i ]<− c e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * ( s q r t (VT [ 3 , 3 ] ) )
# I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a
p r o p o s t o p o r Mood , G r a y b i l l e Boes ( 1 9 7 4 )
s d 1 [ i ]<− s q r t ( ( 1 / 4 ) * ( ( b e s t [ i ] / c e s t [ i ] ) ^ 2 ) * ( ( VT [ 2 , 2 ] / ( b e s t [ i ] ^ 2 ) )
100
+ (VT [ 3 , 3 ] / ( c e s t [ i ] ^ 2 ) ) − ( ( 2 * VT [ 2 , 3 ] ) / ( b e s t [ i ] * c e s t [ i ] ) ) ) )
quan1 [ i ] < −(( e t a e s t [ i ]− e t a ) / s d 1 [ i ] )
LI1 [ i ]<− e t a e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * s d 1 [ i ]
LS1 [ i ]<− e t a e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * s d 1 [ i ]
# I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a
p r o p o s t o p o r D’ A u l í s i o , P i m e n t e l −Gomes e N o g u e i r a ( 1 9 7 6 )
s d 2 [ i ]<− s q r t ( ( 1 / 4 ) * ( ( ( VT [ 2 , 2 ] ) / ( ( c e s t [ i ] ) ^ 2 ) ) + ( ( b e s t [ i ] ^ 2 )
*VT [ 3 , 3 ] ) / ( c e s t [ i ] ^ 4 ) ) )
quan2 [ i ] < −(( e t a e s t [ i ]− e t a ) / s d 2 [ i ] )
LI2 [ i ]<− e t a e s t [ i ]− q t ( 0 . 9 7 5 , 1 5 ) * s d 2 [ i ]
LS2 [ i ]<− e t a e s t [ i ] + q t ( 0 . 9 7 5 , 1 5 ) * s d 2 [ i ]
}
# I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a
p r o p o s t o p o r Mood , G r a y b i l l e Boes ( 1 9 7 4 )
IC1LI1 <−mean ( LI1 )
IC1LS1<−mean ( LS1 )
# I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a da v a r i â n c i a
p r o p o s t o p o r D’ A u l í s i o , P i m e n t e l −Gomes e N o g u e i r a ( 1 9 7 6 )
IC2LI2 <−mean ( LI2 )
IC2LS2<−mean ( LS2 )
# I n t e r v a l o de c o n f i a n ç a c o n s i d e r a n d o a f ó r m u l a comum da
variância
IC3LI3 <−mean ( e t a e s t )−2 * s d ( e t a e s t )
IC3LS3<−mean ( e t a e s t )+ 2 * s d ( e t a e s t )
# I n t e r v a l o de c o n f i a n ç a b o o t s t r a p −t c o n s i d e r a n d o a f ó r m u l a da
v a r i â n c i a p r o p o s t o p o r Mood , G r a y b i l l e Boes ( 1 9 7 4 )
VT1< −182.45 * iXX
q u a n o r d 1 <− s o r t ( quan1 )
t 1 <−q u a n o r d 1 [ 0 . 9 7 5 * B]
t 2 <−q u a n o r d 1 [ 0 . 0 2 5 * B]
s d e t a 1 <− s q r t ( ( 1 / 4 ) * ( ( b0 / c0 ) ^ 2 ) * ( ( VT1 [ 2 , 2 ] / ( b0 ^ 2 ) ) + ( VT1 [ 3 , 3 ] /
( c0 ^ 2 ) ) − ( ( 2 * VT1 [ 2 , 3 ] ) / ( b0 * c0 ) ) ) )
IC4LI4 <−e t a −t 1 * ( s d e t a 1 )
IC4LS4<−e t a −t 2 * ( s d e t a 1 )
101
# I n t e r v a l o de c o n f i a n ç a b o o t s t r a p −t c o n s i d e r a n d o a f ó r m u l a da
v a r i â n c i a p r o p o s t o p o r D’ A u l í s i o , P i m e n t e l −Gomes e N o g u e i r a ( 1 9 7 6 )
q u a n o r d 2 <− s o r t ( quan2 )
t 1 1 <−q u a n o r d 2 [ 0 . 9 7 5 * B]
t 2 2 <−q u a n o r d 2 [ 0 . 0 2 5 * B]
s d e t a 2 <− s q r t ( ( 1 / 4 ) * ( ( ( VT1 [ 2 , 2 ] ) / ( ( c0 ) ^ 2 ) ) + ( ( b0 ^ 2 ) * VT1 [ 3 , 3 ] ) /
( c0 ^ 4 ) ) )
IC5LI5 <−e t a −t 1 1 * ( s d e t a 2 )
IC5LS5<−e t a −t 2 2 * ( s d e t a 2 )
# C o e f i c i e n t e s de a s s i m e t r i a e c u r t o s e
ma2<−(sum ( ( e t a e s t −mean ( e t a e s t ) ) ^ 2 ) ) / l e n g t h ( e t a e s t )
ma3<−(sum ( ( e t a e s t −mean ( e t a e s t ) ) ^ 3 ) ) / l e n g t h ( e t a e s t )
ma4<−(sum ( ( e t a e s t −mean ( e t a e s t ) ) ^ 4 ) ) / l e n g t h ( e t a e s t )
a s s <−ma3 / ( ma2 ^ ( 3 / 2 ) )
c u r <−(ma4 / ( ma2 ^ ( 2 ) ) ) − 3
a s s t a b <−qnorm ( 0 . 9 5 , 0 , ( 6 / B ) ^ ( 1 / 2 ) )
c u r t a b <−qnorm ( 0 . 9 5 , 0 , ( 2 4 / B ) ^ ( 1 / 2 ) )
102
APÊNDICE B - Rotina R, programa utilizado para a análise bayesiana.
l i b r a r y ( boa )
l i b r a r y ( MCMCpack )
# Dados o r i g i n a i s
d o s e s <−c ( 0 , 0 , 0 , 0 , 5 0 , 5 0 , 5 0 , 5 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 0 0 , 1 5 0 , 1 5 0 , 1 5 0 ,
150 ,200 ,200 ,200 ,200)
p r o d u c a o <−c ( 7 6 , 8 1 , 9 1 , 5 7 , 1 1 5 , 1 1 9 , 1 2 4 , 1 0 2 , 1 2 9 , 1 6 7 , 1 5 0 , 1 7 0 ,
160 ,189 ,170 ,165 ,156 ,174 ,160 ,150)
dados <−c b i n d ( d o s e s , p r o d u c a o )
x<−d a d o s [ , 1 ]
y<−d a d o s [ , 2 ]
n<− l e n g t h ( y )
# Definindo as p r i o r i s
meta <−163
v e t a < −0.001
mbeta0 <−73
v b e t a 0 < −0.001
mbeta2 <−−0.003
v b e t a 2 < −0.001
a l p h a <−10
b e t a <−1800
# D e f i n i n d o o número de i t e r a ç õ e s
n i t <−10000
b e t a 0 <− m a t r i x ( 0 , n i t , 1 )
e t a 1 <− m a t r i x ( 0 , n i t , 1 )
b e t a 2 <− m a t r i x ( 0 , n i t , 1 )
sigma2 <− m a t r i x ( 0 , n i t , 1 )
# Chutes i n i c i a i s
b e t a 0 [1 ,1] < −73
e t a 1 [1 ,1] < −163
b e t a 2 [1 ,1] < − −0.003
s i g m a 2 [1 ,1] < −182
i r <−0
103
# I n í c i o da a m o s t r a g e m
for ( i r in 2: n i t )
{
# para o parâmetro eta
soma1<−0
soma2<−0
soma3<−0
soma4<−0
i <−0
for ( i in 1: n)
{
soma1 <−(y [ i ]− b e t a 0 [ i r −1,1]− b e t a 2 [ i r − 1 , 1 ] * ( x [ i ] ^ 2 ) ) * x [ i ]
soma2<−soma2+soma1
soma3 <−(x [ i ] ^ 2 )
soma4<−soma4+soma3
}
m e d i a e t a <−( s i g m a 2 [ i r −1 ,1] * meta−v e t a * b e t a 2 [ i r −1 ,1] * soma2 ) /
( 4 * v e t a * ( b e t a 2 [ i r − 1 , 1 ] ^ 2 ) * soma4+ s i g m a 2 [ i r − 1 , 1 ] )
d e s v e t a <− s q r t ( ( s i g m a 2 [ i r −1 ,1] * v e t a ) / ( 4 * v e t a * ( b e t a 2 [ i r − 1 , 1 ] ^ 2 )
* soma4+ s i g m a 2 [ i r − 1 , 1 ] ) )
e t a 0 <−rnorm ( 1 , mean= m e d i a e t a , s d = d e s v e t a )
e t a 1 [ i r ,1] < − e t a 0
# para o parâmetro beta0
soma5<−0
soma6<−0
i <−0
for ( i in 1: n)
{
soma5<−y [ i ]+ 2 * b e t a 2 [ i r −1 ,1] * e t a 1 [ i r , 1 ] * x [ i ]− b e t a 2 [ i r −1 ,1] *
(x[ i ]^2)
soma6<−soma6+soma5
}
m e d i a b e t a 0 <−(soma6 * v b e t a 0 + s i g m a 2 [ i r −1 ,1] * mbeta0 ) / ( v b e t a 0 * n+
sigma2 [ i r −1 ,1])
d e s v b e t a 0 <− s q r t ( ( s i g m a 2 [ i r −1 ,1] * v b e t a 0 ) / ( v b e t a 0 * n+
sigma2 [ i r −1 ,1]))
b e t a 0 0 <−rnorm ( 1 , mean= m e d i a b e t a 0 , s d = d e s v b e t a 0 )
b e t a 0 [ i r ,1] < − b e t a 0 0
# p a r a o p a r â m e t r o sigma2
104
soma11 <−0
soma12 <−0
i <−0
for ( i in 1: n)
{
soma11 <−(y [ i ]− b e t a 0 [ i r , 1 ] + 2 * b e t a 2 [ i r −1 ,1] * e t a 1 [ i r , 1 ] * x [ i ]
−b e t a 2 [ i r − 1 , 1 ] * ( x [ i ] ^ 2 ) ) ^ 2
soma12<−soma12+soma11
}
a l p h a a <−(n / 2 ) + a l p h a
b e t a a < −0.5 * soma12+ b e t a
sigma20 <−rinvgamma ( 1 , a l p h a a , b e t a a )
s i g m a 2 [ i r ,1] < − s i g m a 2 0
# para o parâmetro beta2
soma7<−0
soma8<−0
soma9<−0
soma10 <−0
i <−0
for ( i in 1: n)
{
soma7 <−(y [ i ]− b e t a 0 [ i r , 1 ] ) * x [ i ] * ( 2 * e t a 1 [ i r ,1] − x [ i ] )
soma8<−soma8+soma7
soma9 <−(x [ i ] ^ 2 ) * ( ( 2 * e t a 1 [ i r ,1] − x [ i ] ) ^ 2 )
soma10<−soma10+soma9
}
m e d i a b e t a 2 < −(( s i g m a 2 [ i r , 1 ] * mbeta2 )−soma8 * ( v b e t a 2 ) ) / ( soma10 *
( v b e t a 2 )+ sigma2 [ i r , 1 ] )
d e s v b e t a 2 <− s q r t ( ( s i g m a 2 [ i r , 1 ] * v b e t a 2 ) / ( soma10 * ( v b e t a 2 ) +
sigma2 [ i r , 1 ] ) )
b e t a 2 0 <−rnorm ( 1 , mean= m e d i a b e t a 2 , s d = d e s v b e t a 2 )
b e t a 2 [ i r ,1] < − b e t a 2 0
}
#Fim da a m o s t r a g e m
# A n á l i s e de C o n v e r g ê n c i a
Conv <− m a t r i x ( 0 , n i t , 4 , dimnames= l i s t ( c ( 1 : n i t ) , c ( " b e t a 0 " , " e t a 1 " ,
" b e t a 2 " , " sigma2 " ) ) )
Conv [ ,1] < − b e t a 0
105
Conv [ ,2] < − e t a 1
Conv [ ,3] < − b e t a 2
Conv [ ,4] < − s i g m a 2
boa . r a n d l ( Conv , 0 . 0 2 5 , 0 . 0 0 5 , 0 . 9 5 , 0 . 0 0 1 )
boa . geweke ( Conv , 0 . 1 , 0 . 5 )
# Lendo o s d a d o s
b e t a 0 <−a s . m a t r i x ( b e t a 0 )
e t a 1 <−a s . m a t r i x ( e t a 1 )
b e t a 2 <−a s . m a t r i x ( b e t a 2 )
sigma2 <−a s . m a t r i x ( s i g m a 2 )
# D e f i n i n d o o " burn−i n " e o " t h i n "
n i t <− l e n g t h ( b e t a 0 )
burn <−3000
p u l o <−1
# D e f i n i n d o os p a r â m e t r o s
b e t a 0 <−b e t a 0 [ ( b u r n + 1 ) : n i t , 1 ]
e t a 1 <− e t a 1 [ ( b u r n + 1 ) : n i t , 1 ]
b e t a 2 <−b e t a 2 [ ( b u r n + 1 ) : n i t , 1 ]
sigma2 <−s i g m a 2 [ ( b u r n + 1 ) : n i t , 1 ]
# I n í c i o do p u l o
n i t _ n o v o < −(( n i t −b u r n )%/% p u l o )
b e t a 0 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 )
e t a 1 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 )
b e t a 2 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 )
s i g m a 2 _ p u l o <− m a t r i x ( 0 , n i t _ n o v o , 1 )
# Realizando o " t h i n " ( pulo ) i n d i v i d u a l m e n t e para cada parâmetro
i <−0
i r r <−0
f o r ( i r r i n 1 : ( n i t −b u r n ) )
{ i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 )
i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( b e t a 0 _ p u l o [ i ,1] < − b e t a 0 [ i r r ] )
}
i <−0
i r r <−0
f o r ( i r r i n 1 : ( n i t −b u r n ) )
106
{ i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 )
i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( e t a 1 _ p u l o [ i ,1] < − e t a 1 [ i r r ] )
}
i <−0
i r r <−0
f o r ( i r r i n 1 : ( n i t −b u r n ) )
{ i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 )
i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( b e t a 2 _ p u l o [ i ,1] < − b e t a 2 [ i r r ] )
}
i <−0
i r r <−0
f o r ( i r r i n 1 : ( n i t −b u r n ) )
{ i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( i <− i +1 )
i f ( i r r −( i r r %/%p u l o ) * p u l o = = 0 ) ( s i g m a 2 _ p u l o [ i ,1] < − s i g m a 2 [ i r r ] )
}
# I n t e r v a l o de c r e d i b i l i d a d e HPD
p r i n t ( boa . hpd ( b e t a 0 _ p u l o , 0 . 0 5 ) )
p r i n t ( boa . hpd ( e t a 1 _ p u l o , 0 . 0 5 ) )
p r i n t ( boa . hpd ( b e t a 2 _ p u l o , 0 . 0 5 ) )
p r i n t ( boa . hpd ( s i g m a 2 _ p u l o , 0 . 0 5 ) )
107
APÊNDICE C - Rotina C++, programa utilizado para a análise fuzzy 1.
# include
# include
# include
# include
# include
# include
# include
<iostream >
<fstream >
<cmath >
<iomanip >
< s t d i o . h>
<vector >
<algorithm >
u s i n g namespace s t d ;
struct quinteto {
long double valorx , valorfx , valorpa , valorpb , valorpc ;
};
struct trinca {
long double valorx , valorfx , valorp ;
};
double p e r t i n e n c i a ( double , double , double , double ) ;
long double operaminimo ( double , double ) ;
v o i d o r d e n a c a o ( v e c t o r < t r i n c a > &v e t ) ;
v o i d p r i n c i p i o e x t e n s a o ( v e c t o r < t r i n c a > &v e t ) ;
v o i d c o n v e x o ( v e c t o r < t r i n c a > &v e t ) ;
l o n g d o u b l e c e n t r o i d e ( v e c t o r < t r i n c a > &v e t o ) ;
o f s t r e a m defuzzy ( "C : / Users / Leandro F e r r e i r a / Desktop /
d e f u . gnu " , i o s : : o u t ) ;
o f s t r e a m p r i n c ( "C : / Users / Leandro F e r r e i r a / Desktop /
e x t e n s a o . gnu " , i o s : : o u t ) ;
o f s t r e a m convex ( "C : / Users / Leandro F e r r e i r a / Desktop /
a p o s a l g o r i t m o . gnu " , i o s : : o u t ) ;
o f s t r e a m c l a ( "C : / Users / Leandro F e r r e i r a / Desktop /
c l a s s i c a . gnu " , i o s : : o u t ) ;
o f s t r e a m d i f e r e a l ( "C : / Users / Leandro F e r r e i r a / Desktop /
d i f e r e n c a . gnu " , i o s : : o u t ) ;
o f s t r e a m e n t r a d a ( "C : / Users / Leandro F e r r e i r a / Desktop /
f u z z y b r u t o . gnu " , i o s : : o u t ) ;
108
i n t main ( )
{
vector < quinteto > gvetor ;
vector < trinca > vetorPonto ;
quinteto controltotal ;
t r i n c a armazena ;
d o u b l e u , p i c , a , x , c o n t , b , aa , bb , cc , o , auxa , auxb ;
l o n g d o u b l e p a s s o , p a s s o 1 , p a s s o 2 , pon , c o n t a d o r , c , i n f ,
sup , c o n t a d o r t o t a l , z , r , i n f 1 , p i c 1 , sup1 , i n f 2 , p i c 2 , sup2 , f x ;
const double loop= 200;
const double i n i c i o = 0;
c o u t < <" I n s i r a o i n t e r v a l o i n f e r i o r , o p i c o e o i n t e r v a l o
s u p e r i o r da p e r t i n e n c i a t r i a n g u l a , p a r a c a d a p a r a m e t r o : "<< e n d l ;
/ / i n c e r t e z a s c o n s i d e r a d a s no modelo
inf =67.109;
pic =73.1929;
sup =79.2768;
inf1 =0.9972;
pic1 =1.1413;
sup1 = 1 . 2 8 5 4 ;
i n f 2 = −0.0042;
p i c 2 = −0.0035;
s u p 2 = −0.0028;
c o u t < <" D i g i t e um numero i n t e i r o de p o n t o s a v a l i a d o s
( p r e f e r e n c i a m a i s de 1 0 ) d e n t r o da função de p e r t i n e n c i a :
"<< e n d l ;
c i n >>pon ;
/ / p a s s o s d a s f u n c o e s de p e r t i n e n c i a
p a s s o = ( sup−i n f ) / ( pon − 1 . 0 ) ;
p a s s o 1 = ( sup1−i n f 1 ) / ( pon − 1 . 0 ) ;
p a s s o 2 = ( sup2−i n f 2 ) / ( pon − 1 . 0 ) ;
a= p i c ;
b= p i c 1 ;
109
c= p i c 2 ;
x= i n i c i o ;
c o n t a d o r t o t a l = −1.0;
w h i l e ( x<= l o o p )
{
contador =0.0;
/ / i n i c i o funcao c l a s s i c a
z=a+b * x+c * x * x ;
c l a << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < <
setprecision (14.0);
c l a <<x < <" "<<z << e n d l ;
/ / fim funcao c l a s s i c a
/ / i n i c i o parametros fuzzy
aa= i n f ;
w h i l e ( aa <=( s u p + 0 . 0 1 ) )
{
a u x a = p e r t i n e n c i a ( i n f , p i c , sup , a a ) ;
bb= i n f 1 ;
w h i l e ( bb <= s u p 1 )
{
auxb = p e r t i n e n c i a ( i n f 1 , p i c 1 , sup1 , bb ) ;
cc= i n f 2 ;
w h i l e ( cc <= s u p 2 )
{
f x = a a +bb * x+ c c * x * x ;
c o n t r o l t o t a l . valorx = x ;
c o n t r o l t o t a l . v a l o r f x = fx ;
c o n t r o l t o t a l . v a l o r p a = auxa ;
c o n t r o l t o t a l . v a l o r p b = auxb ;
c o n t r o l t o t a l . valorpc =
p e r t i n e n c i a ( i n f 2 , p i c 2 , sup2 , c c ) ;
g v e t o r . push_back ( c o n t r o l t o t a l ) ;
armazena . v a l o r x = x ;
armazena . v a l o r f x = fx ;
armazena . v a l o r p = operaminimo
( c o n t r o l t o t a l . valorpa , operaminimo
( c o n t r o l t o t a l . valorpb ,
110
c o n t r o l t o t a l . valorpc ) ) ;
v e t o r P o n t o . push_back ( armazena ) ;
e n t r a d a << s e t i o s f l a g s ( i o s : : f i x e d |
i o s : : showpoint )<< s e t p r e c i s i o n ( 1 5 ) ;
e n t r a d a <<x < <" "<< fx < <" "<< a r m a z e n a .
v a l o r p << e n d l ;
c c += p a s s o 2 ;
}
bb+= p a s s o 1 ;
}
a a += p a s s o ;
}
e n t r a d a < <" "<< e n d l ;
/ / fim p a r a m e t r o s fuzzy
principioextensao ( vetorPonto ) ;
p r i n c << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < <
setprecision (15);
f o r ( i n t v = 0 ; v< v e t o r P o n t o . s i z e ( ) ; v ++)
{
p r i n c << v e t o r P o n t o [ v ] . v a l o r x < <" "<< v e t o r P o n t o [ v ] .
v a l o r f x < <" "<< v e t o r P o n t o [ v ] . v a l o r p << e n d l ;
}
p r i n c < <" "<< e n d l ;
convexo ( v e t o r P o n t o ) ;
convex << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < <
setprecision (15);
f o r ( i n t v = 0 ; v< v e t o r P o n t o . s i z e ( ) ; v ++)
{
convex << v e t o r P o n t o [ v ] . v a l o r x < <" "<< v e t o r P o n t o [ v ] .
v a l o r f x < <" "<< v e t o r P o n t o [ v ] . v a l o r p << e n d l ;
}
convex < <" "<< e n d l ;
r=centroide ( vetorPonto ) ;
d e f u z z y << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < <
setprecision (8.0);
d e f u z z y << a r m a z e n a . v a l o r x < <" "<< r << e n d l ;
u= a b s ( r−z ) ;
111
i f ( u < 1 . e −6)
{ c o u t <<u<< e n d l ;
u =0.0;
c o u t < <" e n t r e i " < <" "<<u<< e n d l ;
}
d i f e r e a l << s e t i o s f l a g s ( i o s : : f i x e d | i o s : : s h o w p o i n t ) < <
setprecision (5);
d i f e r e a l << a r m a z e n a . v a l o r x < <" " < < ( 1 0 0 . 0 * u / a b s ( z )) < < e n d l ;
c o n t a d o r t o t a l +=1.0;
c o u t << c o n t a d o r t o t a l < <" "<<x<< e n d l ;
x +=0.1;
vetorPonto . clear ( ) ;
}
return 0;
}
/ / algoritmo − ordenacao
void ordenacao ( vector < t r i n c a
{
double b , i ;
t r i n c a orden ;
b =1;
w h i l e ( b< v e t . s i z e ( ) )
{
orden . valorx = vet [ b ] .
orden . v a l o r f x = vet [ b ] .
orden . valorp = vet [ b ] .
i = ( b −1);
w h i l e ( ( i >=0)&&( v e t [ i ] .
{
v e t [ i +1] = v e t [ i ] ;
i = ( i − 1);
}
v e t [ i +1]= o r d e n ;
b +=1;
}
}
> &v e t )
valorx ;
valorfx ;
valorp ;
v a l o r f x > orden . v a l o r f x ) )
112
/ / a l g o r i t m o − p r i n c i p i o de e x t e n s a o
v o i d p r i n c i p i o e x t e n s a o ( v e c t o r < t r i n c a > &v e t )
{
int i , j ;
double apagado ;
j =1;
apagado = 0 . 0 ;
while ( j <vet . s i z e ( ) )
{
i = ( j −1);
i f ( ( vet [ j ] . v a l o r f x )==( vet [ i ] . v a l o r f x ) )
{
i f ( v e t [ j ] . v a l o r p >= v e t [ i ] . v a l o r p )
{
a p a g a d o +=1;
vet . erase ( vet . begin ()+ i ) ;
}
else
{
a p a g a d o +=1;
vet . erase ( vet . begin ()+ j ) ;
}
continue ;
} j +=1;
}
}
/ / a l g o r i t m o − c o n j u n t o convexo
v o i d c o n v e x o ( v e c t o r < t r i n c a > &v e t )
{
double i , j , l , deletado , r ;
j , l , r =1;
deletado =0.0;
while ( l <( v e t . s i z e ( ) − 1 . 0 ) )
{
i = j −1;
l = j +1;
i f ( ( v e t [ i ] . v a l o r p >= v e t [ j ] . v a l o r p )&&
( v e t [ j ] . v a l o r p <= v e t [ l ] . v a l o r p ) )
113
{ vet . erase ( vet . begin ()+ j ) ;
d e l e t a d o +=1;
j =1;
continue ;
}
j +=1;
}
}
/ / algoritmo − defuzzificacao
l o n g d o u b l e c e n t r o i d e ( v e c t o r < t r i n c a > &v e t o )
{
l o n g d o u b l e numerador , d i f e r e n , d e n o m i n a d o r , p e r t i n e n ,
c , numerador1 , numerador2 , d e n o m i n a d o r 1 , d e n o m i n a d o r 2 ;
denominador1 = 0 . 0 ;
denominador2 = 0 . 0 ;
numerador = 0 . 0 ;
denominador = 0 . 0 ;
numerador1 = 0 . 0 ;
numerador2 = 0 . 0 ;
c =0.0;
w h i l e ( c <=( v e t o . s i z e ( ) ) )
{
diferen =((( veto [ c ] . valorp )) −1.0);
n u m e r a d o r 1 +=( d i f e r e n * ( v e t o [ c ] . v a l o r f x ) ) ;
n u m e r a d o r 2 +=( v e t o [ c ] . v a l o r f x ) ;
d e n o m i n a d o r 1 +=( d i f e r e n ) ;
denominador2 +=1.0;
c +=1.0; }
denominador=denominador1+denominador2 ;
numerador=numerador1+numerador2 ;
r e t u r n ( numerador / denominador ) ;
}
/ / a l g o r i t m o − f u n c a o de p e r t i n e n c i a t r i a n g u l a r
d o u b l e p e r t i n e n c i a ( d o u b l e a , d o u b l e b , d o u b l e c , d o u b l e w)
{
long double p e r t ;
i f (w < a )
114
p e r t =0;
else {
i f ( ( a <=w)&&(w<=b ) )
{
p e r t = (w−a ) / ( b−a ) ;
}
else {
i f ( ( b<w)&&(w<= c ) )
{
p e r t = ( c−w ) / ( c−b ) ;
} else
{ p e r t =0;}
}
}
return pert ;
}
/ / a l g o r i t m o − o p e r a c a o de minimo
long double operaminimo ( double i , double j )
{
d o u b l e minimo , aux ;
aux = i −j ;
i f ( aux <=0){ minimo= i ; } e l s e { minimo= j ; }
r e t u r n minimo ;
}
115
APÊNDICE D - Rotina MAPLE, programa utilizado para a análise fuzzy 2.
with ( p l o t s ) ;
with ( s t a t s ) ;
f 1 : = 163.0429 − 14.3653 * s t a t e v a l f [ i c d f , s t u d e n t s t [ 1 5 ] ] ( 1 − ( 1 / 2 ) * y ) ;
f2 := 163.0429+14.3653* s t a t e v a l f [ icdf , s t u d e n t s t [15]](1 −(1/2)* y ) ;
eq1 : = x = f 1 ( y ) ;
eq2 : = x = f 2 ( y ) ;
i m p l i c i t p l o t ( { eq1 , eq2 } , x = 0 . . 2 0 0 , y = 0 . . 1 , c o l o r =
black , t h i c k n e s s = 3 , l a b e l s = [ x , alpha ] ) ;
Download

TESE_Intervalos de confiança para o ponto crítico de modelos de