10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Sumário
Contents
Apresentação .................................................................................................................... 2
Presentation
Organização ....................................................................................................................... 3
Committee
Programação ..................................................................................................................... 4
Programme
Mini-curso .......................................................................................................................... 7
Short Course
Conferências ...................................................................................................................... 9
Conferences
Apresentações Orais .................................................................................................... 23
Oral Communications
Apresentações em Poster .......................................................................................... 37
Poster Communications
E-mail dos Participantes .......................................................................................... 158
E-mail of Participants
1
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Apresentação
Presentation
Os encontros brasileiros de estatı́stica bayesiana visam fortalecer a pesquisa cientı́fica na área bayesiana,
bem como a difusão de suas aplicações pela sociedade brasileira. Também visam propiciar o aumento
da colaboração entre os pesquisadores brasileiros, apresentar os últimos avanços alcançados na área, discutir problemas que possam gerar novas linhas de pesquisa e propiciar aos estudantes vivenciarem este
ambiente cientı́fico.
O 10o EBEB será realizado no hotel PortoGalo de 21 a 24 de março de 2010, na agradável Costa
Verde do Estado do Rio de Janeiro, Brasil.
Nesta sua décima edição, discutiremos avanços recentes da área tanto em aspectos metodológicos e
de fundamentos quanto na sua cada vez mais relevante implementação computacional. Esses avanços
serão apresentados e discutidos pelos seus protagonistas no cenário mundial.
A organização do EBEB é de responsabilidade da ISBrA - Seção Brasileira da ISBA - desde sua 6a
edição, quando foi realizado juntamente com o 1o Congresso Bayesiano da América Latina (COBAL I).
The Brazilian Bayesian meetings (EBEB) aim to strengthen the research on Bayesian methods, as
well as widen the use of their applications across the Brazilian society. These meetings also aim to provide
an environment for Brazilian researchers to collaborate among themselves, introduce to the comunity the
most recent developments in the area, discuss problems that may create new lines of reasearch, and allow
our graduate students to experience the contact with researchers from different countries, and different
regions of Brazil.
The 10th EBEB will take place at the Portogalo Suites Hotel, from the 21st until the 24th of March,
2010. The hotel is located in the pleasant Green Coast area of the State of Rio de Janeiro, Brazil.
In this 10th edition, we aim to discuss recent developments in the area both from the methodological
and computational points of view. These developments will be presented and discussed by leading researchers in the world.
Since its 6th edition, EBEB is organized by ISBrA, the Brazilian chapter of ISBA.
2
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Organização
Committee
Comissão Cientı́fica
Scientific Committee
Heleno Bolfarine (USP)
Ronaldo Dias (Unicamp)
Dani Gamerman (UFRJ)
Hedibert F. Lopes (Chicago)
Marina S. Paez (UFRJ)
Thelma Sáfadi (UFLA)
Alexandra M. Schmidt (UFRJ - Coordenadora)
Comissão Organizadora
Local Organizing Committee
Mariane B. Alves (UERJ)
Dani Gamerman (UFRJ)
Aline A. Nobre (Fiocruz)
Marina S. Paez (UFRJ)
Alexandra M. Schmidt (UFRJ - Coordenadora)
Secretaria
Secretariat
Mayna Dias J. P. Bastos (UFRJ)
Estelina Serrano de M. Capistrano (UFRJ)
Mariana Santos B. Ferraz (UFJF)
Programação Visual
Visual Programming
Marcus Moura
Diretoria ISBrA
ISBrA Executive Committee
Alexandra M. Schmidt - Presidente ISBrA - ISBrA President
Dani Gamerman - Secretário - Secretary
Marina S. Paez - Tesoureira - Treasurer
3
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Programação
Programme
Segunda-feira
Monday
22-mar
Mini-Curso
Short Course
(Carvalho/Taddy)
Terça-feira
Tuesday
23-mar
Mini-Curso
Short Course
(Carvalho/Taddy)
10:00 - 10:30
Coffee Break
Coffee Break
Coffee Break
10:30 - 11:15
Conferência
Conference
(M. Ferreira)
Conferência
Conference
(M. Branco)
11:15 - 12:00
Conferência
Conference
(G. Roberts)
Conferência
Conference
(J. Achcar)
Conferência
Conference
(N. Garcia)
Conferência
Encerramento
Closing Conference
(A. Gelfand)
12:00 - 14:00
Almoço
Lunch
Almoço
Lunch
Conferência
Conference
(R. Loschi)
Conferência
Conference
(J. Rodrigues)
Conferência
Conference
(H. Rue)
Conferência
Conference
(N. Polson)
Coffee Break
Coffee Break
Sessão Oral 1
Oral Session 1
Sessão Oral 2
Oral Session 2
Sessão Oral 1
Oral Session 1
Sessão Oral 2
Oral Session 2
Sessão Poster 1
Poster Session 1
Sessão Poster 2
Poster Session 2
Horário
Schedule
Domingo
Sunday
21-mar
8:30 - 10:00
14:00 - 14:45
Inscrições
Registration
14:45 - 15:30
Inscrições
Registration
15:30 - 16:00
16:30 - 17:15
17:15 - 18:00
20:00 - 23:00
Inscrições +
Abertura
Registration +
Opening
Conferência
Conference
(A. O’Hagan)
Conferência
Conference
(H. Migon)
Coquetel
Cocktail
4
Quarta-feira
Wednesday
24-mar
Sessão Oral 3
Oral Session 3
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Domingo
Sunday
14:00 - 15:30
Inscrições
15:30 - 16:00
Inscrições e Abertura
16:30 - 17:15
Conferência: A. O’Hagan
17:15 - 18:00
Conferência: H. Migon
20:00 - 23:00
Coquetel
Segunda-Feira
Monday
08:30 - 10:00
Mini-Curso: Carvalho e Taddy
10:00 - 10:30
Coffee Break
10:30 - 11:15
Conferência: M. Ferreira
11:15 - 12:00
Conferência: G. Roberts
12:00 - 14:00
Almoço
14:00 - 14:45
Conferência: R. Loschi
14:45 - 15:30
Conferência: J. Rodrigues
15:30 - 16:00
Coffee Break
16:30 - 18:00
Sessão Oral 1: Processos Gaussianos
16:30 - 16:50
Aline A. Nobre
16:50 - 17:10
Flavio B. Gonçalves
17:10 - 17:30
Leonardo S. Bastos
17:30 - 17:50
Thais Cristina O. da Fonseca
17:50 - 18:00
Discussão
20:00 - 23:00
Sessão Poster 1: Trabalhos de 1 a 55
5
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Terça-Feira
Tuesday
08:30 - 10:00
Mini-Curso: Carvalho e Taddy
10:00 - 10:30
Coffee Break
10:30 - 11:15
Conferência: M. Branco
11:15 - 12:00
Conferência: J. Achcar
12:00 - 14:00
Almoço
14:00 - 14:45
Conferência: H. Rue
14:45 - 15:30
Conferência: N. Polson
15:30 - 16:00
Coffee Break
16:30 - 18:00
Sessão Oral 2: Modelagem Estocástica
16:30 - 16:50
Cibele Q. da Silva
16:50 - 17:10
Erlandson F. Saraiva
17:10 - 17:30
Juan C. Vivar
17:30 - 17:50
Shane T. Jensen
17:50 - 18:00
Discussão
20:00 - 23:00
Sessão Poster 2: Trabalhos de 56 a 109
Quarta-Feira
Wednesday
08:30 - 10:00
Sessão Oral 3: Regressão
08:30 - 08:50
Caio Lucidius N. Azevedo
08:50 - 09:10
Carlos Antonio Abanto-Valle
09:10 - 09:30
Fernando F. do Nascimento
09:30 - 09:50
Vicente G. Cancho
09:50 - 10:00
Discussão
10:00 - 10:30
Coffee Break
10:30 - 11:15
Conferência: N. Garcia
11:15 - 12:00
Conferência e Encerramento: A. Gelfand
6
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Mini-curso
Short Course
7
Particle Learning
Carlos M. Carvalho
The University of Chicago Booth School of Business, EUA
Matt A. Taddy
The University of Chicago Booth School of Business, EUA
This short course describes the particle learning (PL) framework for sequential Bayesian inference.
We introduce the ideas in the traditional context of state space models where the concepts of filtering
sufficient statistics and the advantages of pre-selection particles are presented in details. The second part
of the course turns the attention to the implementation of PL in general mixture models. In addition,
we describe how the approach will apply to other models of current interest in the literature; it is hoped
that this will inspire a greater number of researchers to adopt sequential Monte Carlo methods for fitting
their sophisticated mixture based models. Finally, we show that this particle learning approach leads
to straightforward tools for marginal likelihood calculation and posterior cluster allocation. Specific
versions of the algorithm are derived for standard density estimation applications based on both finite
mixture models and Dirichlet process mixture models, as well as for the less common settings of latent
feature selection through an Indian Buffet process and dependent distribution tracking through a probit
stick- breaking model. We close by applying PL to Dynamic regression trees where a sequential tree
model is created whose state changes in time with the accumulation of new data, and provide particle
learning algorithms that allow for the efficient on-line posterior filtering of tree-states.
8
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Conferências
Conferences
9
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Conferências
Conferences
Uso de Métodos Bayesianos em Análise de Dados de Poluição do Ar
Jorge A. Achcar
Jeffreys’ Prior for Skew-Symmetric Distributions
Márcia D’Elia Branco
Spatio-Temporal Models for Gaussian Areal Data
Marco A. R. Ferreira
Bayesian Inference for Aggregated Functional Data with Applications to Electrical Data
and Chemometrics
Nancy L. Garcia
Process Modeling for Space-Time Extremes
Alan E. Gelfand
Product Partition Models with Correlated Parameters
Rosangela H. Loschi
A Bayesian Spatial Model for Panel Time Series Data
Helio dos Santos Migon
“Objective Bayes” - A Dangerous Delusion
Anthony O’Hagan
Particle Learning for Fat-tailed Distributions
Nick Polson
Bayesian Non-Parametric Inference for Diffusion Processes
Gareth Roberts
Destructive Weighted Poisson Cure Rate Models
Josemar Rodrigues
Bayesian Computing with INLA
Håvard Rue
10
Uso de Métodos Bayesianos em Análise de Dados
de Poluição do Ar
Jorge A. Achcar
Departamento de Medicina Social, Universidade de São Paulo
Nesta palestra vamos apresentar diferentes metodologias estatı́sticas sob o enfoque Bayesiano para
análise de dados de poluição do ar. Em particular vamos enfatizar o uso de processos de Poisson nãohomogêneos na presença ou não de pontos de mudança, modelos de volatilidade estocástica para séries
multivariadas de poluentes e modelos para tempos entre ocorrencias de violações para nı́veis aceitáveis
de poluentes. Aplicações serão consideradas para dados de poluição por ozônio para a cidade do México
e dados de poluição para a cidade de São Paulo considerando diferentes poluentes.
11
Jeffreys’ Prior for Skew-Symmetric Distributions
Márcia D’Elia Branco
IME - Univesidade de São Paulo
The objective Bayesian approach can be an alternative to the maximum likelihood estimator (MLE)
for estimation of the shape parameter of scalar skew-symmetric distributions. While the MLE can be
infinite, the posterior mode or maximum a posteriori (MAP) estimator under Jeffreys’ prior is always
finite. Simulation studies showed that, even considering only the samples where the MLE is finite,
Bayesian estimators are better than the MLE in terms of bias and mean squared error. We also showed
that a good approximation to the Jeffreys’ prior is given by a Student-t distribution with 0.5 degrees of
freedom. We extend earlier properties about the Jeffreys’ prior of skew-normal distributions to a general
class of skewed distributions, including two versions of the skew-t distribution, such as the fact that the
prior is proper and conditions for the existence of the moments. This is a joint work with Marc Genton
(Texas A & M University) and Brunero Liseo (Universitá di Roma Sapienza).
12
Spatio-Temporal Models for Gaussian Areal Data
Marco A. R. Ferreira
University of Missouri, EUA
We introduce a class of spatio-temporal models for Gaussian areal data. These models assume a
latent random field process that evolves through time with random field convolutions; the convolving
fields follow proper Gaussian Markov random field (PGMRF) processes. At each time, the latent random field process is linearly related to observations through an observational equation with errors that
also follow a PGMRF. The use of PGMRF errors brings modeling and computational advantages. With
respect to modeling, it allows more flexible model structures such as different but interacting temporal
trends for each region, as well as distinct temporal gradients for each region. Computationally, building upon the fact that PGMRF errors have proper density functions, we have developed an efficient
Bayesian estimation procedure based on Markov chain Monte Carlo with an embedded forward information filter backward sampler (FIFBS) algorithm. We show that, when compared with the traditional
one-at-a-time Gibbs sampler, our novel FIFBS-based algorithm explores the posterior distribution much
more efficiently. Finally, we have developed a simulation-based conditional Bayes factor suitable for the
comparison of non-nested spatio-temporal models. An analysis of the number of homicides in Rio de
Janeiro State illustrates the power of the proposed spatio-temporal framework. Joint work with Juan C.
Vivar.
13
Bayesian Inference for Aggregated Functional Data with
Applications to Electrical Data and Chemometrics
Nancy L. Garcia
IMECC - Universidade Estadual de Campinas
In this work we address the problem of estimating mean curves when the available sample consists on
aggregated functional data. Consider a typical curve for several sub-populations. Suppose that to sample
from these individual curves is impossible (or too expensive). However, it is relatively easy to combine
these sub-populations and obtain sums of curves or weighted sums of curves. More specifically, replicates
of these curves are available and observations are made for “times” t=1,...,T. Our model specifies that
the observed data is decomposed as the sum, over the C sub-populations, of latent structures which
are independent across sub-populations but temporally correlated. And these latent structures can be
modeled by Gaussian processes whose mean is a smooth curve depending on the sub-population and
evolve with time t. Inference procedure is performed following the Bayesian paradigm. We apply our
model to a real dataset composed of the electric load of transformers which distributes energy to different
types of consumers and chemometric data obtained by Near-infrared (NIR) spectroscopy.
Keywords: functional data, aggregated data, basis expansion, electric load monitoring, calibration,
Near-infrared (NIR) spectroscopy
14
Process Modeling for Space-Time Extremes
Alan E. Gelfand
Dep’t of Statistical Science, Duke University, EUA
Increasingly, data are being gathered to investigate the behavior of extremes of a process over space
and time. By now, there is a considerable literature addressing this problem. This talk will focus on
modeling for such a setting. In particular, there are several paths that can be taken to formulate such
stochastic specifications. We can model the process directly and study the induced behavior for extremes.
Though, perhaps attractive, this is very computationally demanding. We can model the sampled extremes directly, drawing upon the elegant characterizations of max-stable processes that have appeared
in the literature. This approach runs into computational challenges as well, though recent work using
composite likelihood ideas is promising. We can model the data in a hierarchical fashion, introducing
a latent process model. Now, we have at our disposal rich and easily interpretable specifications and
have access to familiar MCMC model-fitting machinery. After some review and discussion of the first
two possibilities, we focus on the last, illuminating the range of modeling that is available and the computational issues. Recent work by Sang and Gelfand will provide the basis for this as well as examples.
Finally, some new extensions using Dirichlet Process mixing will be proposed. This is joint work with
Huiyan Sang.
15
Product Partition Models with Correlated Parameters
Rosangela H. Loschi
Departamento de Estatı́stica, Universidade Federal de Minas Gerais
In time series, Bayesian partition models aim at partitioning the entire observation period into disjoint
temporal clusters. Each cluster is an aggregation of sequential observations and a simple model is adopted
within each cluster. The main inferential problem is the estimation of the number and locations of the
temporal clusters. The popularity of partition models is justified by its flexibility to analyze change
point or clustering problems. However, its original formulation assumes a common parameter indexing
the distributions of the observations into the same temporal cluster. Furthermore, it also assumes
independence among the common parameters associated with different temporal clusters. This approach
may lead to an inaccurate identification of the number of clusters.
We extend the well-known product partition model (PPM) for clustering analysis in the temporal
context. We also assume independence among parameters in different temporal clusters, but contrary
to what is assumed in the PPM, we consider that the observations in the same cluster have their distributions indexed by different parameters. Although different, the parameters are similar for observations
within a given cluster. This is done by adopting a Gibbs distribution as the prior specification for the
canonical parameters. As a result, the parameters within the same temporal cluster are correlated. One
important advantage in allowing similar parameters within a temporal cluster is that, rather than having an unknown dimension, the dimension of the parameter vector is fixed and equal to the time series
length. This facilitates the numerical procedures used to obtain the posterior distribution.
We carried out several simulations and real dataset analyzes showing that our model provides better estimates for all parameters, including the number and position of the temporal clusters, even for
situations favoring the PPM.
This is joint work with Renato M. Assunção and João V. D. Monteiro.
16
A Bayesian Spatial Model for Panel Time Series Data
Helio dos Santos Migon
IM & COPPE - UFRJ
The focus of this talk will be on the development of spatio-temporal econometrics models for panel
data, whose elements correspond to economic agents. The spatial dependence between agents’ will be
take into account via an exogenous economic distance, which will be incorporated both in the mean and
variance structure of the model. In order to accomodate the presence of occasional outliers a t-Student
regression model is also introduced. The sensitivity to alternative hyperparameters prior specifications
will be evaluated. An illustrative application, using our proposed models, is presented to show how the
joint movements in output growth across Brazilian industrial sectors depends on the similarity of sectors’
technologies. This is joint work with: Esther Salazar and Larissa Alves.
17
“Objective Bayes” - A Dangerous Delusion
Anthony O’Hagan
University of Sheffield, United Kingdom
The so-called “objective Bayes” movement justifies itself by arguments like this: Bayesian methods
are subjective and this is hindering the growth of Bayesian statistics, so let’s invent something called
“objective Bayes”. I will argue instead that “objective Bayes” is dishonest and dangerous. My talk will
incidentally answer questions like, What is objectivity? Just how objective is science? Just how objective
are “objective Bayes” methods? If the “subjectivity” tag is a problem, what should we do about it?
18
Particle Learning for Fat-tailed Distributions
Nick Polson
Chicago, USA
We develop a sequential Monte Carlo method known as particle learning (PL) for fat-tailed error
distributions. Fat-tails are a common feature of many economic and financial time series and can be
incorporated into state space models with a number of other features such as stochastic volatility. A
natural framework to address fat-tails is in the class of scale mixtures of normals. By doing so this creates
a conditionally dynamic Gaussian model resulting in a mixture Kalman filter model. In particular, we
focus on learning the tail behavior of the time series by assuming that the errors follow a tν -distribution
where the researcher sequential computes the posterior distribution of the tail thickness p(ν|y t ) as new
data arrives. This framework is flexible enough to entertain infinite variance Cauchy errors on the one
hand (ν = 1) to standard Gaussian errors (ν = ∞). Finally, we show how a variant of the Dickey-Savage
density ratio can be used to calculate a sequential Bayes factor of a fat-tailed error versus the normal.
Comparisons are made to standard Monte Carlo and MCMC approaches and approximate inferences for
latent Gaussian processes. This is joint work with Hedibert F. Lopes.
19
Bayesian Non-Parametric Inference for Diffusion Processes
Gareth Roberts
University of Warwick, United Kingdom
This talk will consider Bayesian inference for diffusions in a non-parametric framework. The presentation will consider both a complete treatment for continuous data and goes on to consider the case of
discretely observed data. The work is motivated by problems from molecular dynamics and is illustrated
by simple examples usng molecular dynamics data.
20
Destructive Weighted Poisson Cure Rate Models
Josemar Rodrigues
Departamento de Estatı́stica, Universidade Federal de São Carlos
In this paper, we develop a flexible cure rate survival model by assuming the number of competing
causes of the event of interest to follow a compound weighted Poisson distribution. This model is more
flexible in terms of dispersion than the promotion time cure model. Moreover, it gives an interesting
and realistic interpretation of the biological mechanism of the occurrence of the event of interest as it
includes a destructive process of the initial risk factors in a competitive scenario. In other words, what
is recorded is only the undamaged portion of the original number of risk factors. An example with a real
dataset is worked out from the Bayesian point of view to illustrate different models comprised by our
formulation. Joint work with Vicente A. Garibay and Mario de Castro.
Keywords: competing risks, cure rate models, long-term survival models, weighted Poisson distribution, Conway–Maxwell Poisson (COM–Poisson) distribution.
21
Bayesian Computing with INLA
Håvard Rue
Department of Mathematical Sciences,
Norwegian University of Science and Technology, Norway
Many models in statistics can now to analysed using quick-to-compute integrated nested Laplace
approximations (INLA) instead tedious MCMC sampling. In this talk I will present the main ideas of
this approach, which models it can deal with and demonstrate how the analysis can be done in practice
from within R. The software is available from www.r-inla.org.
Bridging the gap between Gaussian fields and Gaussian Markov random fields using stochastic partial
differential equations
Gaussian fields (GFs) and Gaussian Markov random fields (GMRFs) specify both multivariate Gaussian distributions, but are still very different in the way the distribution is specified. GMRFs are naturally specified using full conditionals (with the consequence that marginal properties are transparent
in the parametrisation) and has very good computational properties, whereas GFs are specified using
covariance-functions but has less appealing computational properties. In this talk, I will discuss how to
bridge GFs and GMRFs, using stochastic partial differential equations which allow us to go seamlessly
between the GF and GMRF representation and exploit the best properties of both GFs and GMRFs.
The consequence of these results is wide-ranging.
22
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Apresentações Orais
Oral Communications
23
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações Orais
Oral Communications
Scale Mixtures of Normal Distributions: A Bayesian Analysis of Stochastic Volatility in
Mean
Carlos Antonio Abanto-Valle, Helio dos Santos Migon e Victor Hugo Lachos
Bayesian Inference for a Skew-Normal IRT Model under the Centred Parameterization
Caio Lucidius Naberezny Azevedo, Heleno Bolfarine e Dalton Francisco de Andrade
Diagnostics for Gaussian Process Emulators
Leonardo S. Bastos e Anthony O’Hagan
Bayesian Coalescent Modeling of the Evolutionary Response of HIV to Therapy
Alexander F. Braunstein, Shane T. Jensen e Jon McAuliffe
Bayesian Nonlinear Regression Models with Scale Mixtures of Skew Normal Distributions:
Estimation and Case Influence Diagnostics
Vicente Garibay Cancho, Victor Hugo Lachos e Marinho G. Andrade
Partitioning Diversity Measure for Hierarchical Beta and Dirichlet Models
Dipak Dey, Kent Holsinger e Juan C. Vivar
A General Class of Nonseparable Space-time Covariance Models
Thais Cristina Oliveira da Fonseca e Mark F. J. Steel
Exact Simulation and Bayesian Inference for Jump-Diffusion Processes
Flávio B. Gonçalves e Gareth O. Roberts
Regression Models for Exceedance Data via the Full Likelihood
Fernando Ferraz do Nascimento, Dani Gamerman e Hedibert Freitas Lopes
Spatially Varying Autoregressive Processes
Aline Araújo Nobre, Bruno Sansó e Alexandra M. Schmidt
An Efficient Split-Merge MCMC Algorithm for Mixture Models with an Unknown Number
of Components
Erlandson Ferreira Saraiva, Luı́s Aparecido Milan e Francisco Louzada-Neto
Bayesian Beta Dynamic Model and Applications
Cibele Queiroz da Silva, Helio dos Santos Migon e Leandro Tavares Correia
24
Scale Mixtures of Normal Distributions: A Bayesian Analysis
of Stochastic Volatility in Mean
Carlos Antonio Abanto-Valle∗
DME-UFRJ
Helio dos Santos Migon
DME-UFRJ
Victor Hugo Lachos
IMECC-UNICAMP
The stochastic volatility in mean (SVM) model using the class of symmetric scale mixtures of normal
(SMN) distributions is introduced in this article. The SMN family distributions is an attractive class
of symmetric distributions that includes the normal, Student-t, slash and contaminated normal distributions as special cases, providing a robust alternative to estimation in SVM models in the absence
of normality. Using a Bayesian paradigm, an efficient method based on Markov chain Monte Carlo
(MCMC) is developed for parameter estimation. Additionally, we develop a second-order approximation
method to the usual Auxiliary Particle Filter (APF) in order to estimate efficiently the log-likelihood
function to model comparison, such as the Bayesian Predictive Information Criteria (BPIC). The methods developed are applied to analyze daily stock returns data on São Paulo Stock, Mercantile & Futures
Exchange index (IBOVESPA). Bayesian model selection criteria as well as out-of- sample forecasting
results reveal that the SVM model with slash distribution provides significant improvement in model fit
as well as prediction to the IBOVESPA data over the usual normal model.
Keywords: Markov chain Monte Carlo, non-Gaussian and nonlinear state space models, scale mixture of normal distributions, stochastic volatility in mean.
∗ Apresentador/Speaker
25
Bayesian Inference for a Skew-Normal IRT Model under the
Centred Parameterization
Caio Lucidius Naberezny Azevedo∗
Department of Statistics, University of Campinas, Brazil
Heleno Bolfarine
Department of Statistics, University of São Paulo, Brazil
Dalton Francisco de Andrade
Department of Informatics and Statistics, Federal University of Santa
Catarina, Brazil
Item response theory (IRT) comprises a set of statistical models which are usefull in many fields
where there is an interest in studying latent variables. These latent variables (or characteristcs) are
directly considered in the Item Response Models (IRM) and they are usually called latent traits. An
usual assumption, for parameter estimation of the IRM, considering one group of examinees, is to assume
that the latent traits are random variables that follow a standard normal distribution. However, many
works suggest that this assumption does not apply in many cases. Furthermore, when this is the case,
the parameter estimates tend to be biased and misleading inference can be obtained. Therefore, this
characteristic must be taken into account. In this paper we present an alternative for latent trait
modelling based on the so-called skew-normal distribution. We used the centred parameterization. This
approach ensures the model identifiability. Also, a Metropolis-Hastings within Gibbs sampling based
algorithm was built for parameter estimation through an augmented data approach. A simulation study
was performed in order to assess the recovering of all parameters of the proposed estimation algorithms
and the effects of asymmetry of the latent traits distribution in such estimation. Also, a comparison
of our approach with other widely used estimation methods was considered. The results indicated that
our proposed algorithm recovers properly all parameters. Stronger the asymmetry level, better is the
performance of our approach compared to the others, specially for small sample sizes. Furthermore, we
analyzed a real data set which presents traits of asymmetry. The results obtained using our approach
confirmed the presence of strong negative asymmetry.
∗ Apresentador/Speaker
26
Diagnostics for Gaussian Process Emulators
Leonardo S. Bastos∗
University of Sheffield
Anthony O’Hagan
University of Sheffield
Mathematical models, usually implemented in computer programs known as simulators, are widely
used in all areas of science and technology to represent complex real-world phenomena. Simulators
are often so complex that they take appreciable amounts of computer time or other resources to run.
In this context, a methodology has been developed based on building a statistical representation of the
simulator, known as an emulator. The principal approach to building emulators uses Gaussian processes.
This work presents some diagnostics to validate and assess the adequacy of a Gaussian process emulator
as surrogate for the simulator. These diagnostics are based on comparisons between simulator outputs
and Gaussian process emulator outputs for some test data, known as validation data, defined by a sample
of simulator runs not used to build the emulator. Our diagnostics take care to account for correlation
between the validation data. To illustrate a validation procedure, we apply these diagnostics to two
different data sets.
∗ Apresentador/Speaker
27
Bayesian Coalescent Modeling of the Evolutionary Response of
HIV to Therapy
Alexander F. Braunstein
Department of Statistics, The Wharton School,
University of Pennsylvania
Shane T. Jensen∗
Department of Statistics, The Wharton School,
University of Pennsylvania
Jon McAuliffe
Department of Statistics, The Wharton School,
University of Pennsylvania
Statistical evolutionary models provide an important mechanism for describing and understanding
the escape response of a viral population under a particular therapy. We present a coalescent-based
model that incorporates spatially varying mutation and recombination rates at the nucleotide level. Our
hierarchical structure also maintains separate parameters for treatment and control groups, which allows
us to estimate treatment effects explicitly. We use the model to investigate the sequence evolution of HIV
populations exposed to a recently developed antisense gene therapy, as well as a more conventional drug
therapy. The detection of biologically relevant and plausible signals in both therapy studies demonstrates
the effectiveness of the method.
∗ Apresentador/Speaker
28
Bayesian Nonlinear Regression Models with Scale Mixtures of
Skew Normal Distributions: Estimation and Case Influence
Diagnostics
Vicente Garibay Cancho∗
Departamento de Matemática Aplicada e Estatı́stica -USP
Victor Hugo Lachos
Departamento de Estatı́stica-Unicamp
Marinho G. Andrade
Departamento de Matemática Aplicada e Estatı́stica -USP
The purpose of this paper is to develop a Bayesian analysis for nonlinear regression models under
scale mixtures of skew-normal distributions (Branco and Dey, 2001). This novel class of models provides
a useful generalization of the symmetrical nonlinear regression models (Galea et al., 2005) since the error
distributions cover both skewness and heavy–tailed distributions such as the skew-t, skew-slash and the
skew-contaminated normal distributions. The main advantage of these class of distributions is that they
have a nice hierarchical representation that allows the implementation of Markov chain Monte Carlo
(MCMC) methods to simulate samples from the joint posterior distribution. In order to examine the
robust aspects of this flexible class, against outlying and influential observations, we present a Bayesian
case deletion influence diagnostics based on the Kullback–Leibler divergence as proposed by Cho et al.
(2009). Further, some discussions on models selection criteria are given. The developed procedures
are illustrated considering a simulated data, and a real data previously analyzed under normal and
skew-normal nonlinear regression models.
∗ Apresentador/Speaker
29
Partitioning Diversity Measure for Hierarchical Beta and
Dirichlet Models
Dipak Dey
Department of Statistics, University of Connecticut, USA
Kent Holsinger
Department of Ecology and Evolutionary Biology, University of
Connecticut, USA
Juan C. Vivar∗
Department of Statistical Sciences, Duke University, USA
Bayesian approaches are widely used to capture over dispersion in binomial and multinomial data
through beta binomial and Dirichlet multinomial model. Consequently, the same approaches also produce a partition on diversity measure within and among levels in multilevel binomial and multinomial
models. In this paper, we consider situations in which the prior distribution of a parameter vector in the
distribution of the observable binomial and multinomial data contains a hyper parameter vector, which
itself has a hyper distribution and so forth. We first develop a novel multilevel product partition result
which shows how the total diversity is partitioned between various hierarchical levels. Then we establish
that the gain in information decreases as one moves to higher levels of hierarchy. We also establish the
connection with the clumped multinomial data. Finally, we apply our methodology to simple multi locus
two allele genetic models to show how the diversity measure is factored into diversity between populations and within loci. Extensions of the model to incorporate hierarchical levels with multiple alleles per
locus are also considered.
Keywords: Beta binomial, Dirichlet multinomial, diversity measure.
∗ Apresentador/Speaker
30
A General Class of Nonseparable Space-time Covariance
Models
Thais Cristina Oliveira da Fonseca∗
University of Warwick, United Kingdom
Mark F. J. Steel
University of Warwick, United Kingdom
The aim of this work is to construct nonseparable, stationary covariance functions for processes
that vary continuously in space and time. Stochastic modelling of phenomena over space and time is
important in many areas of application. But choice of an appropriate model can be difficult as we need
to ensure that we use valid covariance structures. A common choice for the process is a product of
purely spatial and temporal random processes. In this case, the resulting process possesses a separable
covariance function. Although these models are guaranteed to be valid, they are severely limited, since
they do not allow space-time interactions. We propose a general and flexible class of valid nonseparable
covariance functions based on the mixture of separable covariance functions. The proposed model allows
for different degrees of smoothness across space and time and long-range dependence in time. Moreover,
the proposed class has as particular cases several covariance models proposed in the literature such as
the Matérn and the Cauchy Class. The proposed model easily allows for extensions e.g. to include a
nugget effect and asymmetries as we illustrate in the modeling of the Irish wind data.
∗ Apresentador/Speaker
31
Exact Simulation and Bayesian Inference for Jump-Diffusion
Processes
Flávio B. Gonçalves∗
University of Warwick
Gareth O. Roberts
University of Warwick
The last 10 years have seen a large increase in statistical methodology for diffusions, and computationally intensive Bayesian methods using data augmentation have been particulary prominent. This activity
has been fuelled by existing and emerging applications in economics, biology, genetics, chemistry, physics
and engineering. However diffusions have continuous sample paths so may natural continuous time phenomena require more general classes of models. Jump-diffusions have considerable appeal as flexible
families of stochastic models. Bayesian inference for jump-diffusion models motivates new methodological challenges, in particular requires the construction of novel simulation schemes for use within data
augmentation algorithms and within discretely observed data. In this paper we propose a new methodology for exact simulation of jump-diffusion processes. Such method is based on the recently introduced
Exact Algorithm for exact simulation of diffusions. We also propose a simulation-based method to make
likelihood-based inference for discretely observed jump-diffusions in a Bayesian framework. Simulated
examples are presented to illustrate the proposed methodology.
∗ Apresentador/Speaker
32
Regression Models for Exceedance Data via the Full Likelihood
Fernando Ferraz do Nascimento∗
Universidade Federal do Piauı́
Dani Gamerman
Universidade Federal do Rio de Janeiro
Hedibert Freitas Lopes
University of Chicago
Many situations in practice require appropriate specification of operating characteristics under extreme conditions. Typical examples include environmental sciences where studies include extreme temperature, rainfall and river flow to name a few. In these cases, the effect of geographic and climatological
inputs are likely to play a relevant role. This paper is concerned with the study of extreme data in
the presence of relevant auxiliary information. The underlying model involves a mixture distribution:
a generalized Pareto distribution is assumed for the exceedances beyond a high threshold and a nonparametric approach is assumed for the data below the threshold. Thus, the full likelihood including data
below and above the threshold is considered in the estimation. The main novelty is the introduction of a
regression structure to explain the variation of the exceedances through all tail parameters. Estimation
is performed under the Bayesian paradigm and includes model choice. This allows for determination of
higher quantiles under each covariate configuration and upper bounds for the data, where appropriate.
Simulation results show that the models are appropriate and identifiable. The models are applied to the
study of two temperature datasets: maxima in the U.S.A. and minima in Brazil, and compared to other
related models.
∗ Apresentador/Speaker
33
Spatially Varying Autoregressive Processes
Aline Araújo Nobre∗
PROCC/FIOCRUZ
Bruno Sansó
University of California at Santa Cruz
Alexandra M. Schmidt
DME/UFRJ
We develop a class of models for processes indexed in time and space that are based on autoregressive
(AR) processes at each location. We use a Bayesian hierarchical structure to impose spatial coherence
for the coefficients of the AR processes. The priors on such coefficients consists of spatial processes that
guarantee time stationarity at each point in the spatial domain. The AR structures are coupled with a
dynamic model for the mean of the process, which is expressed as a linear combination of time-varying
parameters. We use satellite data on sea surface temperature for the North Pacific to illustrate how the
model can be used to separate trends, cycles and short term variability for high frequency environmental
data.
∗ Apresentador/Speaker
34
An Efficient Split-Merge MCMC Algorithm for Mixture
Models with an Unknown Number of Components
Erlandson Ferreira Saraiva∗
Departamento de Estatı́stica, Universidade Federal de São Carlos
Luı́s Aparecido Milan
Departamento de Estatı́stica, Universidade Federal de São Carlos
Francisco Louzada-Neto
Departamento de Estatı́stica, Universidade Federal de São Carlos
We propose a new split-merge MCMC algorithm for estimation of mixture models with an unknown
number of components. The strategy for splitting is based on data and posterior distribution. Allocation
probabilities are calculated based on component parameters which are generated from the posterior distribution given the previously allocated observations. The split-merge proposals allows a major change
in configuration of the latent variables in a single iteration of the algorithm, avoiding possible local
modes, and are accepted according to the Metropolis-Hastings probability. As advantages, our approach
determines a quick split proposal, in contrary to former split procedures which require substantial computational effort, and remove the need to specify a transition function and consequently the calculate of
the jacobian, turning the probability of acceptance easier of compute and simplifying the implementation. The performance of the method is verified using an artificial data set and two real data sets. The
first real data set consist of benchmark data of velocities from distant galaxies diverging from our own
while the second is Escherichia Coli bacterium gene expression data.
∗ Apresentador/Speaker
35
Bayesian Beta Dynamic Model and Applications
Cibele Queiroz da Silva∗
Department of Statistics - University of Brası́lia
Helio dos Santos Migon
Department of Statistics - Federal University of Rio de Janeiro
Leandro Tavares Correia
Department of Statistics - University of Brası́lia
The beta distribution provides a useful tool for modeling data restricted to the interval (0,1) such
as rates, percentages and proportions. In particular, one may be interested in modelling fluctuations in
variables such as the proportion of a given fish species in a lake over time, the monthly unemployment
rates of a given country or the proportion of a given component in compositional data analysis at
increasing depths. We develop a Bayesian Beta Dynamic Model for modelling and forecasting single
time series of proportions. This work is related to the class of the so called Dynamic Generalized
Linear Models (DGLM). We use non-conjugate priors and some forms of approximate Bayesian analysis,
including Linear Bayesian Estimation. Some applications to both real and simulated data are provided.
∗ Apresentador/Speaker
36
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
Apresentações em Poster
Poster Communications
37
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
1. Use of Poisson Spatio-Temporal Regression Models for the Brazilian Amazon Forest
Malaria Fever Counting Data
Jorge Alberto Achcar, Edson Z. Martinez, Aparecida Doniseti Pires de Souza, Vilma M. Tachibana
e Edilson F. Flores
2. Generalized Exponential Distribution: A Bayesian Approach Using MCMC Methods
Jorge Alberto Achcar, Fernando Antônio Moala e Juliana Boleta
3. Incorporando Distâncias Econométricas em Modelos Dinâmicos Bayesianos
Larissa de Carvalho Alves, Esther Salazar e Helio dos Santos Migon
4. Análise Bayesiana da Priori Jefferys para Curvas de Crescimento
Magali Teresópolis Reis Amaral, Marinho G. Andrade e Katiane Silva Conceição
5. Comparações Múltiplas Bayesianas em Modelos Normais Homocedásticos e Heterocedásticos
Paulo César de Resende Andrade e Daniel Furtado Ferreira
6. Neighborhood Dependence in Bayesian Spatial Models
Renato M. Assunção e Elias T. Krainski
7. Utilização de Modelos de Mistura com Correlação Espacial no Mapeamento do Risco
de Mortalidade por Câncer de Pulmão no Sul do Brasil
Márcia Helena Barbian, Renato Martins Assunção e Marcelo Costa Azevedo
8. Aplicação do Algoritmo MCMC de Saltos Reversı́veis na Identificação de Modelos
ARMA
Márcia Helena Barbian, Alessandro José Queiroz Sarnaglia e Aline Martines Piroutek
9. The Poisson-Exponential Model: A Bayesian Approach
Gladys Dorotea Cacsire Barriga, Vicente G. Cancho e Franscisco Louzada-Neto
10. Decisões de Investimento e Restrição Financeira: Uma Abordagem Bayesiana com
Modelo Dinâmico Multinı́vel
Camila Fernanda Bassetto e Aquiles Elie Guimarães Kalatzis
38
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
11. A New Regression Model for Proportions
Jorge Luis Bazán, Cristian Bayes e Catalina Garcı́a
12. Test for Symmetry in Contingency Tables: A FBST Approach
Gustavo G. Bernardo, Marcelo S. Lauretto e Julio Michael Stern
13. Análise Bayesiana de Ensaios Fatoriais 2k Usando os Princı́pios dos Efeitos Esparsos,
da Hierarquia e da Hereditariedade
Guilherme Biz, Silvio Sandoval Zocchi e Roseli Aparecida Leandro
14. Aplicações de Inferência Bayesiana Aproximada em Modelos Gaussianos Latentes
Wagner Hugo Bonat e Paulo Justiniano Ribeiro Jr.
15. Robust Linear Mixed Models with Heterogeneity in the Random-Effects Population
Celso Rômulo Barbosa Cabral, Vı́ctor Hugo Lachos e Maria Regina Madruga
16. Uma Abordagem Bayesiana do Modelo Mistura Padrão com Fragilidade
Vinicius Fernando Calsavara, Vera Lúcia Damasceno Tomazella e José Carlos Fogo
17. Simulação Perfeita da Distribuição Normal Multivariada Truncada
Thiago Feitosa Campos e Márcia D’Elia Branco
18. Accounting for Latent Spatio-Temporal Structure in Animal Abundance Models
Estelina Serrano de M. Capistrano, Marco A. Rodrı́guez e Alexandra M. Schmidt
19. Bayesian Dynamic Modelling of Biomass Burning Adverse Effects on Daily Demand
of Children’s Hospital Admissions in a Southwestern Region of Brazilian Amazon
Cleber Nascimento do Carmo, Mariane Branco Alves e Sandra de Souza Hacon
20. Uma Abordagem Bayesiana para Processos de Poisson GARMA
Marcos Henrique Cascone, Adriana Strieder Philipsen, Marinho G. Andrade e Ricardo S. Ehlers
21. Aplicação e Validação do Método de Agrupamento Hierárquico Bayesiano
Juliana G. Cespedes, Carlos Silveira, Isabela Drummond, Adriana P. Mattedi, Valdete M. G.
Almeida, Marcelo M. Santoro e Wagner Meira Jr.
39
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
22. A Bayesian Analysis for the Generalized Negative Binomial Weibull Cure Fraction
Survival Model: Estimating the Lymph Nodes Metastasis Rates
Juliana Cobre, Francisco Louzada Neto e Gleici S. C. Perdoná
23. Modelos Série de Potência Zero-Modificados: Uma Abordagem Bayesiana
Katiane Silva Conceição, Marinho G. Andrade e Francisco Louzada-Neto
24. Comparação de um Modelo Dinâmico e um Determinı́stico na Predição da Vazão de
uma Bacia
Josiane da Silva Cordeiro, Alexandra Mello Schmidt, Helio dos Santos Migon e Dirceu S. Reis Jr.
25. Imputação de Observações Faltantes em Dados de Área
Ana Carolina Carioca da Costa, Renata Souza Bueno e Alexandra Mello Schmidt
26. Estimando Variações de Temperatura no Estado do Rio de Janeiro - Brasil, Utilizando
Modelos Não-estacionários
Geraldo Marcelo da Cunha, Dani Gamerman e Montserrat Fuentes
27. A Dynamic Approach for the Piecewise Exponential Model with Random Time Grid
Fábio Nogueira Demarqui, Rosangela H. Loschi, Dipak K. Dey e Enrico A. Colosimo
28. A Bayesian Approach to Multivariate H-spline Nonparametric Regression
Ronaldo Dias e Dani Gamerman
29. Modelo de Regressão Exponencial: Estimação Bayesiana Objetiva
Teresa Cristina Martins Dias e Vera Lucia D. Tomazella
30. Bayesian Inference for Gamma Modulated Model
Marı́a Soledad Torres Dı́az e Francisco Torres
31. Estudos Comparativos Envolvendo Classificação Bayesiana em Dados Protéicos
Isabela N. Drummond, Juliana G. Cespedes, Carlos H. Silveira, Adriana P. Mattedi, Valdete M.
G. Almeida, Marcelo M. Santoro e Wagner Meira Jr.
40
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
32. Computational Tools for Comparing Asymmetric GARCH Models via Bayes Factors
Ricardo Sandes Ehlers
33. Latent Residual Analysis in Binary Regression with Skewed Link
Rafael Braz Azevedo Farias, Marcia Branco e Dipak K. Dey
34. Modelo Partição Produto com “Clusters” Correlacionados
Jacqueline Alves Ferreira, Rosangela Helena Loschi e Marcelo Azevedo
35. Bayesian Measures of Model Complexity and Fit in Asymmetrical Scenarios
Cléber da Costa Figueiredo, Mônica Carneiro Sandoval e Heleno Bolfarine
36. BIC Criterion for Minimal Markov Models
Jesús Enrique Garcı́a e Verónica Andrea González-López
37. Interação Social na Criminalidade da Região Metropolitana de São Paulo: Um modelo
Espaço-Temporal Bayesiano
Marcelo Gazzano, Flávio Augusto Ziegelmann e Patrı́cia K. Ziegelmann
38. Estimadores Lineares Bayesianos em Amostragem de População Finita
Kelly Cristina Mota Gonçalves, Fernando A. S. Moura e Helio S. Migon
39. A Bayesian Test for the Intraclass Correlation Coefficient
Verónica Andrea González-López, Julio M. Singer, Nelson I. Tanaka e Antonio C. Pedroso-de-Lima
40. Modelos de Volatilidade Estocástica com Distribuições de Caudas Pesadas
Ivan Robert Enrı́quez Guzmán e Pedro Alberto Morettin
41. Testing the Deviance of Homogeneity in Poisson Distributions: A FBST Approach
Paulo C. Hubert Jr., Marcelo de Souza Lauretto e Julio M. Stern
42. Processo de Difusão Multivariado com Estrutura Espacial: Modelagem e Inferência
Vinicius Pinheiro Israel e Helio S. Migon
41
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
43. Nested Hypotheses: An Example in Genetics
Rafael Izbicki, Victor Fossaluza, Eduardo Yoshio Nakano e Carlos Alberto de Bragança Pereira
44. Generalized Latent Factor Models for Yield Curves in Multiple Markets
Márcio Poletti Laurini e Luiz Koodi Hotta
45. Bayesian Inference for the Theta-Logistic Population Growth Model
Selene Loibel, Marinho G. Andrade, Jorge A. Achcar e João B. Ribeiro do Val
46. Measuring Vulnerability via Spatially Hierarchical Factor Models
Hedibert F. Lopes, Alexandra M. Schmidt, Esther Salazar, Mariana Gómez e Marcel Achkar
47. A Multiple Time Scale Survival Model with a Cure Fraction
Francisco Louzada-Neto e Juliana Cobre
48. Medidas do Valor Preditivo de um Modelo Bayesiano Logı́stico Aplicado a Dados de
Crédito
Francisco Louzada-Neto e Paulo Henrique Ferreira da Silva
49. Teste de Hipótese Bayesiano para o Parâmetro de Forma do Modelo Weibull
Camila Bertini Martins, Vera L. D. Tomazella e Adriano Polpo
50. Aproximações Analı́ticas para Posterioris
Thiago Guerrera Martins
51. Forward-Backward Study of the Stereo Vision Problem: A New Approach to Solve
Belief Propagation on Loop Graphs
Fortunato Silva de Menezes, Davi Geiger, Mário Javier Ferrua Vivanco e Ricardo Martins de Abreu
Silva
52. Modelo de Risco Logı́stico Dependente do Tempo com Fragilidade
Eder Angelo Milani, Vera Lúcia Damasceno Tomazella e Teresa Cristina Martins Dias
53. Adaptive Proxy Maximum Probability Estimation of Multidimensional Poisson Intensities
Jose Carlos Simon de Miranda
42
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
54. A Practical Approach to Elicit Multivariate Prior Distributions
Fernando Antônio Moala e Anthony O’Hagan
55. Elicitação de uma Distribuição a Priori com Aplicações Clı́nicas
Fernando Antônio Moala
56. Modelos Dinâmicos para Deformação Espacial
Fidel Ernesto Castro Morales e Dani Gamerman
57. Brazilian Pediatric Risk of Severity Illness Model
Eduardo Yoshio Nakano, Cristina Malzoni Ferreira Mangia e Carlos Alberto de Bragança Pereira
58. A Semiparametric Bayesian Approach to Extreme Value Estimation
Fernando Ferraz do Nascimento, Dani Gamerman e Hedibert Lopes
59. Modelos Dinâmicos Matriz Variados com Estrutura de Grafos para Construção de
Portfólios
Leonardo da Cruz Nassif, Helio dos Santos Migon e Carlos Carvalho
60. Modelo Weibull Modificado de Longa Duração Aplicado em Câncer de Mama - Uma
Abordagem Bayesiana
Cleyton Zanardo de Oliveira, Gleici S. C. Perdoná e Francisco Louzada-Neto
61. Modelagem Bayesiana Hierárquica em PPNHs
Maristela Dias de Oliveira, Enrico A. Colosimo e Gustavo L. Gilardoni
62. Abordagem Bayesiana para Modelos GARCH(p,q): Uma Comparação Usando Distribuições Normal e t de Student para os Retornos Ibovespa
Sandra Cristina de Oliveira, Marinho G. Andrade e Valeria A. M. Ferreira
63. Avaliação de Múltiplos Testes Diagnósticos na Ausência de Padrão Ouro: Comparação
entre o Modelo Frequentista e o Modelo Bayesiano com Três Diferentes Prioris Objetivas
Gilberto de Araujo Pereira, Francisco Louzada-Neto, Hélio de Moraes Souza, Márcia Maria Ferreira
Silva e Valdirene de Fátima Barbosa
43
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
64. Modelo Bayesiano Geral de Classe Latente para Múltiplos Testes Diagnósticos com
Estrutura para Covariáveis e Estratificação da População
Gilberto de Araujo Pereira, Francisco Louzada-Neto, Hélio de Moraes Souza, Márcia Maria Ferreira
Silva e Valdirene de Fátima Barbosa
65. Bayesian Analysis Applied to Data of the Brazilian Market Hydrated Alcohol
Gislene A. Pereira, Letı́cia L. Milani e Deive C. Oliveira
66. Métodos de Estimação em Modelos Dinâmicos para Séries Temporais de Contagens
João Batista de Morais Pereira, Alexandra Mello Schmidt e Helio dos Santos Migon
67. Comparação de Modelos de Relação Hipsométrica para Dados Espacialmente Correlacionados: Uma Abordagem Bayesiana
Júlio César Pereira e Carlos Alberto Martinelli de Souza
68. LASSO Bayesiano no Mapeamento de QTL em uma População F2
Renato Nunes Pereira, Roseli Aparecida Leandro, Antonio Augusto Franco Garcia, Cláudio Lopes
de Souza Jr e Anete Pereira de Souza
69. Processo ARMA: Um Estudo Bayesiano
Adriana Strieder Philippsen, Marcos Henrique Cascone, Marinho G. Andrade e Ricardo S. Ehlers
70. Estudo das Matrizes de Covariância de Modelos Bayesianos com Interação EspaçoTemporal
Letı́cia Cavalari Pinheiro e Renato M. Assunção
71. Um Modelo Bayesiano de Regressão Logı́stica com Erros e Classificações Repetidas
Magda Carvalho Pires e Roberto da Costa Quinino
72. Sensibilidade da Inferência Bayesiana com Prioris de Bayes-Laplace e de Jeffreys para
o Modelo Binomial Ponderado
Rubiane Maria Pires e Josemar Rodrigues
44
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
73. Inferential Implications of Over-Parameterization: A Case Study in Incomplete Categorical Data
Frederico Zanqueta Poleto, Carlos Daniel Paulino, Geert Molenberghs e Julio da Motta Singer
74. Análise Bayesiana para o Estudo de Dados de Fadiga de Madeira
Silvia Maria Prado, Mariano Martinez Espinosa, Lia Hanna Martins Morita e Carlito Calil Junior
75. Classificação Bayesiana dos Marcadores Sorológicos das Doenças do Sangue quanto à
Retenção Sorológica na Doação Sanguı́nea em Pernambuco
Niedja Maristone de O. Barreto Queiroz, Eufrázio S. Santos, Ana Cristina S. Bezerra, Maria
Betânia A. Pinto, Lúcilia M. D. Lopes e Divaldo de A. Sampaio
76. Uma Abordagem Bayesiana para Modelos Auto-regressivos Periódicos com Aplicação
à Previsão de Vazões Médias Mensais
Ricardo Luis dos Reis, Marinho G. Andrade e Thelma Sáfadi
77. Análise da Sobremortalidade em Perı́odos Epidêmicos de Dengue
Camila Maria Casquilho Resende e Dani Gamerman
78. Construção de Tábuas de Mortalidade de Inválidos através de Modelos Estatı́sticos
Bayesianos
Aloı́sio Joaquim Freitas Ribeiro, Edna Afonso Reis e Joana Barbabela Barbosa
79. Full Bayesian Significance Test for Extremal Distributions
Laura Letı́cia R. Rifo e Diego Fernando de Bernardini
80. Um Procedimento Bayesiano para a Análise de Dados Longitudinais na Forma de
Contagens, com Superdispersão
Fernanda Bührer Rizzato, Clarice G. B. Demétrio e Roseli A. Leandro
81. Inferência em Famı́lias Estendidas de Distribuições Normais
Gustavo Henrique Mitraud Assis Rocha, Rosangela H. Loschi e Reinaldo B. Arellano-Valle
45
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
82. Um Novo Modelo para Dependência Espacial
Erica Castillo Rodrigues e Renato Martins Assunção
83. Bayesian Analysis of Intervention Model with AR Error Applied to the IPCA Series
Letı́cia Lima Milani Rodrigues, Gislene Araújo Pereira e Deive Ciro de Oliveira
84. Distribuição Geométrica Exponencial com Função de Risco Crescente
Mari Roman, Francisco Louzada-Neto e Vicente Garibay Cancho
85. Evaluating Spatio-Temporal Models for Crop Yield Forecasting Using INLA: Implications to Pricing Area Yield Crop Insurance Contracts
Ramiro Ruiz-Cárdenas e Elias Teixeira Krainski
86. Morbidade Pulmonar e Condições Climáticas: Um Estudo na Cidade de São Paulo
Thelma Sáfadi e Airlane Pereira Alencar
87. Considerações Acerca da Influência da Taxa de Câmbio nos Preços do Petróleo Negociado no Mercado Internacional
André Assis de Salles
88. Standard Setting for a Rasch Poisson Count Model
Ernesto San Martı́n, Luis Mauricio Castro Cepero, Alejandro Jara e Rianne Janssen
89. Distribuições Exponenciais Bivariadas: Uma Aproximação Bayesiana Usando o Software WinBUGS
Carlos Aparecido dos Santos e Jorge Alberto Achcar
90. Modelo Logı́stico Misto com Classes de Distribuições mais Flexı́veis para os Efeitos
Aleatórios
Cristiano de Carvalho Santos e Rosângela Helena Loschi
91. Comparison of Classical and Bayesian Approaches for Intervention Analysis in Structural Models
Thiago R. Santos, Glaura da Conceição Franco e Dani Gamerman
46
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
92. Metodologia Bayesiana para Detecção de Itens Assimétricos em Modelos da Teoria de
Resposta do Item
Vera Lúcia Filgueira dos Santos, Dani Gamerman e Tufi Machado Soares
93. Clustering Gene Expression Data Using a Split-Merge-Birth Procedure
Erlandson Ferreira Saraiva e Luı́s A. Milan
94. Modelos Espaço-Temporais para Dados Temporalmente Agregados
Alexandre S. Silva, Alexandra M. Schmidt e Paulo Justiniano Ribeiro Jr.
95. Medidas de Associação em Tabelas de Contingência: Uma Abordagem Genuinamente
Bayesiana
Patrı́cia Viana da Silva, Victor Fossaluza e Carlos Alberto de Bragança Pereira
96. Comparação de Modelos para a Identicação de um Ponto de Mudança em Retornos
de Mercados Emergentes
Vanessa Loureiro Silva e Rosângela Helena Loschi
97. Redes Bayesianas KDB Aplicadas à Credit Scoring
Anderson Luiz de Souza, Francisco Louzada-Neto e Luis Aparecido Milan
98. Modelos Multivariados de Regressão Beta para Estimação em Pequenas Áreas
Debora Ferreira de Souza e Fernando Antonio da Silva Moura
99. Measuring the Cost Efficiency of Brazilian Electricity Distribution Utilities by Bayesian
SFA Models
Marcus Vinicius Pereira de Souza, Reinaldo Castro Souza, Madiagne Diallo e Tara Keshar Nanda
Baidya
100. Estimação Bayesiana em Modelos de Regressão Beta
Mariana Albi de Oliveira Souza, Helio S. Migon e Cibele Q. Silva
101. Estimando o Risco na Concessão de Empréstimo Pessoal através da Regressão Logı́stica
Bayesiana
Shirlaine Moraes e Souza, Gilson Pereira Prata e Maria Regina Madruga
47
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
Apresentações em Poster
Poster Communications
102. Previsão de Resultados de Jogos de Futebol com o Uso de um Painel de Especialistas:
Uma Abordagem Bayesiana
Adriano Kamimura Suzuki, Luis Ernesto Bueno Salasar, Jose Galvão Leite e Francisco LouzadaNeto
103. Bayesian Selection for Heston Models with Volatilities Determined by Fourier Series
Method
Rodrigo dos Santos Targino, Yuri F. Saporito e Milan Merkle
104. Uma Abordagem Bayesiana para Modelos de Intensidades Hı́bridos com Termos de
Fragilidades e Estresse Limiar
Cynthia A. V. Tojeiro, Francisco Louzada-Neto e Gleici S. C. Perdoná
105. Distribuição a Posteriori de Referência Log-Gama Negativa para a Função de Sobrevivência do Modelo Exponencial
Vera Lucia Damasceno Tomazella, Mayara Piani Luna da Silva e Camila Bertini Martins
106. Análise Bayesiana do Modelo Log-Binomial: Comparação Empı́rica de Três Prioris
Não-Informativas
Vanessa Bielefeldt Leotti Torman e Suzi Alves Camey
107. Modelos para Dados Categóricos com Estrutura Temporal
Patrı́cia Lusie Coelho Velozo e Alexandra Mello Schmidt
108. Desempate Técnico
Filipe Jaeger Zabala e Sérgio Wechsler
109. Modelling Disease Risk Space-Time Interaction
Patricia Klarmann Ziegelmann, Nicky Best e Sylvia Richardson
48
Use of Poisson Spatio-Temporal Regression Models for the
Brazilian Amazon Forest Malaria Fever Counting Data
Jorge Alberto Achcar
FMRP/USP & FCT/UNESP
Edson Zangiacomi Martinez
FMRP/USP
Aparecida Doniseti Pires de Souza
FCT/UNESP
Vilma Mayumi Tachibana
FCT/UNESP
Edilson Ferreira Flores
FCT/UNESP
In this paper, we use Poisson spatial-temporal regression models to analyse a Brazilian Amazon
Forest malaria fever counting data for the period ranging from 1999 to 2008. In this study, we have
the present of some covariates that could be important in the yearly prediction of MFD (malaria fever
disease), as deforestation rate. We obtain the inferences of interest using a Bayesian approach and
MCMC (Markov Chain Monte Carlo) methods to simulate samples for the joint posterior distribution
of interest. Discrimination of different models is also discussed.
Keywords: Poisson Regression Models, CAR Models, Malaria Fever, Markov Chain Monte Carlo.
49
Generalized Exponential Distribution: A Bayesian Approach
Using MCMC Methods
Jorge Alberto Achcar
UNESP and FMRP-USP
Fernando Antônio Moala
DMEC, UNESP
Juliana Boleta
FMRP-USP
The generalized exponential distribution could be a good alternative to analyse lifetime data, as
an alternative for the use of standard existing lifetime distributions as exponential, Weibull or gamma
distributions. Assuming different noninformative prior distributions for the parameters of the model,
we introduce a Bayesian analysis using MCMC (Markov Chain Monte Carlo) methods. Some numerical illustrations considering simulated and real lifetime data are presented to illustrate the proposed
methodology, especially the effects of different priors on the posterior summaries of interest.
50
Incorporando Distâncias Econométricas em Modelos
Dinâmicos Bayesianos
Larissa de Carvalho Alves
Universidade Federal do Rio de Janeiro
Esther Salazar
SAMSI & Duke University
Helio dos Santos Migon
Universidade Federal do Rio de Janeiro
Econometria espacial é um ramo da econometria que lida com interações de estruturas espaciais
em modelos de regressão linear com dados transversais e de painel. Por painel entende-se observações
repetidas no tempo para um número fixo de agentes. Ultimamente estudos sobre a econometria espacial
tem crescido muito uma vez que são consideradas relações entre agentes. Essas relações são descritas por
medidas observáveis de distâncias econométricas, por exemplo quando consideramos firmas ou setores da
economia como unidades observacionais e a distância entre agentes como o volume de comércio exterior.
Este trabalho apresenta um modelo econométrico espacial dinâmico no qual as observações correspondem a agentes econômicos. Motivamos a utilização de modelos econométricos espaciais e distâncias
entre agentes, onde este último tem influência tanto na estrutura de médias como na estrutura de covariância, e os aplicamos em dados reais norte-americanos e brasileiros. Temos como objetivo incorporar
relações entre setores da economia que são dadas por suas similaridades e, além disso, fazer a estimação
dos modelos lançando mão de uma abordagem completamente Bayesiana. Exemplos utilizando dados
simulados também serão apresentados em variações do modelo.
51
Análise Bayesiana da Priori Jefferys para Curvas de
Crescimento
Magali Teresópolis Reis Amaral
Universidade Estadual de Feira de Santana - UESF
Marinho G. Andrade
Universidade de São Paulo - USP
Katiane Silva Conceição
Universidade Federal de São Carlos - UFSCAR
Neste trabalho é proposta uma abordagem bayesiana para ajuste de curvas de crescimento para
bovinos, usando dados de peso e idade de bovinos machos da raça Canchinm, medidos durante 40 meses.
Como na abordagem bayesina as densidades a priori desempenham um papel importante, assim como as
possı́veis relações biológicas entre os parâmetros, foram comparados os ajustes de quatro modelos: Brody,
Logistico, Gompertz e von Bertalanffy, considerando-se as densidades a priori não informativas de Jefreys
com e sem a suposição de independência entre os parâmetros. A técnica de simulação de Monte Carlo
Cadeia de Markov (MCMC) foi implementada para obtenção de um sumário das densidades a posteriori.
Para a seleção do modelo que melhor se ajusta ao conjunto de dados, foram utilizados diversos critérios
bayesianos, baseados nas amostras geradas das densidades a posteriori. Finalmente, a densidade preditiva
foi utilizada para uma análise a posteriori dos últimos cinco meses nos quais os pesos foram avaliados.
52
Comparações Múltiplas Bayesianas em Modelos Normais
Homocedásticos e Heterocedásticos
Paulo César de Resende Andrade
Instituto de Ciência e Tecnologia - Universidade Federal dos Vales do
Jequitinhonha e Mucuri
Daniel Furtado Ferreira
Departamento de Ciências Exatas - Universidade Federal de Lavras
Procedimentos de comparações múltiplas são utilizados para comparar médias de nı́veis de um fator,
porém, os testes mais populares apresentam problemas de ambiguidade dos resultados e de controle do
erro tipo I, além de terem seus desempenhos influenciados negativamente no caso de heterogeneidade
de variâncias e não-balanceamento. Este trabalho teve por objetivo propor alternativas bayesianas para
comparações múltiplas considerando os casos de homogeneidade e heterogeneidade de variâncias em
modelos com distribuição normal, balanceados ou não, ilustradas em exemplos simulados. A metodologia
utilizada neste trabalho foi feita a partir da distribuição a posteriori t multivariada. Foram geradas k
cadeias de médias, utilizando o método de Monte Carlo. Foi obtida a amplitude padronizada sob H0 ,
obtida na distribuição a posteriori das médias, contemplando a possibilidade de se analisar tanto o caso de
variâncias heterogêneas como o caso de variâncias homogêneas. Os procedimentos propostos apresentam
a desvantagem de ainda não estarem implementados. Em compensação apresentam vantagens em relação
aos testes convencionais, no sentido de não haver necessidade de balanceamento dos dados, que é muito
significativo do ponto de vista prático, e de poderem ser utilizados em situações homo e heterocedásticas.
Os procedimentos de comparações múltiplas bayesianos foram propostos com sucesso para situações de
normalidade, com ou sem homogeneidade de variâncias e com ou sem balanceamento.
53
Neighborhood Dependence in Bayesian Spatial Models
Renato M. Assunção
Departamento de Estatı́stica, UFMG
Elias T. Krainski
Departamento de Estatı́stica, UFPr
The conditional autoregressive model (CAR) and the intrinsic autoregressive model (ICAR) are widely
used as prior distribution for random spatial effects in Bayesian models. Several authors have pointed out
impractical or counterintuitive consequences on the prior covariance matrix or the posterior covariance
matrix of the spatial random effects. This paper clarifies many of these puzzling results. We show that
the neighborhood graph structure, synthesized in eigenvalues and eigenvectors structure of a matrix
associated with the adjacency matrix, determines most of the apparently anomalous behavior. We
illustrate our conclusions with regular and irregular lattices including lines, grids and lattices based on
real maps.
54
Utilização de Modelos de Mistura com Correlação Espacial no
Mapeamento do Risco de Mortalidade por Câncer de Pulmão
no Sul do Brasil
Márcia Helena Barbian
Universidade Federal de Minas Gerais
Renato Martins Assunção
Universidade Federal de Minas Gerais
Marcelo Costa Azevedo
Universidade Federal de Minas Gerais
Uma área de estudo em bioestatı́stica e de interesse epidemiológico é o mapeamento de doenças. O
objetivo de mapear determinada patologia é detectar áreas de risco relativo elevado ou reduzido. Uma
maneira muito simples de estimar a superfı́cie do risco relativo de uma região geográfica, dada a suposição
de independência entre as áreas, é a Taxa de Mortalidade Padrão. Todavia, esse estimador possui grande
variabilidade, principalmente em sı́tios de pequenas populações e doenças raras. Uma solução para este
problema é o uso de modelos de suavização do risco relativo estimado. Nesse trabalho, será abordado um
método semiparamétrico que utiliza campos aleatórios markovianos ocultos. O modelo a priori assume
um modelo de mistura correlacionado espacialmente. O método usado para estimar os parâmetros é
baseado em algoritmos de Monte Carlo via Cadeias de Markov com saltos reversı́veis. A metodologia é
aplicada no mapeamento do risco de mortalidade por câncer de pulmão na região sul do Brasil.
Palavras-chave: Mapeamento de doença, Campos Aleatórios Markovianos Ocultos, Modelo de
Potts, MCMC de saltos reversı́veis, Modelos de Mistura, Semiparamétrico.
Agradecimentos: Os autores agradecem o apoio financeiro prestado pela FAPEMIG na realização
deste trabalho.
55
Aplicação do Algoritmo MCMC de Saltos Reversı́veis na
Identificação de Modelos ARMA
Márcia Helena Barbian
Universidade Federal de Minas Gerais
Alessandro José Queiroz Sarnaglia
Universidade Federal de Minas Gerais
Aline Martines Piroutek
Universidade Federal de Minas Gerais
Os modelos ARMA são extremamente conhecidos em análise de séries temporais e são comumente
utilizados para ajustar dados reais. Geralmente, em análise de séries temporais, a escolha do modelo
apropriado é feita através da otimização de funções, tais como os critérios AIC e BIC, ou da visualização
das funções de Autocorrelação (ACF) e Autocorrelação Parcial (PACF). Os critérios AIC e BIC são
funções que penalizam a variabilidade dos resı́duos e pela quantidade de parâmetros do modelo, enquanto
a visualização das funções ACF e PACF consiste em comparar seu comportamento com as respectivas
funções teóricas. Na abordagem bayesiana a incerteza sobre os diferentes modelos pode ser especificada
como um parâmetro a ser estimado, com probabilidades a posteriori associadas. O algoritmo MCMC
de saltos reversı́veis pode ser utilizado para a escolha da ordem de um processo ARMA apropriada para
um conjunto de dados. Este algoritmo é uma extensão do popular Metropolis-Hasting, com o objetivo
de permitir movimentos entre espaços de diferentes dimensões. Esse trabalho utiliza o algoritmo MCMC
de saltos reversı́veis para analisar um conjunto de dados reais.
Palavras-chave: Modelos ARMA, MCMC de saltos reversı́veis.
Agradecimentos: Os autores agradecem o apoio financeiro prestado pela FAPEMIG na realização
deste trabalho.
56
The Poisson-Exponential Model: A Bayesian Approach
Gladys Dorotea Cacsire Barriga
FEB-Universidade Estadual Paulista Júlio de Mesquita Filho
Vicente Garibay Cancho
ICMC-Universidade de São Paulo
Francisco Louzada-Neto
DEs-Universidade de São Carlos
In this paper we proposed a new two-parameter lifetime distribution with increasing failure rate. The
new distribution arises on a latent complementary risk problem base. The properties of the introduced
distribution are discussed, including a formal prove of its density function and an explicit algebraic
formulae for its survival and hazard functions, quantiles and moments, including the mean and variance.
Also, we have discussed inference aspects of the model proposed via Bayesian inference by using Markov
chain Monte Carlo simulation. The approximate Bayes estimators obtained under the assumptions of
non-informative priors. Further, some discussions on models selection criteria are given. The developed
procedures are illustrated on a real data set.
Keywords: Complementary Risks; Exponential Distribution; Poisson Distribution; Survival Analysis.
57
Decisões de Investimento e Restrição Financeira: Uma
Abordagem Bayesiana com Modelo Dinâmico Multinı́vel1
Camila Fernanda Bassetto
Escola de Engenharia de São Carlos - EESC/USP
Aquiles Elie Guimarães Kalatzis
Escola de Engenharia de São Carlos - EESC/USP
Este estudo analisa a presença de restrição financeira nas decisões de investimento de 562 firmas
brasileiras no perı́odo de 1997 - 2006, classificadas por porte e utilizando um modelo econométrico
bayesiano. A estimação dos parâmetros é realizada considerando um modelo Bayesiano Multinı́vel, permitindo modelar a estrutura dos erros referentes aos efeitos especı́fico da firma e temporal. Diferente da
maioria dos estudos com dados longitudinais, neste trabalho o valor inicial é tratado como aleatório, gerado por um processo estocástico iniciado em um passado infinito. Distribuições a priori foram assumidas
para os parâmetros, classificando o modelo em efeito fixo ou efeito aleatório. O critério da densidade
preditiva ordenada é utilizado para selecionar o modelo mais apropriado.
1 Pesquisa
financiada pela FAPESP - Fundação de Amparo à Pesquisa do Estado de São Paulo.
58
A New Regression Model for Proportions
Jorge Luis Bazán
Pontificia Universidad Católica del Perú
Cristian Bayes
Pontificia Universidad Católica del Perú
Catalina Garcı́a
Universidad de Granada
A new regression model is proposed for proportions by considering the beta rectangular distribution
recently published by Hann (2008). This new model includes the beta regression model, introduced
by Ferrari and Cribari (2004), as a particular case. A Bayesian inference approach is adopted using
a Markov Chain Monte Carlo (MCMC) algorithms. A simulation study is carried out to evaluate the
performance of the proposed algorithm in terms of parameter recovery. The developed model will be
illustrated using real data sets in a subsequent work.
59
Test for Symmetry in Contingency Tables: A FBST Approach
Gustavo G. Bernardo
IME - USP
Marcelo S. Lauretto
EACH - USP
Julio Michael Stern
IME - USP
The problem of symmetry hypothesis is fundamental in statistics analysis, where the researcher must
assess the existence of a certain symmetry condition. In several applications, the state of compliance,
normality or health is characterized by the existence of symmetries. In these situations, the lack of
symmetry is an indicator of non-compliance, abnormality or illness. The early detection of the lack of
symmetry can frequently allow the repair, maintenance or simplified treatment, thus avoiding much more
expensive and complex late procedures. This kind of early detection may be helpful in avoiding severe
consequences, e.g the breaking of an important part in a machine during its operation.
A broad and important subarea in Statistics consists in the symmetry tests in contingency tables,
and several methods have been devised for symmetry in contingency tables.
In this work we propose the Full Bayesian Significance Test (FBST) for the problems of symmetry
and point-symmetry in contingency tables. FBST is an intuitive Bayesian approach which does not
assign positive probabilities to zero measure sets when testing sharp hypotheses. Numerical experiments
comparing FBST performance to power-divergence statistics suggest that FBST is a good alternative for
problems concerning tests for symmetry in contingency tables.
60
Análise Bayesiana de Ensaios Fatoriais 2k Usando os Princı́pios
dos Efeitos Esparsos, da Hierarquia e da Hereditariedade
Guilherme Biz
ESALQ, USP
Silvio Sandoval Zocchi
ESALQ, USP
Roseli Aparecida Leandro
ESALQ - USP
No planejamento de experimentos para o ajuste de modelos polinomiais envolvendo k fatores principais e respectivas interações, é bastante comum a utilização dos fatoriais 2k , 3k ou frações dos mesmos.
Para as análises dos resultados desses experimentos, frequentemente se considera o princı́pio da hereditariedade, ou seja, uma vez constatada uma interação significativa entre fatores, os fatores que aparecem
nesta interação e respectivas interações devem também estar presentes no modelo. Neste trabalho, esse
princı́pio é incorporado diretamente à priori, para um método de seleção de variáveis Bayesiana, seguindo
as idéias propostas por Chipman, Hamada e Wu (1997), porém com uma alteração dos valores sugeridos
pelos autores para os hiperparâmetros. Essa alteração, proposta neste trabalho, promove uma melhoria
considerável na metodologia original.
61
Aplicações de Inferência Bayesiana Aproximada em Modelos
Gaussianos Latentes
Wagner Hugo Bonat
LEG/UFPR - Laboratório de Estatı́stica e Geoinformação
Paulo Justiniano Ribeiro Junior
LEG/UFPR - Laboratório de Estatı́stica e Geoinformação
A familia dos modelos gaussianos latentes é adaptável a uma grande quantidade de situações complexas. Destaca-se a situação de dados espaço-temporais que é possivelmente a mais complexa que os
atuais modelos estatı́sticos tratam. O objetivo deste trabalho foi revisar algumas possı́veis estratégias
de modelagem para dados deste tipo, inclusive tratando da situação de interação espaço-temporal. A inferência nesta classe de modelos é comumente realizada usando métodos computacionalmente intensivos,
tais como, os algoritmos MCMC Markov Chain Monte Carlo. Entretando em sua implementação tais
métodos não estão livres de problemas. Assim novos métodos para inferência nesta familia de modelos
têm sido propostos. Este trabalho revisou a abordagem ‘INLA’ (Integrated Nested Laplace Approximations) proposta por RUE, MARTINO e CHOPIN (2009), que se mostrou eficiente para ajustar modelos
altamente estruturados em diversas situações práticas. A nova metodologia de inferência foi aplicada a
três conjunto de dados. Sempre que possı́vel os modelos ajustados pelo INLA, foram confrontados com
ajustes de modelos aditivos generalizados para verificar a concordância entre as abordagens, principalmente no que diz respeito ao modo como captam os efeitos espaciais e temporais. Os conjuntos de dados
foram selecionados de modo a cobrir os modelos mais comumente usados na literatura. O primeiro conjunto referente a avaliações da qualidade da água, assume para a variável resposta a distribuição Normal.
O segundo conjunto referente a contagens de ovos do mosquito Aedes aegypti coletados em ovitrampas
em Recife/PE, assume para a variável resposta a distribuição Binomial Negativa. O terceiro conjunto
corresponde a dados sobre a doença leprose-dos-citrus, assumindo para a variável resposta (dicotômica)
a distribuição Binomial. Nos três conjuntos de dados analisados a concordância entre as abordagens
INLA e GAM foi diversificada. No primeiro conjunto os resultados foram bastante parecidos. Para o
segundo conjunto algumas diferenças importantes foram encontradas, covariáveis que pela abordagem
GAM eram indicadas como significativas, pela abordagem INLA foram indicadas como não significativas, porém os efeitos espaciais e temporais foram estimados de forma muito parecida. O último é
mais desafiador exemplo, mostrou uma grande diferença entre as abordagens na forma como captam os
efeitos espaciais e temporais, de forma geral a abordagem GAM tende a suavizar demais estes efeitos e
fornece intervalos de confiança pouco realı́sticos, ao passo que a abordagem INLA apresenta melhores
resultados e intervalos de credibilidade mais aceitáveis. Nos três exemplo, medidas de concordância entre
as observações e os modelos foram tomadas, foram elas: erro quadrático médio, erro absoluto médio,
correlação entre observados e preditos e nı́vel de cobertura. Por estas medidas em todos os exemplos
analisados a abordagem INLA apresentou melhores resultados que a abordagem GAM.
62
Robust Linear Mixed Models with Heterogeneity in the
Random-Effects Population
Celso Rômulo Barbosa Cabral
Departamento de Estatı́stica, Universidade Federal do Amazonas, Brazil
Vı́ctor Hugo Lachos
Departamento de Estatı́stica, Universidade Estatual de Campinas, Brazil
Maria Regina Madruga
Faculdade de Estatı́stica, Universidade Federal do Pará, Brazil
We present a new class of models to fit longitudinal data, obtained with a suitable modification of
the classical linear mixed-effects model, by supposing that, for each sample unit, the joint distribution
of the random effect and the random error is a finite mixture of scale mixtures of multivariate skewnormal distributions, allowing us to model the data in a more flexible way, taking into account skewness,
multimodality and discrepant observations at the same time. The scale mixtures of skew-normal form an
attractive class of asymmetric heavy-tailed distributions that includes the skew-normal, skew-Student-t,
skew-slash and the skew-contaminated normal distributions as special cases, being a flexible alternative
to the use of the corresponding symmetric distributions in this type of models. A simple MCMC Gibbstype algorithm for posterior Bayesian inference is employed. In order to illustrate the usefulness of the
proposed methodology, one artificial and one real data set – from the Framingham cholesterol study –
are analyzed.
Keywords: Bayesian estimation; Framingham cholesterol study; finite mixtures; linear mixed model;
MCMC; skew-normal distribution.
Acknowledgements: The authors acknowledge the partial financial support from FAPESP, CNPq
and CAPES.
63
Uma Abordagem Bayesiana do Modelo Mistura Padrão com
Fragilidade
Vinicius Fernando Calsavara
DES-Universidade Federal de São Carlos
Vera Lúcia Damasceno Tomazella
DES-Universidade Federal de São Carlos
José Carlos Fogo
DES-Universidade Federal de São Carlos
Neste trabalho apresentamos uma abordagem Bayesiana para o modelo de mistura padrão com fragilidade. Esse modelo possui a vantagem em relação aos modelos de sobrevivência usuais, no sentido de
incorporarem a heterogeneidade de duas subpopulações (susceptı́veis e imunes) ao evento de interesse.
Consideramos o modelo com um termo de fragilidade como uma alternativa para modelar dados de
sobrevivência. Nesse modelo, um efeito aleatório, denominado fragilidade, é introduzido na função de
risco com o objetivo de controlar a heterogeneidade não observável das unidades em estudo, inclusive a
dependência das unidades que partilham os mesmos fatores de risco. Sob uma abordagem Bayesiana,
estimamos os parâmetros utilizando o método MCMC. Comparamos os resultados com a curva de sobrevivência estimada via Kaplan-Meier.
64
Simulação Perfeita da Distribuição Normal Multivariada
Truncada
Thiago Feitosa Campos
IME-USP
Márcia D’Elia Branco
IME-USP
Neste trabalho apresentamos uma implementação do algoritmo CFTP, apresentado em Propp e Wilson, (1996),gerando amostras da distribuição normal bivariada truncada no quadrante positivo, alem
de comparar com amostras geradas pelo amostrador de Gibbs e pelo método de rejeição. Bem como
sugestões para a implementação do CFTP para gerar amostras da distribuição normal em dimensões
maiores que dois e a geração de amostras em conjuntos diferente do quadrante positivo.
Palavras-chave: CFTP, Distribuição Multivariada Truncada, Amostrador perfeito.
65
Accounting for Latent Spatio-Temporal Structure in Animal
Abundance Models
Estelina Serrano de Marins Capistrano
Instituto de Matemática - UFRJ
Marco A. Rodrı́guez
UQTR, Canada
Alexandra Mello Schmidt
Instituto de Matemática - UFRJ
Measurements of animal abundance often arise from complex field sampling designs and are influenced
by unobserved environmental variation. Our aim in this study was to understand the influence of a set
of environmental covariates on the abundance of yellow perch, Perca flavescens, the most abundant fish
species in Lake Saint Pierre, Quebec, Canada. Fish counts and measurements of four environmental
covariates were made at 160 locations equally distributed between the north and south shores of the
lake and approximately parallel to the shorelines. On 38 sampling dates, measurements were made at
each location from a cluster of four or eight spatially adjacent locations. Sampling dates were unevenly
spaced in time over a period of 70 days, and the north and south shores were visited in alternation on
consecutive sampling dates. This sampling design yielded measurements that were clustered both in
space and in time. We use latent (random) effects to account for unobserved environmental variation
and reflect the structure of the sampling design. Let Y (stj ) represent fish counts observed at location
stj and time t, such that t = 1, · · · , T , j = 1, · · · , nt , and n = n1 + · · · , nT . We assume that Y (stj ) is a
realization from a Poisson-lognormal mixture whose mean is a function of environmental covariates and
whose mixing component, on the log scale, is a sum of spatially structured and temporally correlated
latent effects. We consider models having different structures for these latent effects and allowing for
directional spatial correlation and temporal correlation in continuous time. We compare models using
DIC and the Gelfand and Ghosh criterion.
66
Bayesian Dynamic Modelling of Biomass Burning Adverse
Effects on Daily Demand of Children’s Hospital Admissions in
a Southwestern Region of Brazilian Amazon
Cleber Nascimento do Carmo
ENSP/ FIOCRUZ, IM/UFRJ
Mariane Branco Alves
IME/UERJ
Sandra de Souza Hacon
ENSP/FIOCRUZ
Fire in the Brazilian Amazon is an important tool for clearing of forested land and maintenance of
cleared areas used for agricultural production. However, recent extreme drought conditions Brazil experienced during the 2004-2005 dry season have contributed to escaped fires with a considerable increase of
particulate matter loading, endangering human health. The aim of this study is to estimate the effects
of biomass burning exposure on children’s health in the municipality of Rio Branco, southwestern region of Brazilian Amazon. In this work, Poisson dynamic regressions, belonging to the class of dynamic
generalized models, were considered to analyze the lagged and cumulative impact of particulate matter
exposure on daily demand of children’s hospital admissions due to respiratory causes, from January 2004
to December 2005, by means of transfer functions with time-varying coefficients. The transfer function
specification is compared to polynomial distributed lag models, a usual approach to deal with the lagged
effect of pollutants over epidemiological outcomes.
Keywords: dynamic generalized models, transfer functions, environmental epidemiology.
67
Uma Abordagem Bayesiana para Processos de Poisson
GARMA
Marcos Henrique Cascone
DEs - UFSCar
Adriana Strieder Philippsen
SME-ICMC-USP
Marinho G. Andrade
SME-ICMC-USP
Ricardo S. Ehlers
SME-ICMC-USP
Neste trabalho, será apresentada uma abordagem bayesiana para o processo Poisson GARMA, que se
trata de uma extensão dos Modelos Lineares Generalizados para séries temporais, bastante utilizado para
dados de contagem. Para esta análise, serão considerados dois tipos de dados: um conjunto de dados
simulados, com intuito de mostrar a viabilidade da metodologia bayesiana proposta e uma aplicação
com dados reais, composto pelo número total de notificações de casos de dengue na Paraı́ba no perı́odo
de Janeiro de 1998 a dezembro de 2005, para obter uma comparação entre as metodologias Clássica
e Bayesiana. Na abordagem Bayesiana, serão utilizadas distribuições a priori conjugadas na famı́lia
exponencial para os parâmetros a serem estimados. Como resultado final das análises, será apresentado
um resumo descritivo das distribuições marginais a posteriori dos parâmetros de interesse, bem como os
valores das médias e seus gráficos. As amostras da distribuição a posteriori serão geradas fazendo uso
das técnicas de simulação MCMC, em particular, o algoritmo de Metropolis-Hastings.
68
Aplicação e Validação do Método de Agrupamento Hierárquico
Bayesiano
Juliana Garcia Cespedes
Carlos H. Silveira
Isabela N. Drummond
Adriana P. Mattedi
Depto de Matemática e Computação - UNIFEI
Valdetti M. G. Almeida
Marcelo M. Santoro
Depto de Bioquı́mica-Imunologia - UFMG
Wagner Meira Junior
Depto de Ciência da Computação - UFMG
Agrupamento de dados reúne técnicas usadas basicamente para encontrar grupos em um conjunto
de dados que compartilham certas caracterı́sticas em comum, formando aglomerados de entidades mais
homogêneos. Pode-se estabelecer previamente o número de grupos a ser formado, ou então permitir
ao algoritmo de agrupamento uma livre associação de unidades, de forma que a quantidade de grupos
resultante seja conhecida somente ao final do processo. Existe uma grande quantidade de métodos de
agrupamento probabilı́sticos encontrados na literatura, entre eles o método de agrupamento hierárquico
Bayesiano, que basicamente ordena os dados numa hierarquia de grupos, procurando a maximização da
probabilidade a posteriori de cada agrupamento, levando em consideração o conhecimento a priori do
número e/ou algumas caracterı́sticas gerais das classes que podem facilitar a categorização dos dados.
A forma de combinar o conhecimento a priori com a informação contida nos dados dá-se através
da utilização da inferência Bayesiana. A proposta deste trabalho é avaliar o método de agrupamento
hierárquico Bayesiano para agrupar um conjunto de proteı́nas complexadas com ligantes proteicos, divididos em 3 classes: subtilases conjugadas a inibidores proteicos; serino-proteases-não-subtilases conjugadas
a inibidores proteicos; e outros complexos proteı́nas-ligantes, envolvendo não serino-proteases, como metaloproteases, transferases, imunoglobulinas etc. Trata-se de uma base de dados que foi cuidadosamente
anotada e classificada por humanos, constituindo-se numa massa de dados ideal para a validação de
métodos de classificação e agrupamento. Porém, ela apresenta alguns desafios intrı́nsecos. É sabido
que, em algumas subtilases e serino-proteases-não-subtilases, pode ocorrer inibição cruzada, indicando
que essas diferentes proteases compartilham algumas caracterı́sticas fı́sico-quı́micas comuns em suas interfaces com ligantes. Os resultados aqui reportados mostram que essas propriedades da interface têm
poder discriminatório entre as proteases, de forma que os agrupamentos tendem a aglutinar instâncias de
uma mesma classe. No entanto, algumas instâncias de serino-proteases-não-subtilases foram agregadas
ao agrupamento das subtilases, sugerindo compartilhamento de propriedades comuns, conforme requer
a inibição cruzada. Logo, conclui-se preliminarmente que o agrupamento hierárquico Bayesiano passou
pelo crivo da validação semântica, sendo capaz de gerar resultados coerentes e sugestivos na análise
comparativa de complexos proteicos.
69
A Bayesian Analysis for the Generalized Negative Binomial
Weibull Cure Fraction Survival Model: Estimating the Lymph
Nodes Metastasis Rates
Juliana Cobre
CER-DEs-UFSCar
Francisco Louzada-Neto
CER-DEs-UFSCar
Gleici S. C. Perdoná
DMS-FMRP-USP
In this paper we proposed a survival model that accommodates survival data in the presence of latent
competing causes assuming that the number of competing causes follows a generalized negative binomial
distribution and that the lifetimes follow a Weibull distribution. In oncology studies, the advantage of our
proposed model was to obtain the estimative of the metastasis rates as the effectiveness of the treatment
and the proliferation rate of the lymph nodes. Another benefit of this assumption is to incorporating
into the analysis characteristics of the treatment, such as the number of doses, the time interval between
doses and the efficiency of each dose. We approached the model via Bayesian inference using Markov
chain Monte Carlo simulation. A simulation study investigates the frequentist properties of the proposed
estimators obtained under the assumptions of non-informative priors. We illustrate the usefulness of our
model by applying it to real data on breast cancer.
70
Modelos Série de Potência Zero-Modificados: Uma Abordagem
Bayesiana
Katiane Silva Conceição
Departamento de Estatı́stica,
Universidade Federal de São Carlos
Marinho G. Andrade
Departamento de Matemática Aplicada e Estatı́stica,
Instituto de Ciências Matemáticas e de Computação,
Universidade de São Paulo
Francisco Louzada-Neto
Departamento de Estatı́stica,
Universidade Federal de São Carlos
A análise de dados de contagem ocupam um importante lugar na estatı́stica aplicada uma vez que
muitos fenômenos ocorridos na natureza são expressos como tais dados. Entretanto, cautela na suposição da distribuição de probabilidade que rege o fenômeno aleatório é necessária pois, muitas vezes a
discrepância de interesse é a classe de contagem de zeros.
O objetivo principal deste trabalho é apresentar uma modificação dos modelos de regressão na famı́lia
Série de Potência de forma a acomodar dados inflacionados, deflacionados ou com ausência de zeros,
dando origem aos modelos da famı́lia Série de Potência Zero-Modificado.
O modelo proposto foi testado em um conjunto de dados simulados, cujos resultados foram bastantes
satisfatórios, com um esforço computacional razoavelmente pequeno.
O modelo de Poisson Zero-Modificado foi utilizado para a análise de um conjunto de dados reais,
referentes as notificações de AIDS de 414 municı́pios do Estado da Bahia em 2004. Como variável
explicativa foi utilizado o IDH de cada municı́pio.
A metodologia proposta apresenta-se como uma ferramenta bastante flexı́vel para análise de dados
de contagem na presença de covariáveis sem exigir qualquer preocupação prévia com relação a inflação
ou deflação de zeros na amostra.
71
Comparação de um Modelo Dinâmico e um Determinı́stico na
Predição da Vazão de uma Bacia
Josiane da Silva Cordeiro
Departamento de Métodos Estatı́sticos - IM - UFRJ
Alexandra Mello Schmidt
Departamento de Métodos Estatı́sticos - IM - UFRJ
Helio dos Santos Migon
Departamento de Métodos Estatı́sticos - IM/COPPE - UFRJ
Dirceu S. Reis Jr.
Departamento de Recursos Hı́dricos - FUNCEME
Em hidrologia, há um grande interesse em prever nı́veis futuros da vazão de uma bacia hidrográfica,
ou de um rio. Neste trabalho, compararemos a previsão da vazão de uma bacia hidrográfica através de
dois modelos distintos. O primeiro é baseado na adição de erros aleatórios à solução de um modelo determinı́stico conhecido por Soil Moisture Accounting Procedure (SMAP). Desta forma, a incerteza inerente
ao procedimento de estimação e a informação observada é naturalmente descrita. O segundo modelo assume que a vazão observada é a realização de um modelo de mistura entre uma função de probabilidade
com massa no zero e uma outra função de densidade de probabilidade estritamente positiva. A média
da parte positiva é modelada por uma estrutura hierárquica dinâmica com uma função de transferência
estocástica. Em ambos os modelos o procedimento de inferência é feito seguindo o paradigma bayesiano.
Devido a distribuição a posteriori dos parâmetros de interesse não ter forma fechada, utilizamos métodos
de amostragem eficientes. A comparação dos modelos é feita usando o critério de verossimilhança preditiva.
72
Imputação de Observações Faltantes em Dados de Área
Ana Carolina Carioca da Costa
Universidade Federal do Rio de Janeiro
Renata Souza Bueno
Universidade Federal do Rio de Janeiro
Alexandra Mello Schmidt
Universidade Federal do Rio de Janeiro
A análise da variação geográfica de eventos relacionados à saúde é útil na formulação e va-lidação de
hipóteses etiológicas. Uma ferramenta utilizada para tal análise é o mapeamento de doenças, que visa
elucidar a distribuição geográfica de ı́ndices subjacentes e identificar áreas com altos ou baixos ı́ndices.
Quando a doença é não-contagiosa, os dados referentes ao número de casos em cada área são assumidos
independentes e seguem uma distribuição Poisson. Para contornar o problema de sobredispersão e
considerar padrões espaciais, uma componente representando o efeito espacial é adicionada à média da
distribuição. A região de estudo é dividida em subregiões e cada observação representa o total de casos
na subregião. O que acontece na prática é que existem locais onde os dados não foram observados, sendo
assim considerados faltantes. Para mapear uma determinada doença é de extrema importância inferir
tais dados. Este trabalho propõe um exercı́cio de simulação e quatro modelos para o mapeamento de
doenças. A inferência é feita sob o enfoque bayesiano e o objetivo é verificar se o uso de diferentes prioris
para a matriz de covariâncias da componente espacial do modelo altera a previsão dos valores faltantes.
73
Estimando Variações de Temperatura no Estado do Rio de
Janeiro − Brasil, Utilizando Modelos Não-estacionários
Geraldo Marcelo da Cunha
Fundação Oswaldo Cruz, Brasil
Dani Gamerman
Universidade Federal do Rio de Janeiro, Brasil
Montserrat Fuentes
North Carolina State University, USA
Este trabalho analisa as variações da temperatura mı́nima média mensal no estado do Rio de Janeiro
de 1961 a 2000. Partido de uma abordagem hierárquica bayesiana os dados são modelados como uma
média dependente de covariáveis explicativas mais a realização de um processo espacial não-estacionário.
Além disso, um conjunto de coeficientes espacialmente estruturados servem para avaliar a tendência linear
em cada localização e fornecer a tendência global para toda região. Uma nova proposta para o processo
não-estacionário baseada na mistura de processos estacionários latentes é examinada e comparada a
modelos conhecidos da literatura. Esta nova abordagem possui a vantagem de estabelecer a partir dos
dados o número de misturas a serem consideradas na especificação do processo espacial não-estacionário.
74
A Dynamic Approach for the Piecewise Exponential Model
with Random Time Grid
Fábio Nogueira Demarqui
Universidade Federal de Minas Gerais
Rosangela H. Loschi
Universidade Federal de Minas Gerais
Dipak K. Dey
University of Connecticut
Enrico A. Colosimo
Universidade Federal de Minas Gerais
A novel fully Bayesian approach for modeling survival data with explanatory variables using the
Piecewise Exponential Model (PEM) with random time grid is proposed. We consider a class of correlated
Gamma prior distributions for the failure rates. Such prior specification is obtained via the dynamic
generalized modeling approach jointly with a random time grid for the PEM. A product distribution is
considered for modeling the prior uncertainty about the random time grid, turning possible the use of
the structure of the Product Partition Model (PPM) to handle the problem. A unifying notation for
the construction of the likelihood function of the PEM, suitable for both static and dynamic modeling
approaches, is considered. Procedures to evaluate the performance of the proposed model are presented.
The use of the new methodology is exemplified by the analysis of a real data set of survival times of
patients with brain cancer obtained from SEER (Surveillance Epidemiology and End Results) database.
For comparison purposes, the data set is also fitted using the dynamic model with fixed time grid
established in the literature. The results obtained show the superiority of the proposed model. Finally,
the authors would like to thank FAPEMIG for supporting this work.
75
A Bayesian Approach to Multivariate H-spline Nonparametric
Regression
Ronaldo Dias
UNICAMP - Universidade de Campinas
Dani Gamerman
UFRJ - Universidade Federal do Rio de Janeiro
A Bayesian approach is considered to estimate the number of basis functions and the smoothing
parameters of the Multivariate hybrid splines non-parametric regression procedure. The method used to
obtain the estimate of the regression surface is based on the reversible jump MCMC Green(1995) and
on the methodology developed by Dias and Gamerman(2002).
76
Modelo de Regressão Exponencial: Estimação Bayesiana
Objetiva
Teresa Cristina Martins Dias
DEs/UFSCar
Vera Lucia D. Tomazella
DEs/UFSCar
Neste trabalho estamos interessados em comparar os resultados obtidos quando utilizando a priori
de Jeffreys (1961) e a priori de referência, introduzida por Bernardo (1979) em modelos de regressão.
A teoria para dados de sobrevivência tem sido bastante desenvolvida com o objetivo de estudar a
função de risco/confiabilidade de um paciente ou sistema. Esta metodologia permite determinar quais
variáveis afetam a forma da função de risco e obter estimativas desta função para cada unidade (indivı́duo). Os modelos de regressão utilizados nesta área de análise se sobrevivência, descrevem a relação
entre o tempo de sobrevivência e algumas variáveis explicativas de interesse. Muitas técnicas podem ser
aplicadas para a análise de dados desta natureza.
A teoria de informação estatı́stica é usada para definir a priori de referência como uma função
matemática que descreve a situação onde os dados dominam melhor o conhecimento a priori sobre a
quantidade de interesse. Na abordagem de Berger-Bernardo, uma caracterı́stica importante na construção de uma priori não-informativa é o tratamento diferenciado para os parâmetros de interesse e os
parâmetros perturbadores.
Sob o paradigma Bayesiano, o resultado de qualquer problema de inferência combina a informação
fornecida pelos dados com a relevante informação a priori avaliada. Em muitas situações, esta informação
é vaga ou subjetiva para tomar decisões. É importante identificar uma forma matemática de uma
priori não informativa que tenha efeito mı́nimo na distribuição a posteriori (Jeffreys (1961), Tibshirani
(1989), Bernardo (1979)). Mais especificamente queremos estimar os parâmetros envolvidos na função
de sobrevivência do modelo de regressão exponencial. A metodologia é ilustrada com um conjunto de
dados reais.
Palavras-Chave: análise de sobrevivência, modelo de regressão, análise de referência Bayesiana,
priori de referência.
77
Bayesian Inference for Gamma Modulated Model
Marı́a Soledad Torres Dı́az
Departamento de Estadı́stica and CIMFAV, Facultad de Ciencias,
Universidad de Valparaı́so
Francisco Torres
Departamento de Matemática y Ciencia de la Computación Universidad de
Santiago de Chile
In this work we propose an infinitely divisible diffusion process for modelling option pricing, such that
the price of the underlying asset can be split in two parts, a continuous part driven by Brownian motion,
and a jump part driven by an independent Gamma process. We consider three different processes, whose
parameters are estimated by Bayesian methods.
78
Estudos Comparativos Envolvendo Classificação Bayesiana em
Dados Proteicos
Isabela Neves Drummond
Juliana Garcia Cespedes
Carlos H. Silveira
Adriana P. Mattedi
Depto de Matemática e Computação - UNIFEI
Valdetti M. G. Almeida
Marcelo M. Santoro
Depto de Bioquı́mica-Imunologia - UFMG
Wagner Meira Junior
Depto de Ciência da Computação - UFMG
Reconhecimento de padrões é a área de pesquisa que tem por objetivo a classificação de objetos
(padrões) em um número de categorias ou classes. As técnicas de reconhecimento de padrões podem ser
aplicadas em bioinformática, análise de seqüências de proteı́nas ou DNA, mineração de dados (data mining), classificação de documentos, análise de imagens etc. Basicamente, um processo de reconhecimento
estatı́stico de padrões é composto por 3 etapas: pré-processamento, para eliminar ruı́dos ou distorções;
extração de caracterı́sticas, que cria um vetor de caracterı́sticas com dados extraı́dos dos objetos adquiridos; e um classificador, que analisa um padrão obtido e toma uma certa decisão. O classificador toma
decisões baseando-se no aprendizado obtido a partir de um conjunto de treinamento, o qual contém exemplos de padrões de todas as classes existentes no sistema. Existes muitos tipos de classificadores que
utilizam a inferência Bayesiana, entre eles o classificador de Bayes (Naive Bayes) e as Redes Bayesianas.
Neste trabalho pretende-se comparar a classificação obtida pelos dois métodos utilizando um conjunto de
dados de proteı́nas complexadas com ligantes proteicos, divididos em 3 classes: subtilases conjugadas a
inibidores proteicos; serino-proteases-não-subtilases conjugadas a inibidores proteicos; e outros complexos
proteı́nas-ligantes, envolvendo não serino-proteases, como metaloproteases, transferases, imunoglobulinas etc. Trata-se de uma base de dados que foi cuidadosamente anotada e classificada por humanos,
constituindo-se numa massa de dados ideal para a validação de métodos de classificação e agrupamento.
Os resultados aqui reportados mostram que os classificadores Bayesianos utilizados tiveram um desempenho aquém das expectativas da validação semântica. Não só geraram estatı́sticas de acerto inferiores
aos obtidos com o método de agrupamento hierárquico Bayesiano, aplicados à mesma base, como também
permitiram movimentações de instâncias entre as classes não de todo coerentes com o esperado do ponto
de vista do atual entendimento bioquı́mico do fenômeno da complexão entre proteases e seus inibidores.
A limitação pode estar não nos métodos em si, mas em suas implementações e parametrizações. Um
estudo mais aprofundado está em andamento, no sentido de verificar essa hipótese.
79
Computational Tools for Comparing Asymmetric GARCH
Models via Bayes Factors
Ricardo Sandes Ehlers
ICMC-USP
In this paper we use Markov chain Monte Carlo (MCMC) methods in order to estimate and compare
GARCH models from a Bayesian perspective. We allow for possibly heavy tailed and asymmetric distributions in the error term. We use a general method proposed in the literature to introduce skewness
into a continuous unimodal and symmetric distribution. For each model we compute an approximation
to the marginal likelihood, based on the MCMC output. From these approximations we compute Bayes
Factors and posterior model probabilities.
Keywords: GARCH, Markov chain Monte Carlo, Metropolis-Hastings, marginal likelihood.
80
Latent Residual Analysis in Binary Regression with
Skewed Link
Rafael Braz Azevedo Farias
University of Sao Paulo
Márcia D. Branco
University of Sao Paulo
Dipak K. Dey
University of Connecticut
Diagnostic techniques are indispensable tools to check goodness of the fitted models. In particular,
residuals are used to check whether or not the model assumptions are hold by the data. Moreover,
residuals are also useful to help in outlier detection, which can provide disproportional interference in
inferential results. In this work we describe some types of residuals used in the Bayesian binary regression
model framework. Among them, we present latent residuals obtained through scale mixture of normals,
which include probit Student-t and logistic models. We develop and implement residuals analysis for
binary response data for the probit, logistic, skew-probit and GEV models. For a simulated data set we
detect the presence of outliers using residuals proposed here for the different models.
81
Modelo Partição Produto com “Clusters” Correlacionados
Jacqueline Alves Ferrreia
Programa de Pós-Graduação - UFMG
Rosangela Helena Loschi
Departamento de Estatı́stica, ICEx-UFMG
Marcelo Azevedo
Departamento de Estatı́stica, ICEx-UFMG
Identificar pontos de mudança é extremamente útil em diversas áreas de conhecimento, como por
exemplo, economia, meteorologia, hidrologia, medicina entre outras. Neste trabalho, esse problema será
tratado do ponto de vista bayesiano, através de uma extensão do modelo partição produto. Apesar
da metodologia de identificação de pontos de mudança ser amplamente utilizada na análise de dados
sequenciais, em geral, é feita a suposição de que as médias entre blocos são independentes. Neste
contexto, esse trabalho propõe um modelo baseado na idéia de processos de Markov, que considera
a correlação entre as médias dos clusters. A metodologia proposta é avaliada no contexto em que a
sequência de dados possui distribuição Normal. A proposta deste estudo é comparada com o modelo
partição produto, muito usual na literatura, através de ensaios de Monte Carlo.
82
Bayesian Measures of Model Complexity and Fit in
Asymmetrical Scenarios
Cléber da Costa Figueiredo
ESPM-SP/EESP-FGV
Mônica Carneiro Sandoval
University of São Paulo
Heleno Bolfarine
University of São Paulo
With the enthusiasm brought from the last years in finding better fits for asymmetrical data set,
we present Bayesian approaches for measuring the model complexity and fit in asymmetrical scenarios.
Model fitting is implemented by proposing the asymmetric deviance information criterion, ADIC, a
modification of the ordinary DIC, and the Evidence Deviance Information Criterium, EDIC, another
modification. For selling our proposal, we made an extension of a study of Figueiredo et al. (2008)
that utilized the asymmetrical methodology, but did not extend it for a very large class of asymmetrical
distributions. As well, we need to utilize a numerical optimization for measure the complexity and the
fit of the model, since we are using not symmetrical approaches for doing it. Whatever similarity (in the
title of this paper) with the Spiegelhalter et al. (2002) work is not a mere coincidence.
83
BIC Criterion for Minimal Markov Models
Jesús Enrique Garcı́a
Departamento de Estatı́stica - Intituto de Matemática Estatı́stica e
Computação Cientı́fica - Universidade Estadual de Campinas
Verónica Andrea González-López
Departamento de Estatı́stica - Intituto de Matemática Estatı́stica e
Computação Cientı́fica - Universidade Estadual de Campinas
In this work we address the model selection problem of finding the Markov model with the minimal
set of parameters necessary to represent a source as a Markov chain of finite order and we show that the
model can be selected consistently using the Bayesian information criterion (BIC).
84
Interação Social na Criminalidade da Região Metropolitana de
São Paulo: Um Modelo Espaço-Temporal Bayesiano
Marcelo Gazzano
Sul América Investimentos
Flávio Augusto Ziegelmann
Universidade Federal do Rio Grande do Sul
Patrı́cia Klarmann Ziegelmann
Universidade Federal do Rio Grande do Sul
Neste trabalho utiliza-se um modelo espaço-temporal estudado em Rojas (2004), a saber, o modelo
polinomial de 1a ordem (com pequenas alterações em distribuições propostas no processo de estimação
via Metrópolis-Hasting), para medir a interação social da criminalidade na região metropolitana de São
Paulo. Simulações de Monte Carlo são realizadas para avaliar a capacidade de estimação do modelo em
dois diferentes cenários (poucas e muitas observações no tempo). Quanto aos resultados empı́ricos para
os dados reais, estes indicam que a região metropolitana de São Paulo é um hot spot no estado, pois é
encontrado um maior grau de interação social no ı́ndice de homicı́dio em relação aos ı́ndices de roubo e
furto.
85
Estimadores Lineares Bayesianos em Amostragem de
População Finita
Kelly Cristina Mota Gonçalves
Universidade Federal do Rio de Janeiro
Fernando Antônio da Silva Moura
Universidade Federal do Rio de Janeiro
Helio dos Santos Migon
Universidade Federal do Rio de Janeiro
Na teoria de amostragem de população finita, baseada na aleatorização induzida pelo plano amostral,
o objetivo principal é produzir estimativas pontuais das quantidades de interesse e suas respectivas
variâncias. Esta metodologia não tem se mostrada adequada para tratar algumas situações práticas e
para estas a utilização de modelos de superpopulação tem sido inevitável. Neste caso há também a
possibilidade de se empregar a inferência Bayesiana, com o objetivo de incluir informações a priori sobre
os hiperparâmetros do modelo de superpopulação proposto.
Sem a necessidade de uma eliciação completa da distribuição a priori, a inferência Bayesiana baseada
no método linear de Bayes trata-se de um procedimento alternativo a aleatorização. Esta modelagem
enfraquece ao máximo as hipóteses do desenho amostral caracterizando-o somente com hipóteses sobre o
primeiro e segundo momentos. É uma modelagem robusta, no sentido que está a meio caminho entre duas
ideias extremas: de um lado os procedimentos de aleatorização e de outro modelos de superpopulação.
Neste sentido, está a importância de hipóteses de permutabilidade, e em particular permutabilidade de
segunda ordem, caracterizada como conhecimento a priori acerca de estruturas eficientes na população.
Estes modelos robustos têm, portanto, estruturas flexı́veis, que permitem assumir dependência entre
indı́viduos, estratos, conglomerados, entre outros.
Este trabalho trata de extensões de inferência Bayesiana, baseadas no método linear de Bayes, no
contexto de estimação em população finita. O método será aplicado a um modelo de regressão simples
geral e serão descritos casos particulares que resultam em estimadores para alguns planos amostrais frequentes, além de estimadores do tipo razão e regressão e para dados categóricos. Em seguida, partiremos
para modelos mais estruturados na famı́lia exponencial comparando as predições que são obtidas quando
se usa inferência Bayesiana, baseada no método linear de Bayes, e inferência clássica. Finalmente, estes
modelos serão utilizados em uma aplicação a dados de pequenas áreas.
86
A Bayesian Test for the Intraclass Correlation Coefficient
Verónica Andrea González-López
Departamento de Estatı́stica, Universidade Estadual de Campinas
Julio da Motta Singer
Departamento de Estatı́stica, Universidade de São Paulo
Nelson I. Tanaka
Departamento de Estatı́stica, Universidade de São Paulo
Antonio C. Pedroso-de-Lima
Departamento de Estatı́stica, Universidade de São Paulo
This work is a guide to decide whether taking measures in triplicate (or more generally in m-plicate)
may reduce the length of confidence intervals in experimental settings where only small pilot studies are
available. The decision is made through a test of the hypothesis that the intraclass correlation coefficient
is less than a specified constant. By the scenario presented the Bayesian approach is the natural one.
We illustrate the procedure with an example from the food industry.
Este trabalho é um guia para decidir quando coletar medições em triplicata (ou generalizando, em
m-plicata) pode reduzir o tamanho de intervalos de confiança em configurações experimentais nas quais
apenas pequenas amostras piloto são disponibilizadas. A decião é tomada mediante um teste de hipótese
que testa se o coeficiente de correlação intra-classe é menor o igual que uma constante previamente
especificada. Nesta situação, a abordagem Bayesiana é a natural. Ilustramos o procedimento mediante
um exemplo da industria de alimentos.
87
Modelos de Volatilidade Estocástica com Distribuições de
Caudas Pesadas
Ivan Robert Enrı́quez Guzmán
Departamento de Estatı́stica - Instituto de Matemática e Estatı́stica Universidade de São Paulo
Pedro Alberto Morettin
Departamento de Estatı́stica - Instituto de Matemática e Estatı́stica Universidade de São Paulo
Este é um estudo preliminar de pesquisa em modelos de Volatilidade Estocástica usando a classe
de mistura de escala normal simétrica, que permite a incorporação no modelo de erros com caudas
mais pesadas que a distribuição Normal. Esta tentativa já foi estudada anteriormente por diferentes
pesquisadores, sobretudo o modelo com erro t-Student. Inicialmente a idéia da pesquisa é tratar de dar
alternativa de modelagem ‘a caracterı́stica assimétrica e leptocurtica que apresentam as séries financeiras
e de volatilidade estocástica. Intuitivamente, a idéia é incorporar erros que permitam considerar pontos
mais extremos que permite a Normal por meio de distribuições que apresentam caudas mais pesadas.
Em particular, utilizamos as distribuições normal assimétrica (NS) ou T assimétrica (TS), a normal independente e distribuições de mistura na escala de normais (MEN),dentro da famı́lia dos modelos elı́pticos.
Iniciamos com o estudo dos modelos clássicos de volatilidade estocástica (VE), isto é com erro gaussiano,
depois consideramos os modelos de volatilidade com mistura na escala de normais, incorporando o erro
deste tipo só na série dos log retornos, e depois em ambas as séries de retornos e estados. Foram feitas
aplicações com a série S&P 500, encontrando que o modelo VE-Slash foi o mais adequado. Além, disso,
desenvolvemos aqueles modelos de volatilidade estocástica de mistura na escala de normais (VE-MEN)
considerando erros de tipo MEN tanto na série como nos estados e no final estes modelos podem ser
markovianos, não necessariamente gaussianos. Incorporamos uma correlação entre os erros com a finalidade de avaliar o efeito de alavancagem. Palavras chaves: Volatilidade Estocástica , Misturas na Escala
de Distribuições Normais , Markov Chain Monte Carlo , modelos de espaços de estados não lineares.
88
Testing the Deviance of Homogeneity in Poisson Distributions:
A FBST Approach
Paulo C. Hubert Jr.
COPPE - UFRJ
Marcelo de Souza Lauretto
EACH - USP
Julio M. Stern
IME - USP
The Generalized Poisson Distribution (GPD) adds an extra parameter to the usual Poisson distribution. This parameter induces a loss of homogeneity in the stochastic processes modeled by the
distribution. Thus, the generalized distribution becomes an useful model for counting processes where
the occurrence of events is not homogeneous.
This model creates the need for an inferential procedure, to test for the value of this extra parameter.
The FBST (Full Bayesian Significance Test) is a Bayesian hypotheses test procedure, capable of
providing an evidence measure on sharp hypotheses (where the dimension of the parametric space under
the null hypotheses is smaller than that of the full parametric space).
The goal of this work is study the empirical properties of the FBST for testing the nullity of extra
parameter of the generalized Poisson distribution.
Numerical experiments show a better performance of FBST with respect to the classical likelihood
ratio test, and suggest that FBST is an efficient and robust tool for this application.
89
Processo de Difusão Multivariado com Estrutura Espacial:
Modelagem e Inferência
Vinicius Pinheiro Israel
Departamento de Métodos Estatı́sticos - Instituto de Matemática Universidade Federal do Rio de Janeiro
Helio dos Santos Migon
Departamento de Métodos Estatı́sticos - Instituto de Matemática Universidade Federal do Rio de Janeiro
Neste trabalho formula-se um modelo espaço-temporal cuja evolução no tempo é descrita por processos de difusão multivariados e as coordenadas do processo estão indexadas pelos locais de observação.
Problemas desse tipo, na prática, partem de observações em perı́odos de tempo discreto enquanto o modelo é contı́nuo. Técnicas de inferência, baseadas na função de verossimilhança, partindo da discretização
do processo contı́nuo e trabalhando com funções de transição são apresentados. Além disso, utilizam-se
técnicas de aumento de dados para reduzir o viés de discretização.
A contribuição principal deste trabalho é desenvolver processos de difusão espaciais e fornecer técnicas
de estimação para os parâmetros desses processos. O processo de difusão multivariado com estrutura
espacial aqui apresentado é aquele cuja função de volatilidade é influenciada pelas localizações.
Aplicações com dados simulados são apresentadas. A inferência segue o enfoque bayesiano partindo
de técnicas de MCMC tanto para estimação dos parâmetros quanto para o aumento de dados.
90
Nested Hypotheses: An Example in Genetics
Rafael Izbicki
Department of Statistics, University of São Paulo
Victor Fossaluza
Department of Statistics, University of São Paulo
Eduardo Yoshio Nakano
Department of Statistics, University of Brası́lia
Carlos Alberto de Bragança Pereira
Department of Statistics, University of São Paulo
When comparing two groups with respect to a specific locus, one is usually interested in testing
different hypotheses concerning its genotypic distribution. In this work, we are especially interested in
two hypotheses. The first concerns homogeneity of genotypic frequencies and the second one homogeneity
of allelic frequencies. Recently, it has been shown that the usual test for allelic homogeneity is valid if,
and only if, Hardy-Weinberg equilibrium holds. Alternative methods not restricted to equilibrium have
also been proposed. A different approach (frequentist) to test allelic homogeneity is proposed here. We
then evaluate the lack of coherence between allelic and genotypic homogeneity tests which arises from the
fact that they refere to nested hypotheses. Finally, we advocate the use of a Full Bayesian Significance
Test, namely FBST, in which this incoherence does not hold.
91
Generalized Latent Factor Models for Yield Curves in Multiple
Markets
Márcio Poletti Laurini
Insper Institute and IMECC-Unicamp
Luiz Koodi Hotta
IMECC-Unicamp
In this article we propose latent factors models to model simultaneously yield curves in multiple markets, generalizing several models found in the literature on the estimation of term structure of interest
rates. The proposed models do not use some of usual restrictions adopted for estimation and identification, thus enabling us to use more flexible structures incorporating additional latent factors, stochastic
volatility and the imposition of no-arbitrage consistency. The elimination of these restrictions is made
possible through the Bayesian estimation methodology using the Markov Chain Monte Carlo (MCMC).
This methodology makes it possible to obtain exact confidence intervals for the parameters, latent factors
and forecasts, and also to address identification and dimensionality problems in the estimation of multimarket models. The models are applied to model jointly “Cupom Cambial” (USD interest rate in Brazil)
and Eurodollar curves, carrying out an extensive procedure of model comparison and demonstrating the
forecast and practical potential of the proposed models.
92
Bayesian Inference for the Theta-Logistic Population Growth
Model
Selene Loibel
Departamento de Estatı́stica , Matemática Aplicada e Computação,
Instituto de Geociências e Ciências Exatas,
Universidade Estadual Paulista Julio de Mesquita Filho
Marinho G. Andrade
Departamento de Matemática Aplicada e Estatı́stica,
Instituto de Ciências Matemáticas e de Computação,
Universidade de São Paulo
Jorge A. Achcar
Departamento de Medicina Social,
Faculdade de Medicina de Ribeirão Preto,
Universidade de São Paulo
João B. Ribeiro do Val
Departamento de Telematica,
Faculdade de Engenharia Elétrica,
Universidade Esatadual de Campinas
In this paper, we introduce a Bayesian approach to identify a population growth model employing
a discrete dynamic model based on generalized logistic growth model known as theta-logistic model.
The parameter estimates for these models are obtained using Monte Carlo Markov Chain (MCMC)
methods and the appropriate model is identified using some information criteria for model selection.
The identification method developed here can be applied to evaluate the asymmetric growth rate per
capita, due to the consideration of a shape parameter (θ). In this way we use these discrimination
methods to identify the model of best fit among the Logistic (θ = 1), Gompetz (θ = 0) or the Thetalogistic model (θ 6= 1). The Bayesian approach introduced in this paper is applied to the population of
Brazilian Capybara (Hydrochaeris hydrochaeris).
Acknowledgments: We would like to thank Professor Luciano Verdade (Department of Ecology,
ESALQ-USP) for the data record of Brazilian Capybara.
93
Measuring Vulnerability via Spatially Hierarchical Factor
Models
Hedibert Freitas Lopes
University of Chicago, USA
Alexandra Mello Schmidt
Federal University of Rio de Janeiro, Brazil
Esther Salazar
SAMSI and Duke University, USA
Mariana Gómez
Universidad de la República, Uruguay
Marcel Achkar
Universidad de la República, Uruguay
We address the general and challenging task of constructing social, economical, environmental or
related indexes, as well as the specific task of constructing a model-based vulnerability index, for a
given region. We propose a new class of spatially hierarchical factor models that explicitly account
for the different levels of hierarchy in the country, such as census tracts, municipalities, counties and
cities, and that, at the same time, minimizes the loss of information inherently associated to data
aggregation. We study the Uruguayan vulnerability to vector-borne diseases and built an index that
combines different sources of vulnerability via a set of micro-environmental indicators. We show that our
proposal outperforms current and standard approaches, which fail to properly account for discrepancies
in the region sizes, e.g. municipality or number of census tracts. We also show that data aggregation
can seriously affect the estimation of the cities vulnerability rankings under benchmark models.
Keywords: Areal data, Bayesian Inference, Model Comparison, Spatial Interpolation, Spatial Smoothing.
94
A Multiple Time Scale Survival Model with a Cure Fraction
Francisco Louzada-Neto
CER-DEs, Universidade Federal de São Carlos
Juliana Cobre
CER-DEs, Universidade Federal de São Carlos
Many recent survival studies propose modeling data with a cure fraction, i.e., data in which part of
the population is not susceptible to the event of interest. This event may occur more than once for the
same individual (recurrent event). We than have a scenario of recurrent event data in the presence of
a cure fraction, which may appear in various areas such as oncology, finance, industries, among others.
This paper proposes a multiple time scale survival model to analyze recurrent events using a cure fraction.
The objective is to analyze the efficiency of certain intervention to extinguish the studied event, in terms
of covariates and censuring. All estimates were obtained using a sampling based approach, which allows
information to be input beforehand with lower computational effort. Simulations were realized based
on a clinical scenario in order to observe some frequentist properties of the estimation procedure in the
presence of small and moderate sample sizes. An application on a set of real mammary tumor data is
provided.
95
Medidas do Valor Preditivo de um Modelo Bayesiano Logı́stico
Aplicado a Dados de Crédito
Francisco Louzada-Neto
CER-DEs-UFSCar
Paulo Henrique Ferreira da Silva
CER-DEs-UFSCar
Para diminuir o risco de decisões errôneas na concessão de crédito para clientes, métodos estatı́sticos
têm sido extensivamente empregados para descrever a habilidade de modelos de classificação. A qualidade
da previsão de um modelo pode ser avaliada a partir de medidas como sensibilidade, especificidade, os valores de predição positivo e negativo e a acurácia. Bem como via gráficos da sensibilidade/especificidade,
comumente chamados de curva ROC, os quais permitem contemplar a capacidade preditiva de um modelo de classificação bem como comparar modelos concorrentes através de sua escala. Neste trabalho,
descrevemos um procedimento Bayesiano para modelagem de dados dicotômicos (Regressão Logı́stica
Bayesiana), o qual permite adicionar à modelagem o conhecimento de um especialista, aproveitando
assim um conhecimento externo à base de dados, usualmente presentes em situações práticas. Dados
extraı́dos de uma carteira de um banco ilustram a metodologia. Um estudo de simulação é realizado
para verificar a adequabilidade das medidas preditivas.
96
Teste de Hipótese Bayesiano para o Parâmetro de Forma do
Modelo Weibull
Camila Bertini Martins
IME - USP
Vera L. D. Tomazella
UFSCar
Adriano Polpo
UFSCar
O comportamento da falha de um sistema ou indivı́duo é, na maioria das vezes, representado pela sua
taxa de falha, que pode ser crescente, decrescente, constante ou fruto de suas combinações ao longo do
tempo. Assim, é desejável o uso de um modelo probabilı́stico que represente cada uma dessas situações,
apenas com mudanças nos valores dos seus parâmetros. Neste trabalho, estudamos, sob a perspectiva
de análise Bayesiana, o modelo Weibull, considerado bastante flexı́vel. Para obtermos uma variedade de
comportamento dessa distribuição, basta alterar seu parâmetro de forma, β. Por exemplo, se o parâmetro
de forma for β = 1 temos a distribuição Exponencial e se β = 2, a distribuição Rayleigh. Como um
dos principais interesses estatı́sticos é a realização de testes de hipóteses para os parâmetros do modelo
em questão, revisamos, para o modelo Weibull, o critério de referência Bayesiano (Bayesian Reference
Criterion, BRC) e a medida de evidência Bayesiana (Full Bayesian Significance Test, FBST).
97
Aproximações Analı́ticas para Posterioris
Thiago Guerrera Martins
Universidade Federal do Rio de Janeiro
A última década presenciou uma revolução nas ciências estatı́sticas, baseada no desenvolvimento de
métodos de simulação estocástica, que permitiram, por exemplo, a aproximação de posterioris impossı́veis
de se obter analı́ticamente. Naturalmente, tais métodos de simulação estocática, bem representados pelo
MCMC, apresentam inconvenientes como a dificuldade de diagnosticar convergência e o fato de exigirem
um tempo computacional muito alto para atingir convergência em determinados tipos de problemas.
Tendo em mente essas desvantagens fica mais intuitivo entender o apelo que há em obter métodos que se
baseiam em aproximações determinı́sticas das posterioris de interesse, ao invés de estocástica, eliminando
desse modo o problema da dificuladade de diagnosticar convergência. Um obstáculo que permanece ao se
considerar aproximações determinı́sticas é o tempo necessário para obter tais aproximações, problema esse
que impediu que esse tipo de abordagem fosse usada em problemas práticos (com dimensão paramétrica
maior) ao longo da última década. Os holofotes voltaram para aproximações determinı́sticas após o
surgimento do método Integrated Nested Laplace Approximations (INLA), que permite fazer inferência
bayesiana aproximada para a classe de modelos Gaussianos latentes de maneira rápida e precisa. O objetivo deste trabalho será aplicar e analisar criteriosamente o comportamento de diferentes aproximações
analı́ticas e comparar com os resultados obtidos com métodos MCMC.
98
Forward-Backward Study of the Stereo Vision Problem: A New
Approach to Solve Belief Propagation on Loop Graphs
Fortunato Silva de Menezes
Departamento de Ciências Exatas,
Universidade Federal de Lavras, Brasil
Davi Geiger
Courant Institute of Math Sciences,
Department of Computer Science, New York University, USA
Mário Javier Ferrua Vivanco
Departamento de Ciências Exatas,
Universidade Federal de Lavras, Brasil
Ricardo Martins de Abreu Silva
Departamento de Ciência da Computação,
Universidade Federal de Lavras, Brasil
In stereo vision a pair of two-dimensional (2D) stereo images is given and the purpose is to find out
the depth (disparity) of regions of the image in relation to the background, so that we can reconstruct
the 3D structure of the image from the pair of 2D stereo images given. Using the Bayesian framework we
implemented the Forward-backward algorithm to unfold the disparity (depth) of a pair of stereo images.
The results showed are very reasonable, but we point out there is room for improvement concerning
the graph structure used. One possible extension we are currently working on is the implementation of
Forward-backward algorithm on a tree structure, to take into account the interaction among the epipolar
lines of the pair of stereo images. This approach enhance the results in several time scales (i.e., it is
much faster than the original one, which does not take advantage of computed transition probabilities in
previous pixels) and resolution (i.e., it improves the depth (disparity) range) of the images. Preliminar
results are showed in this work.
99
Modelo de Risco Logı́stico Dependente do Tempo com
Fragilidade
Eder Angelo Milani
DEs, UFSCar
Vera Lúcia Damasceno Tomazella
DEs, UFSCar
Teresa Cristina Martins Dias
DEs, UFSCar
Neste trabalho apresentamos o modelo proposto por Mackenzie, conhecido por modelo de risco
logı́stico generalizado dependente do tempo ou GTDL. Nesse modelo é introduzido na função de risco um
efeito aleatório, denominado fragilidade, com o objetivo de controlar a dependência e a heterogeneidade
não observada das unidades. Consideramos o modelo de fragilidade como uma alternativa para modelar
dados de sobrevivência, adotando um conjunto de dados simulado. Sob a abordagem Bayesiana, estimamos os parâmetros, considerando o uso do método MCMC. Graficamente comparamos tais resultados
com o estimador de Kaplan-Meier.
100
Adaptive Proxy Maximum Probability Estimation of
Multidimensional Poisson Intensities
Jose Carlos Simon de Miranda
IME-USP
We propose a non parametric methodology of estimation of the intensity for Poisson point processes
on Rm . We assume the observation region, O, is a bounded Rm interval. The space of positive functions
formed by composition of L2 (O)-functions with the exponential is endowed with a probability induced
from another one defined on the set of wavelet coefficients. This is a convenient space for the intensity
to belong to and we choose as our first estimate for the intensity a function that corresponds to the
maximum posterior probability given a trajectory of the Poisson process on O. This choice is done by
determining the wavelet coefficients of its logarithm. A second estimate is obtained by suitably writing
the posterior probability as a product of functions that are maximized separately giving raise to a proxy
maximum posterior probability estimate.
This approach presents the desired feature of furnishing everywhere non negative estimates of the
intensity that exhibit not only a minimization of the energy, relative to the wavelet basis, but also a
maximization of the entropy of the process on O conditional to the realization. An adaptive thresholding
procedure based on jointly testing hypothesis, on the wavelet coefficients, and adjusting the priors’
locations is given. As an example of the general estimating procedure above, we specialize to self affine
and self similar probability prior Poisson processes.
101
A Practical Approach to Elicit Multivariate Prior Distributions
Fernando Antônio Moala
DMEC, UNESP
Anthony O’Hagan
University of Sheffield
Moala and O’Hagan (2010) present a method to quantify beliefs in the form of a multivariate prior
distribution based on marginal and joint probabilities elicited from expert. The method uses a nonparametric bayesian framework with a Gaussian process prior proposed by elicitor (an statistician). The
main focus in that paper is theoretical and the approach is illustrated with two simulated data examples. However, to run our proposed procedure we must to specify some requirements to be asked to the
expert. This work offers a detailed guideline to elicit the expert’s prior distribution for general practical
situations. It also brings our practical experience gained when applying our elicitation approach in a real
situation and exposes the challenges involved to implement it. More specifically, we discuss an application in clinical trial by building a joint prior distribution f (·) that represents the expert’s beliefs about
fracture risks in patients suffering from osteoporosis under two treatments. Various posterior inferences
are computed and fedback to the expert.
102
Elicitação de uma Distribuição a Priori com Aplicações Clı́nicas
Fernando Antônio Moala
DMEC, UNESP
No contexto de análise estatı́stica, elicitação é o processo de se extrair o conhecimento de um especialista sobre alguma quantidade desconhecida na forma de uma distribuição de probabilidade. Essa
distribuição de probabilidade é freqüentemente usada como distribuição a priori em uma análise bayesiana
e então a informação elicitada do especialista pode ser usada para complementar a informação dos dados
observados.
Oakley e O’Hagan (2007) desenvolveram um procedimento bayesiano não-paramétrico para elicitação
da distribuição a priori considerando uma única variável de interesse. Em vez de assumir uma forma particular paramétrica para a função densidade, ela é tratada como uma função desconhecida, e a inferência
é feita sobre esta função baseado apenas nas especificações probabilı́sticas fornecidas pelo especialista.
O principal objetivo desse trabalho é apresentar uma implementação prática do método bayesiano de
elicitação proposto por Oakley e O’Hagan (2007) para construção de uma distribuição a priori f (θ) do
risco de fratura em pacientes que sofrem de osteoporose sob um determinado tratamento. Também tem o
propósito de divulgar e provocar interesse pela Elicitação, de forma que mais estatı́sticos possam aplicála em muitos problemas práticos. A teoria do método de elicitação utilizado neste trabalho é também
apresentada de forma sintética e acessı́vel, a fim de facilitar a sua compreensão e implementação.
103
Modelos Dinâmicos para Deformação Espacial
Fidel Ernesto Castro Morales
DME/UFRJ
Dani Gamerman
DME/UFRJ
A modelagem da estrutura de covariância espacial não-estacionária via deformação espacial tem sido
utilizada sob a hipótese de estacionariedade temporal. Porém, em aplicações reais esta suposição é
inadequada e pouco realista. Neste trabalho é generalizado o modelo de deformação Bayesiano cuja
principal vantagem em relação aos modelos atualmente propostos é que este além de corrigir anisotropia
incorpora a estrutura temporal dos dados. Este modelo considera a estrutura temporal do processo
tanto na sua média como na sua estrutura de covariância espacial. Assim, a média do processo é
modelada via modelos lineares dinâmicos e a estrutura de covariância espacial via deformação dinâmica.
Esta abordagem assume que as deformações através do tempo, a priori são geradas por um processo
Gaussiano dinâmico. As distribuições a posteriori dos parâmetros foram aproximadas usando métodos
Markov chain Monte Carlo (MCMC). Foi estabelecida por meio de dados artificiais a efetividade do
esquema de amostragem em recuperar os verdadeiros valores dos parâmetros.
Foi ajustado um modelo de deformação espacial dinâmica para dados mensais de temperatura mı́nima
no estado do Rio de Janeiro / Brasil. Foram utilizadas as séries temporais observadas entre janeiro de
1961 a dezembro de 2000 em 15 estações monitoradoras. O modelo capturou adequadamente a estrutura
temporal na média e a estrutura de covariância espacial.
104
Brazilian Pediatric Risk of Severity Illness Model
Eduardo Yoshio Nakano
Department of Statistics, University of Brası́lia
Cristina Malzoni Ferreira Mangia
Department of Pediatrics, Federal University of São Paulo
Carlos Alberto de Bragança Pereira
Department of Statistics, University of São Paulo
The aim of this work is to develop a prognostic mortality model and a severity illness index for
children admitted in a Pediatric Intensive Care Unit (PICU) in a hospital in São Paulo. We use multiple
logistic regressions to determine two probabilistic models: the first supplied the death probability and the
second was conditionally dependent on surviving cases of the PICU. These two models give us the vector
of probabilities for each patient. The first vector element focuses on the hospital survival probability,
the second focuses on the death probability inside the hospital but after PICU discharge and the third
probability is focused on death probability inside the PICU. Based on these three probabilities, we have
defined a severity index that put the patients in the following order: from worst (PICU death) to the
best conditions (Hospital Survival). At the final step, the Bayesian net was applied to estimate new
calibration of probabilities (posteriori ) using the severity index.
105
A Semiparametric Bayesian Approach to Extreme Value
Estimation
Fernando Ferraz do Nascimento
Universidade Federal do Rio de Janeiro
Dani Gamerman
Universidade Federal do Rio de Janeiro
Hedibert Freitas Lopes
University of Chicago
This work is concerned with extreme value density estimation. The generalized Pareto distribution
(GPD) beyond a given threshold is combined with a nonparametric estimation approach above the
threshold. This semiparametric setup is shown to generalize a few existing approaches and enables
density estimation over the complete sample space. Estimation is performed via the Bayesian paradigm,
which helps identify model components. Estimation of all model parameters, including the threshold
and higher quantiles, and prediction for future observations are provided. Simulation studies suggests a
few useful guidelines to evaluate the relevance of the proposed procedures. Models are then applied to
environmental data sets. The paper is concluded with a few directions for future work.
106
Modelos Dinâmicos Matriz Variados com Estrutura de Grafos
para Construção de Portfólios
Leonardo Nassif
Unversidade Federal do Rio de Janeiro
Helio dos Santos Migon
Unversidade Federal do Rio de Janeiro
Carlos Carvalho
The University of Chicago Booth School of Business
Apresentamos a estruturação da matriz de covariância em dados multivariados através de grafos não
direcionados. Buscamos, a partir disso, a construção de portfólios otimizados de menor variância.
De forma clássica, os dados de retorno de ativos financeiros são modelados através do Capital Asset Pricing Model (CAPM), que assume a existência de um único regressor comum e uma matriz e de
covariância residual diagonal, ou seja, sem estrutura de dependência entre os erros na modelagem. Estendemos o modelo CAPM ao permitirmos que a matriz de covariância capture estruturas de dependência
ainda presentes entre as séries financeiras.
Nossa principal suposição é que a matriz de precisão dos erros observacionais é esparsa. Nesse
contexto, aplicamos a teoria de grafos para dar tratabilidade as estruturas de dependência ainda presentes
entre os ativos que não foram capturados pela componente comum.
Introduzimos o Modelo Linear Dinâmico com estrutura de Grafos e o utilizamos para comparar o
CAPM com o modelo de precisão esparsa. A comparação é exemplificada com 20 ativos da bolsa brasileira
utilizando como regressor comum o ı́ndice Ibovespa. Além disso, desenvolvemos estudos usando um fator
latente como regressor.
Através das simulações e exemplos, obtemos portfólios de menores variâncias com o uso da modelagem com grafos. Desta forma, os resultados indicam que a modelagem possui aplicabilidade nos dados
financeiros trabalhados.
107
Modelo Weibull Modificado de Longa Duração Aplicado em
Câncer de Mama - Uma Abordagem Bayesiana
Cleyton Zanardo de Oliveira
CER DEs, Universidade Federal de São Carlos - UFSCar
Gleici S. C. Perdoná
FAEPA - Faculdade de Medicina de Ribeirão Preto da Universidade de São
Paulo
Francisco Louzada-Neto
CER DEs, Universidade Federal de São Carlos - UFSCar
Neste trabalho propomos o ajuste de modelos para dados na presença de longa duração. Trabalharemos com o modelo Weibull modificado de longa duração (WMLD), que possui como casos particulares
modelos mais simples tais como a Weibull de longa duração (WLD), a exponencial de longa duração
(ELD), o modelo Weibull (W) e o modelo exponencial (E). A aplicação refere-se a tempos de sobrevivência de pacientes a partir da cirurgia de câncer de mama realizada. A sobrevida foi estimada pelos
cinco modelos: o modelo WMLD e seus casos particulares, o modelo WLD, ELD, W e E. O critério BIC
indicou que a WLD possui melhor ajuste.
108
Modelagem Bayesiana Hierárquica em PPNHs
Maristela Dias de Oliveira
Universidade Federal de Minas Gerais / Universidade Federal da Bahia
Enrico A. Colosimo
Universidade Federal de Minas Gerais
Gustavo L. Gilardoni
Universidade de Brasilia
Muitas aplicações estatı́sticas envolvem múltiplos parâmetros que podem ser considerados como relacionados ou ligados de alguma forma pela estrutura do problema, implicando que um modelo de probabilidade conjunta para esses parâmetros deva refletir a dependência entre eles. Uma caracterı́stica-chave
de tais aplicações é que os dados observados, tij , com unidades indexadas por j, dentro de grupos
indexados por i, podem ser usados para estimar aspectos da distribuição populacional dos parâmetros.
No contexto de múltiplos sistemas reparáveis, pode ser de interesse investigar se a função intensidade de
falhas dos sistemas seguem o mesmo ou diferentes Processos de Poisson Não-Homogêneos (PPNHs). É
natural modelar tal problema hierarquicamente, com os resultados observáveis sendo modelados condicionalmente nessess parâmetros populacionais, que são dados como uma especificação probabilı́stica em
termos de parâmetros adicionais ou hiperparâmetros. Tal pensamento hierárquico ajuda a entender problemas multiparamétricos. Este trabalho apresenta uma abordagem Bayesiana Hierárquica para modelar
PPNHs. A abordagem é então aplicada a dados reais e a dados simulados, e os resultados obtidos são
comparados aos correspondentes resultados obtidos por máxima verossimilhança.
109
Abordagem Bayesiana para Modelos GARCH(p,q): Uma
Comparação Usando Distribuições Normal e t de Student para
os Retornos IBovespa
Sandra Cristina de Oliveira
Campus de Tupã, Universidade Estadual Paulista - UNESP
Marinho G. Andrade
ICMC/São Carlos, Universidade de São Paulo - USP
Valeria A. M. Ferreira
Campus de Sertãozinho, Faculdade de Tecnologia - FATEC
Neste trabalho comparamos as estimativas Bayesianas obtidas para os parâmetros de modelos GARCH(p,q)
considerando distribuições normal e t de student para a distribuição condicional da série de retornos.
Adotamos ainda distribuição a priori não-informativa e consideramos uma reparametrização do modelo estudado para mapear o espaço dos parâmetros no espaço real. Os sumários a posteriori foram
obtidos por meio dos métodos de simulação de Monte Carlo em Cadeias de Markov (MCMC). Com a
reparametrização adotada, reduzimos a taxa de rejeição do algoritmo de simulação MCMC, acelerando o
processo de convergência deste. A metodologia foi avaliada considerando uma série de retornos IBovespa.
Palavras-chave: modelos GARCH, métodos MCMC, retornos financeiros.
110
Avaliação de Múltiplos Testes Diagnósticos na Ausência de
Padrão Ouro: Comparação entre o Modelo Frequentista e o
Modelo Bayesiano com Três Diferentes Prioris Objetivas
Gilberto de Araujo Pereira
DEESC-UFTM, CER-DEs-UFSCar
Francisco Louzada-Neto
CER-DEs-UFSCar
Hélio de Moraes Souza
Universidade Federal do Triângulo Mineiro-UFTM
Márcia Maria Ferreira Silva
Universidade Federal do Triângulo Mineiro-UFTM
Valdirene de Fátima Barbosa
Universidade de Uberaba-UNIUBE
Neste trabalho o objetivo foi estimar as sensiblidades, especificidades de seis testes diagnósticos
independentes condicionalmente da condição de saúde do sujeito e a prevalência da doença, numa situação
onde não existe um teste diagnóstico confirmatório (padrão ouro), como é o caso da doença de Chagas, a
partir de uma modelagem de classe latente sem inclusão de covariáveis e com estrutura para uma (v = 1) e
três (v = 3) distintas prevalências da doença. Adicionalmente confrontamos a modelagem bayesiana para
três diferentes especificações de prioris objetivas a partir do algoritmo Gibbs-Sampling com a modelagem
frequentista a partir do o algoritmo EM. Todos os modelos apresentaram identificabilidade com 2L v − 1
graus de liberdade e 2Lv +v parâmetros, sendo que o modelo com diferentes prevalências entre os estratos
(v = 3) e priori Uniforme apresentou desempenho melhor em relação aos demais. O uso da classe de
variável latente yi ∼Bernoulli(τvi ), que simula a verdadeira condição de saúde do i-ésimo sujeito no
v-ésimo estrato, parece ser uma boa alternativa tanto na abordagem bayesiana quanto frequentista
para este número de testes e tamanho amostral, uma vez que produziu estimativas bem próximas das
obtidas no cenário hipotético de 100% de padrão ouro. Para o conjunto de dados reais, referente a
triagem de doadores de sangue para doença de Chagas, com reduzido tamanho amostral, o conhecimento
especializado pode ser modelado a partir de uma distribuição a priori como alternativa para a estimativa
da prevalência do estrato I (doadores com sorologia negativa na triagem) uma vez que essa convergiu
para uma região distante da esperada. Todos os testes apresentaram estimativas muito próximas para
as sensibilidades e especificidades. Segundo o melhor modelo a taxa estimada de infecção chagásica foi
de 2, 7% entre os doadores com sorologia inconclusiva na triagem.
Palavras-chave: Modelo de Classe Latente, estratificação, independência condicional, algoritmo
Gibbs-Sampling e EM, priori objetiva.
111
Modelo Bayesiano Geral de Classe Latente para Múltiplos
Testes Diagnósticos com Estrutura para Covariáveis e
Estratificação da População
Gilberto de Araujo Pereira
DEESC-UFTM, CER-DEs-UFSCar
Francisco Louzada-Neto
CER-DEs-UFSCar
Hélio de Moraes Souza
Universidade Federal do Triângulo Mineiro-UFTM
Márcia Maria Ferreira Silva
Universidade Federal do Triângulo Mineiro-UFTM
Valdirene de Fátima Barbosa
Universidade de Uberaba-UNIUBE
O uso da classe de variável latente yi ∼ Bernoulli(τvi ), que estima a verdadeira condição de saúde do
i-ésimo sujeito no v-ésimo estrato, em situações onde não existe um teste padrão ouro, como é o caso do
diagnóstico da doença de Chagas em doadores de sangue, juntamente com o uso do algoritmo MetropolisHastings são alternativas para problemas de estimação do desempenho de múltiplos testes diagnósticos
em modelos com estruturas complexas que incluem múltiplas covariáveis e diferentes prevalências da
doenca. A identificabilidade do modelo pode ser reestabelecida com a estratificação da população em
dois estratos (v = 2) para o caso de seis testes (L = 6) e seis covariáveis (m = 6) e a partir de
três estratos (v = 3) quando cinco testes (L = 5) e seis covariáveis (m = 6), com 2L v − 1 graus
de liberdade e 2Lvm + vm parâmetros no modelo. O uso da distribuição normal vaga centrada no
“zero”e variância “flat”como priori para θ pode resultar em posterioris que não convergem para uma
distribuição estacionária ou então demandar um tempo computacional inviável. Portanto, parece razoável
considerar uma combinação de análise exploratória e ajuste do modelo particular não estratificado v = 1
em cada nı́vel das covariáveis para os chutes iniciais dos hiperparâmetros do modelo adicionalmente à
modelagem bayesiana empirica a partir do modelo geral até obter amostras estacionárias das condicionais
a posterioris. Para o conjunto de dados reais verificamos desempenho discretamente superior do modelo
estratificado em relação ao modelo não estratificado, além de apresentar estimativas para as prevalências
mais próximas da realidade. Verificamos sensibilidades, especificidades e prevalências significativamente
diferentes entre os nı́veis das covariáveis para maioria dos testes. Esses achados demonstram a relevância
da inclusão de covariáveis e estratificação na estrutura da modelagem.
Palavras-chave: testes diagnósticos, independência condicional, modelo bayesiano de classe latente,
covariáveis, estratificação, identificabilidade.
112
Bayesian Analysis Applied to Data of the Brazilian Market
Hydrated Alcohol
Gislene Araújo Pereira
Dep.Ciências e Economia-Universidade Federal de Alfenas-MG
Letı́cia Lima Milani
Dep.Ciências e Economia-Universidade Federal de Alfenas-MG
Deive Ciro de Oliveira
Dep.Ciências e Economia-Universidade Federal de Alfenas-MG
This study aimed to fit the Bayesian regression model for the values paid by hydrous alcohol Brazilian
consumers, from January 2001 to December 2008. The inference about the parameters was performed by
applying the Gibbs Sampler, considering the marginal complete distributions. For the Bayesian analysis
was used conjugate priors method. The analysis was performed with a heating period of 1000 and 10000
later iterations monitored. To check convergence, was used the method proposed by Gelman & Rubin
(1992). It was found, by comparing the predicted values with the real, that it model showed good
estimates. For the development of the Bayesian method was used WinBUGS software.
Keywords: Model of Bayesian Regression, Brazilian Market Alcohol Hydrated, Software WinBUGS.
113
Métodos de Estimação em Modelos Dinâmicos para Séries
Temporais de Contagens
João Batista de Morais Pereira
UFRJ
Alexandra Mello Schmidt
UFRJ
Helio dos Santos Migon
UFRJ
Modelos dinâmicos bayesianos não normais são cada vez mais explorados em diversas áreas de estudo
da Estatı́stica, em especial na área aplicada. Em epidemiologia, por exemplo, é cada vez mais comum a
utilização de modelos dinâmicos para modelagem das observações que, em geral, são séries temporais de
contagens.
O grande desafio da estimação em modelos dinâmicos é a estimação do vetor de estados cujos elementos são altamente correlacionados, o que torna difı́cil a obtenção de amostras independentes. Há
diferentes propostas na literatura sugerindo diferentes maneiras de se obter amostras da distribuição a
posteriori dos parâmetros de estado. Entre as mais recentes está o CUBS (Conjugate Updating Backward
Sampling), proposto por Ravines et al. (2007), que sugere o uso de uma distribuição proposta eficiente
conjunta para vetor de estados dentro do algoritmo de Metropolis-Hastings.
Neste trabalho, estamos interessados em discutir alguns dos diferentes métodos de estimação em
modelos dinâmicos existentes na literatura aplicados a séries temporais de contagens, em especial o
CUBS, proposto por Ravines et al. (2007). Queremos discutir as vantagens e desvantagens deste método
frente a outros algoritmos similares como o algoritmo proposto por Gamerman (1998) e algoritmos de estimação seqüencial como o Conjugate Updating (West et al., 1985) e o método SIR (Sampling/Importance
Resampling) (Rubin, 1987).
114
Comparação de Modelos de Relação Hipsométrica para Dados
Espacialmente Correlacionados: Uma Abordagem Bayesiana
Júlio César Pereira
Universidade Federal de São Carlos - Campus Sorocaba
Carlos Alberto Martinelli de Souza
Universidade Federal de São Carlos - Campus Sorocaba
Visando reduzir custos e tempo, muitas vezes, nas parcelas de um inventário florestal, apenas algumas
árvores têm suas alturas medidas, sendo necessário estimar a altura das demais. Para isso é comum o
uso de modelos de regressão relacionando altura e o diâmetro à altura do peito. No entanto, a suposição
de independência dos erros em um modelo de regressão nem sempre é razoável, uma vez que para
medidas feitas em pontos próximos entre si, espera-se que as alturas tenham valores parecidos (alta
correlação espacial). Neste contexto, o presente trabalho tem por objetivo, comparar, sob o enfoque
bayesiano, quatro modelos de regressão para relação hipsométrica, sendo dois deles comumente utilizados
na literatura e outros dois modelos correspondentes aos dois primeiros adicionados de uma componente
espacial (descrevendo a autocorrelação espacial), para um plantio de Pinus sp da Floresta Nacional de
Ipanema - SP. Dos modelos ajustados o modelo que se mostrou com melhor desempenho foi o modelo
com componente espacial e tendência quadrática em relação ao dap.
115
LASSO Bayesiano no Mapeamento de QTL em uma
População F2
Renato Nunes Pereira
LCE, ESALQ/USP
Roseli Aparecida Leandro
LCE, ESALQ/USP
Antonio Augusto Franco Garcia
LGN, ESALQ/USP
Cláudio Lopes de Souza Junior
LGN, ESALQ/USP
Anete Pereira de Souza
IB, UNICAMP
Caracterı́sticas quantitativas são controladas por múltiplos QTLs (quantitative trait loci), ou seja,
várias regiões do genoma têm influência sobre tais caracteres quantitativos. A localização dessas regiões
é importante no melhoramento genético. O mapeamento de locos de caracterı́sticas quantitativas nada
mais é do que identificar marcadores moleculares ou locus genômico que têm influência na variação
dessas caracterı́sticas complexas. O problema é complicado pelo fato de que dados QTL normalmente
contêm um grande número de marcadores moleculares e, em geral, a maioria deles tem pouco ou nenhum
efeito sobre o valor fenotı́pico. Ocorre, ainda, um outro tipo de problema: alguns marcadores não são
genotipados devido a problemas de origem técnica. Neste trabalho, propõe-se um modelo bayesiano
hierárquico para o mapeamento de múltiplos QTLs que incorpora, simultaneamente, a incerteza relativa
dos dados de marcadores perdidos (M − ) e dos parâmetros desconhecidos estimando os possı́veis efeitos
genéticos associados com todos os marcadores utilizando o procedimento LASSO bayesiano.
116
Processo ARMA: Um Estudo Bayesiano
Adriana Strieder Philippsen
Instituto de Ciências Matemáticas e de Computação - ICMC-USP
Marcos H. Cascone
Universidade Federal de São Carlos - UFSCar
Marinho G. Andrade
Instituto de Ciências Matemáticas e de Computação - ICMC-USP
Ricardo Sandes Ehlers
Instituto de Ciências Matemáticas e de Computação - ICMC-USP
Na análise de uma série temporal, primeiramente deseja-se modelar o fenômeno de interesse para
que possamos descrever o seu comportamento, fazendo estimativas, avaliando quais fatores influenciam
no comportamento da série, buscando definir relações de causa e efeito entre duas ou mais séries, e por
último fazer previsões de valores futuros da série com base em valores passados fornecendo informações
e subsı́dios para uma consequente tomada de decisão.
Na análise do comportamento de uma série livre de tendência e de sazonalidade podem ser utilizados
modelos auto-regressivos (AR) ou que incorporem médias móveis (MA), sendo que o modelo ARMA
combina as caracterı́sticas dos dois processos anteriores. Este processo relaciona os valores futuros com
as observações passadas, assim como também com os erros passados apurados entre os valores reais e os
previstos.
Neste trabalho, utilizando dados simulados e um conjunto de dados reais, é conduzida uma análise
clássica e bayesiana para o processo ARMA(p,q). Para o estudo clássico, as estimativas dos parâmetros
do modelo adotado são obtidas fazendo uso do procedimento de estimadores de máxima verossimilhança,
que equivale ao método de mı́nimos quadrados ponderados reiterados, conhecido por IRLS ou Scoring de
Fisher. Na estimação bayesiana, será utilizada uma priori não informativa que juntamente com a função
de verossimilhança do modelo, fornecerá uma distribuição a posteriori, que é empregada no cálculo da
média da distribuição a posteriori como estimativa de um parâmetro. Isto tem justificativa teórica, no
contexto na Teoria de Decisão, quando considera-se a função de perda quadrática pois, neste caso, é o
valor que minimiza o risco de Bayes. Os modelos ajustados serão comparados usando o erro quadrático
médio (MSE) e o erro percentil absoluto da média (MAPE). Como resultado final das análises, será
apresentado um resumo descritivo das distribuições condicionais a posteriori dos parâmetros de interesse,
bem como os valores das médias e seus gráficos. Também serão apresentadas as previsões k passos à
frente. As amostras da distribuição a posteriori serão geradas fazendo uso das técnicas de simulação
MCMC, em particular, o algoritmo de Gibbs sampling e para verificar a convergência será utilizado o
critério proposto por Geweke (1992).
117
Estudo das Matrizes de Covariância de Modelos Bayesianos
com Interação Espaço-Temporal
Letı́cia Cavalari Pinheiro
Departamento de Estatı́stica – Instituto de Ciências Exatas –
Universidade Federal de Minas Gerais (UFMG)
Renato Martins Assunção
Departamento de Estatı́stica – Instituto de Ciências Exatas –
Universidade Federal de Minas Gerais (UFMG)
Nesse trabalho estudamos as matrizes de covariância de modelos bayesianos com efeitos de interação
espaço-temporal. Para isso, apresentamos os possı́veis tipos de efeitos aleatórios espaciais e temporais
em modelos bayesianos e atribuimos a eles distribuições a priori comumente utilizadas. Construimos
possı́veis efeitos aleatórios espaço-temporais a partir da interação entre um efeito temporal e um espacial. Calculamos as matrizes de covariância a priori para os modelos com interação espaço-tempo e
as escrevemos na forma de produto de Kronecker entre as matrizes de covariância a priori dos efeitos
temporal e espacial. Conseguimos visualizar mais claramente o efeito de cada tipo de interação possı́vel,
relacionando as matrizes de covariância a priori com as estruturas de dependência espacial e/ou temporal
envolvidas nos modelos estudados. Como exemplo, apresentamos o estudo das matrizes de covariância
a priori de dois modelos especı́ficos existentes na literatura e fazemos suas interpretações.
118
Um Modelo Bayesiano de Regressão Logı́stica com Erros e
Classificações Repetidas
Magda Carvalho Pires
Universidade Federal de Minas Gerais
Roberto da Costa Quinino
Universidade Federal de Minas Gerais
Sob o enfoque bayesiano, apresentamos uma abordagem que incorpora classificações repetidas ao
modelo de regressão logı́stica em que a variável resposta está sujeita a erros de classificação. O modelo
proposto utiliza distribuições a priori de médias condicionadas e o método Gibbs Sampler para realizar
o processo de inferência. Comparando-se com a abordagem em que é realizada apenas uma classificação
do elemento amostral, resultados satisfatórios foram obtidos quando não há informação a priori para os
erros, quando esses são admitidos como de pequena magnitude e quando a distribuição a priori é bastante
informativa.
119
Sensibilidade da Inferência Bayesiana com Prioris de
Bayes-Laplace e de Jeffreys para o Modelo Binomial Ponderado
Rubiane Maria Pires
Universidade Federal de São Carlos
Josemar Rodrigues
Universidade Federal de São Carlos
Considerando a distribuição a priori de Bayes-Laplace e a de Jeffreys, este trabalho analisa o sensibilidade das amostras geradas pelo modelo Binomial Ponderado (amostras viciadas) nas probabilidades de
cobertura dos intervalos de credibilidade para a probabilidade de sucesso ao longo do espaço paramétrico.
As distribuições ponderadas incorporam o fato das amostras terem sido selecionadas segundo um mecanismo de seleção aleatório distorcido (Bayarri & DeGroot, 1987). O estudo de simulação sugere que a
probabilidade de cobertura para modelo Binomial Ponderado é mais estável em relação ao modelo Binomial com amostras aleatórias com o uso da distribuição a priori de Bayes-Laplace. Agora estamos
interessados em comparar estes resultados com os obtidos ao considerar a priori de Jeffreys.
120
Inferential Implications of Over-Parameterization: A Case
Study in Incomplete Categorical Data
Frederico Zanqueta Poleto
Universidade de São Paulo
Carlos Daniel Paulino
IST-Universidade Técnica de Lisboa and CEAUL-FCUL
Geert Molenberghs
I-BioStat, Universiteit Hasselt and Katholieke Universiteit Leuven
Julio da Motta Singer
Universidade de São Paulo
The use of non-identifiable models has been spreading across many branches of statistics. In this
work, we scrutinize Bayesian and classical analyses in the incomplete categorical response setting. We
show that the subjective parts of each approach can influence results in non-trivial ways. Specifically, we
illustrate that prior distributions commonly regarded as slightly or non-informative may actually be too
informative for non-identifiable parameters even when they appear in the likelihood. We also show that
the choice of more parsimonious over-parameterized models, usually adopted in classical analyses merely
for computational simplicity, may affect inferences in unforeseen ways. These effects remain for large
sample sizes (e.g., from 4,000 to 4,000,000), suggesting that the prior distribution and the model should
be more carefully examined than usual for these specialized models. When contrasting Bayesian and
classical approaches we note that the posterior inferences dependence on the prior does not disappear
asymptotically and that the respective credible and uncertainty intervals are close only for extremely
diffuse priors and very large sample sizes.
121
Análise Bayesiana para o Estudo de Dados de Fadiga de
Madeira
Silvia Maria Prado
Ufmt-Departamento de Estatı́stica
Mariano Martinez Espinosa
Universidade Federal de Mato Grosso
Lia Hanna Martins Morita
Universidade Federal de Mato Grosso
Carlito Calil Junior
Universidade de São Paulo
Um problema industrial são as falhas do material que podem ocorrer por diversas razões; uma delas é
a fadiga do material. Do número total de falhas, aquelas provocadas por fadiga variam de 50 a 90, sendo
na maioria das vezes falhas que ocorrem de forma inesperada, logo bastante perigosas. O modelo LogLinear da distribuição de Birnbaum-Saunders para variáveis independentes é utilizado para o estudo de
fatiga de materiais. As variáveis foram codificadas utilizando um planejamento fatorial, neste caso elas
podem ser ortogonalizadas possibilitando estimativas mais precisas. Este modelo leva em consideração
caracterı́sticas básicas do processo de fatiga dos materiais, em particular a madeira Eucalyptus grandis.
Foi realizada uma analise Bayesiana, utilizando uma distribuição a priori não informativa Beta para o
parâmetro , e distribuições a priori não informativas gaussiana para os parâmetros . A escolha da priori
Beta foi devido ao fato do parâmetro na pratica variar entre 0 e 1, valores abaixo ou acima deste intervalo,
não condizem com a realidade. Os resultados esperados serão comparados com a teoria Clássica. Os
dados foram obtidos no Laboratório de Madeiras e de Estruturas de Madeira (LaMEM) − EESC − USP.
122
Classificação Bayesiana dos Marcadores Sorológicos das
Doenças do Sangue quanto à Retenção Sorológica na Doação
Sanguı́nea em Pernambuco
Niedja Maristone de Oliveira Barreto Queiroz
Hemope
Eufrázio de Souza Santos
UFRPE
Ana Cristina S. Bezerra
Hemope
Maria Betânia do Amaral Pinto
Hemope
Lucı́lia Maria Dias Lopes
Hemope
Divaldo de Almeida Sampaio
Hemope/ FCM da UPE
A triagem sorológica de doadores de sangue, utilizando a pesquisa de anticorpos contra agentes
infecciosos transmissı́veis; com exceção do teste para Anti-HIV , que no ano de 2006 foi introduzido na
rotina sorológica o teste ELISA (Enzima Imuno Ensaio) combinado, ainda não é totalmente satisfatória,
tendo em vista, o elevado ı́ndice de retenção verificado após a realização dos exames. Dentre os fatores
responsáveis, destacam-se tanto a variação da sensibilidade dos conjuntos diagnósticos utilizados, como
a metodologia empregada na execução desses testes. Com o objetivo de avaliar o desempenho da triagem
sorológica estudou-se as taxas de retenção sorológica dos marcadores das doenças transmissı́veis (HIV,
HTLV, HBsAg, Anti-HBc, HCV, CHAGAS e SÍFILIS), que inapta os doadores de sangue, comparando o
Hemocentro Recife com a rede hemoterápica do Interior do Estado de Pernambuco. Para cada marcador
sorológico, foram analisadas 739.979 amostras, no Laboratório de Sorologia do Doador de Sangue da
Fundação Hemope, no perı́odo de 2003 a 2008. A metodologia utilizada foi o emprego do teste ELISA
para todos os parâmetros, com exceção de sı́filis, o qual é feito pelo método de floculação (VDRL).
Utilizou-se da inferência bayesiana para estimar as taxas de retenção por marcador, comparando um
modelo de efeito fixo com um de efeito aleatório, o software utilizado foi o Winbugs 14, com um burn
de 1000 atualizações seguidos de mais 22.000 atualizações. Observou-se que os dois modelos tiveram a
mesma eficiência, quanto a amplitude dos intervalos de credibilidade. Concluiu-se que a retenção das
amostras de doadores, para todos os parâmetros analisados, é mais expressiva na Capital que no Interior
do Estado, com exceção de Chagas, onde o percentual no Interior é mais elevado. Foi observado que o
anti-Hbc atingiu ı́ndices mais altos de retenção nas duas localidades, seguido do HIV, sı́filis e HBS-Ag, Já
para HTLV e HCV, constata-se tendência de diminuição dos ı́ndices, tanto no Hemocentro Recife como
no Interior do Estado, indicando uma possı́vel queda da prevalência dessas patologias na população ou
uma melhoria na qualidade dos testes utilizados para o diagnóstico, bem como um melhor perfil do
doador de sangue.
123
Uma Abordagem Bayesiana para Modelos Auto-regressivos
Periódicos com Aplicação à Previsão de Vazões Médias Mensais
Ricardo Luis dos Reis
Instituto de Ciências Matemáticas e de Computação - USP
Marinho G. Andrade
Instituto de Ciências Matemáticas e de Computação - USP
Thelma Sáfadi
Departamento de Ciências Exatas - UFLA
Este trabalho apresenta uma abordagem bayesiana para o problema de inferência e previsão dos
modelos auto-regressivos com correlação periódica. Como aplicação, é tratado o problema da previsão
de vazões médias mensais, que é uma ferramenta para o planejamento da operação ótima do sistema
hidrotérmico brasileiro. A abordagem bayesiana proposta considera densidades a priori não informativas
para três modelos propostos (Normal, Log-Normal e t-Student). Esta metodologia é exemplificada com
um conjunto de dados reais, referentes às séries de vazões médias mensais do reservatório de Furnas.
Agradecimentos: Os autores Marinho G. Andrade agradecem à Fapesp. O autor agradece à Fapemig.
124
Análise da Sobremortalidade em Perı́odos Epidêmicos de
Dengue
Camila Maria Casquilho Resende
Universidade Federal do Rio de Janeiro
Dani Gamerman
Universidade Federal do Rio de Janeiro
A incidência de dengue tem aumentado significativamente nas últimas décadas, de acordo com a
Organização Mundial de Saúde, sendo que cerca de dois bilhões e meio de pessoas estão em exposição
ao risco de adquirir a doença. Cada vez mais, a dengue vem se tornando um problema de saúde pública
no mundo, em especial em paı́ses de clima tropical, como é o caso do Brasil.
Este trabalho se propõe a analisar não apenas o número de óbitos causados pela dengue, mas também
o número de óbitos causados por doenças que fazem parte de seu diagnóstico diferencial, na região
metropolitana do Rio de Janeiro, no perı́odo de 1980 a 2008. Esta abordagem é diferente do que é feito
usualmente na literatura, em que se modela o número de casos notificados de dengue.
O objetivo, portanto, é analisar a sobremortalidade em perı́odos epidêmicos de dengue, isto é, verificar
excessos de óbitos não esperados. Para isto, é proposto um modelo dinâmico não-Gaussiano Poisson.
Todo o procedimento de inferência será feito sob o enfoque bayesiano.
125
Construção de Tábuas de Mortalidade de Inválidos através de
Modelos Estatı́sticos Bayesianos
Aloı́sio Joaquim Freitas Ribeiro
Departamento de Estatı́stica da UFMG
Edna Afonso Reis
Departamento de Estatı́stica da UFMG
Joana Barbabela Barbosa
UFMG
Este trabalho teve como objetivo a construção de tábuas de mortalidade de inválidos dos segurados
de clientela urbana do Regime Geral da Previdência Social. Assumindo que o número de mortes em
cada idade segue uma distribuição de Poisson, as taxas de mortalidade por idade simples foram graduadas através de métodos estatı́sticos bayesianos, através do modelo paramétrico de Gompertz-Makehan,
utilizando inferência estatı́stica bayesiana. Foram construı́das tábuas de mortalidade para homens e
mulheres e intervalos de credibilidade para os parâmetros e componentes do modelo, bem como para as
taxas de mortalidade e funções da tábua. Uma aplicação foi feita calculando-se de uma anuidade e o
passivo atuarial.
126
Full Bayesian Significance Test for Extremal Distributions
Laura Leticia Ramos Rifo
Institute of Mathematics, University of Campinas - UNICAMP
Diego Fernando de Bernardini
Institute of Mathematics, University of Campinas - UNICAMP
A new Bayesian measure of evidence is used for model choice within the Generalized Extreme Value
family of distributions, given an absolutely continuous posterior distribution on the related parametric
space. This criterion allows quantitative measurement of evidence of any sharp hypothesis, with no need
of a prior distribution assignment to it.
We apply this methodology to the testing of the precise hypothesis given by the Gumbel model
using real data. Performance is compared to usual evidence measures, such as Bayes factor, Bayesian
information criterion (BIC), deviance information criterion (DIC) and descriptive level for deviance
statistic.
127
Um Procedimento Bayesiano para a Análise de Dados
Longitudinais na Forma de Contagens, com Superdispersão
Fernanda Bührer Rizzato
ESALQ-USP
Clarice Garcia Borges Demétrio
ESALQ-USP
Roseli Aparecida Leandro
ESALQ-USP
Distribuições pertencentes à famı́lia exponencial são ao mesmo tempo convenientes e matematicamente elegantes para análise de dados. Em particular, a distribuição de Poisson, comumente usada na
análise de dados na forma de contagens, tem a restrição de que a variância é igual à média o que se
torna restritivo e causa falta de ajuste. Dois dos principais problemas encontrados na prática são a
presença da variabilidade extra-Poisson (superdispersão), que ocorre quando a variabilidade dos dados
é maior do que a média, e a correlação entre medidas repetidas em um mesmo indivı́duo. Para incluir
a variabilidade extra-Poisson, geralmente, faz-se o uso da distribuição binomial negativa, que pode ser
obtida pela inclusão de um efeito aleatório com distribuição gama multiplicando a média de uma distribuição de Poisson. Para acomodar a correlação entre medidas feitas no mesmo indivı́duo podem-se
incluir efeitos aleatórios no preditor linear com distribuição normal. Essas duas situações podem ocorrer
separadamente ou simultaneamente. Neste trabalho, é feita uma comparação entre diferentes modelos,
usando-se métodos bayesianos hierárquicos baseados em métodos MCMC. São obtidas as expressões
para as distribuições condicionais a posteriori, sendo feita a implementação computacional utilizando o
WinBUGS. Uma aplicação é feita para um conjunto de dados longitudinais de eplepsia.
128
Inferência em Famı́lias Estendidas de Distribuições Normais
Gustavo Henrique M. Assis Rocha
Departamento de Estatı́stica - Universidade Federal de Minas Gerais
Rosangela H. Loschi
Departamento de Estatı́stica - Universidade Federal de Minas Gerais
Reinaldo B. Arellano-Valle
Departamento de Estadı́stica - Pontificia Universidad Católica de Chile
Um dos maiores desafios relacionados à modelagem de dados é encontrar classes de distribuições
flexı́veis o bastante para representar adequadamente diferentes comportamentos dos dados, tais como,
assimetria, bimodalidade, caudas leves e pesadas, curtose, etc. Uma ideia introduzida por Azzalini
(1985) consiste em multiplicar uma função de densidade de probabilidade simétrica por uma função
não negativa que assimetriza tal distribuição. Partindo desta ideia, Azzalini (1985) introduziu a classe
de distribuições normais assimétricas uni variada. Arellano-Valle et al. (2008) propõem uma classe de
distribuições simétricas que possuem menos curtose que a distribuição normal e que podem apresentar
um comportamento bimodal - a classe de distribuições normais bimodais. Como extensão das classes
de Azzalini (Azzalini, 1985) e Arellano-Valle et al. (2008), Elal-Oliveiro et al. (2009) introduziram uma
nova classe de distribuições que englobam formas uni e bimodais, além de assimetria. É a classe de
distribuições normais bimodais assimétricas. Esse trabalho tem como objetivos realizar inferências sobre
o parâmetro de assimetria λ da distribuição normal assimétrica padrão, sobre o parâmetro de forma α
da distribuição normal bimodal padrão e sobre o par (α, λ) da distribuição normal bimodal assimétrica
padrão. Obtiveram-se distribuições a posteriori para os parâmetros de interesse e distribuições preditivas
a priori para os dados considerando distribuições a priori especı́ficas. Averiguou-se que as distribuições
a posteriori para os parâmetros de assimetria e forma da famı́lia normal bimodal assimétrica podem ser
obtidos considerando famı́lias mais simples.
Agradecimentos: Os autores agradecem à FAPEMIG pelo apoio financeiro.
129
Um Novo Modelo para Dependência Espacial
Erica Castillo Rodrigues
Universidade Federal de Minas Gerais (UFMG)
Renato Martins Assunção
Universidade Federal de Minas Gerais (UFMG)
No que se refere ao mapeamento de doenças, o modelo bayesiano proposto por Besag, York e
Mollié(1991), denotado por BYM, é a escolha mais popular para estimar o risco relativo em áreas
pequenas ou para avaliar os efeitos de covariáveis que atuam como substitutos a medidas de exposição.
Um aspecto essencial do modelo BYM que vem sendo pouco estudado é a especificação da estrutura de
vizinhança. Tipicamente ela é especificada com base somente nas relações de adjacência. Existem poucas
justificativas para essa prática além da conveniência e facilidade nos cálculos. Isso justifica a investigação
de modelos mais flexı́veis no que se refere à essa estrutura de vizinhança. Em particular, fazer inferência
sobre tal estrutura pode ser interessante.
Tanto o modelo BYM como outros correntemente utilizados são definidos a partir de distribuições
condicionais. Usualmente, porém, tais distribuições são definidas como função apenas dos vizinhos de
primeira ordem de cada área. Dessa forma, ignora-se toda a informação no mapa que esteja além dessa
vizinhança. A nossa idéia é incluir essa informação nas prioris através das condicionais e, a partir da
atualização dos dados, verificar qual a sua relevância. Isso sugere um modelo mais flexı́vel que os demais
e, portanto, mais adequado a um número maior de situações.
Nesse trabalho exploramos algumas propriedades teóricas do modelo apresentado. Analisamos a
forma das distribuições condicionais a priori, bem como a estrutura de covariância dos efeitos aleatórios
a posteriori. Ajustamos ainda o modelo para um conjunto de dados observados em uma região pequena
e, portanto, relativamente homogênea e modelo conseguiu captar bem essa estrutura de correlação, o que
não ocorre para os demais modelos. Fizemos ainda simulações supondo o risco relativo constante e as
estimativas obtidas a posteriori foram mais precisas que aquelas apresentadas pelos demais. Portanto,
o modelo apresentado pode representar uma alternativa mais flexı́vel do que aqueles que já existem na
literatura sem, porém, perder interpretabilidade dos parâmetros.
Agradecimentos: Os autores agradecem o apoio da FAPEMIG na realização do projeto.
130
Bayesian Analysis of Intervention Model with AR Error
Applied to the IPCA Series
Letı́cia Lima Milani Rodrigues
Universidade Federal de Alfenas - Unifal-MG
Gislene Araújo Pereira
Universidade Federal de Alfenas - Unifal-MG
Deive Ciro de Oliveira
Universidade Federal de Alfenas - Unifal-MG
This study aimed the fit to intervention model with AR error for the series of Index Consumer Price
Index - IPCA, from January 1992 to October 2009, using Bayesian focus. The IPCA Series had one
intervention on June 1994, the launch date of the new currency, the Real. The inference about the
parameters was performed by applying the Gibbs sampler, considering the marginal complete distributions. For the Bayesian analysis of the intervention model with AR (1) error, was used a priori improper
Jeffreys. The analysis was made with 20,000 iterations. To check convergence, we used the method of
graphic techniques and the method proposed by Geweke (1992). The convergence of parameters was
checked by both methods.
131
Distribuição Geométrica Exponencial com Função de Risco
Crescente
Mari Roman
CER-DEs - Universidade Federal de São Carlos
Francisco Louzada-Neto
CER-DEs - Universidade Federal de São Carlos
Vicente Garibay Cancho
ICMC - USP
Este trabalho propõem uma distribuição geométrica exponencial (GED) com função de risco crescente,
como alternativa aos modelos GED propostos por Adamidis & Loukas (1998) e Adamidis et. al (2005).
Realizamos o estudo de um conjunto de dados artificiais, para o qual propomos a abordagem Bayesiana,
via Metropolis-Hasting. Os parâmetros foram transformados para não restringir o espaço paramétrico e
foram consideradas distribuições normais a priori para os mesmos. No processo iterativo considerou-se
burn in de 2000 comintervalo entre os valores gerados de tamanho 160. Foram calculados os intervalos
de credibilidade e HPD, os quais contêm os verdadeiros valores dos parâmetros.
132
Evaluating Spatio-Temporal Models for Crop Yield Forecasting
Using INLA: Implications to Pricing Area Yield Crop
Insurance Contracts
Ramiro Ruiz-Cárdenas
Laboratório de Estatı́stica Espacial, Universidade Federal de Minas Gerais Brazil
Elias Teixeira Krainski
Departmento de Estatı́stica, Universidade Federal do Paraná - Brazil
Area yield crop insurance is a recent insurance product, in which farmers collect an indemnity whenever the county average yield falls beneath a yield guarantee, regardless of the farmers actual yields.
The pricing methodology to this kind of insurance requires the estimation of the expected crop yield at
the county level. This can be done in a hierarchical Bayesian framework via spatio-temporal modelling
of areal crop yield data, which allows estimates of the premium rates be obtained directly from the
posterior predictive distribution of crop yields, capturing inference uncertainties involved in predicting
the insurance premium rates. Inference in this kind of models is typically based on Markov chain Monte
Carlo methods (MCMC), a computer-intensive simulation-based approach. However, these methods suffer from several problems: Computational time is long, parameter samples can be highly correlated and
estimates may have a large Monte Carlo error. Additionally, several models including regional effects as
well as time trends and time-space interactions need to be tested in order to identify the more suitable
one to implement the pricing methodology. This task becomes very time consuming when the number
of areas increases.
A promising alternative to inference via MCMC in latent Gaussian models are the integrated nested
Laplace approximations (INLA) (Rue et al., 2009). The methodology is particularly attractive if the
latent Gaussian model is a Gaussian Markov random field (GMRF). In contrast to empirical Bayes
approaches, the INLA approach incorporates posterior uncertainty with respect to hyperparameters. In
this work, using the INLA approach, several spatio-temporal crop yield models were fitted and compared
using suitable model selection criteria in order to identify the most suitable one to calculate the premium
rate of an areal crop yield insurance contract for corn in Paraná state (Brazil). The results pointed out
INLA as a flexible tool appropriate for fitting and compare a huge number of spatio-temporal crop yield
models in an efficient way.
133
Morbidade Pulmonar e Condições Climáticas: Um Estudo na
Cidade de São Paulo
Thelma Sáfadi
Universidade Federal de Lavras
Airlane Pereira Alencar
Universidade de São Paulo
O modelo fatorial dinâmico cujos fatores seguem um modelo autorregressivo é utilizado para analisar a
associação entre séries climáticas e séries de internação por problemas pulmonares. As séries consideradas
foram taxa de internação por tuberculose, taxa de internação por problemas pulmonares, temperatura
mı́nima, ı́ndice pluviométrico e umidade relativa mı́nima na cidade de São Paulo no perı́odo de Janeiro
de 1998 a Setembro de 2009. Para os dados analisados, foram identificados dois fatores. O primeiro
mostra a associação entre a taxa de tuberculose e a umidade mı́nima, o segundo fator associa a taxa de
internação por problemas pulmonares com as séries de ı́ndices pluviométricos e umidade mı́nima. Para
a série de temperatura mı́nima não foi observada associação com as demais séries analisadas.
Palavras-Chave: Análise Bayesiana, modelo fatorial, morbidade por problemas pulmonares, séries
climáticas.
Agradecimentos: As autoras agradecem a Fapemig e a Capes, projeto Procad 177/2007, o auxilio
financeiro.
134
Considerações Acerca da Influência da Taxa de Câmbio nos
Preços do Petróleo Negociado no Mercado Internacional
André Assis de Salles
Universidade Federal do Rio de Janeiro
O preço do petróleo é muitas vezes uma das variáveis determinantes na formulação da polı́tica
econômica de diversos paı́ses. Assim o conhecimento do processo estocástico que corresponde ao comportamento dos preços do petróleo no mercado internacional é valioso para todos os agentes econômicos.
Uma vez que a flutuação dos preços do petróleo tem influência direta no mercado financeiro global e, por
conseguinte, nas economias nacionais através do financiamento e investimento de atividades produtivas.
Dentre as muitas pesquisas, relacionadas ao tema, algumas procuram estudar a volatilidade dos preços,
ou dos retornos, enquanto outras fatores, ou variáveis, que influenciam o comportamento dos preços.
Uma das variáveis que tem ocupado pesquisadores é a taxa de câmbio. Este trabalho procura investigar
a relação entre as variações da taxa de câmbio US-Euro e os preços do petróleo, dos tipos WTI e Brent,
verificando a sensibilidade dos retornos das cotações do petróleo através de modelos hirárquicos bivariados. A amostra utilizada neste trabalho é de ocorrências das cotações dos preços semanais dos tipos de
petróleo selecionados, pricipais referências do mercado internacional, e da taxa de câmbio, no perı́odo de
janeiro de 2005 até outubro de 2009.
135
Standard Setting for a Rasch Poisson Count Model
Ernesto San Martı́n
Measurement Center MIDE UC & Department of Statistics, Pontificia
Universidad Católica, Santiago, Chile
Luis Mauricio Castro Cepero
Department of Statistics, Universidad de Concepción, Concepción, Chile
Alejandro Jara
Department of Statistics, Universidad de Concepción, Concepción, Chile
Rianne Janssen
Research Group Quantitative Psychology and Individual Differences &
Centre for Educational Effectiveness and Evaluation, K. U. Leuven, Belgium
The purpose of the paper is to look at the classification of the students in a Rasch Poisson count
model on the basis of a standard-setting procedure. More specifically, we are interesting in the estimation
of the number of student reaching the standard. The students are classified into two groups (master and
non-master students) by comparing their estimated abilities with the cut-off. However, in applications
there are almost inevitable concerns about the lack of robustness of resulting inferences with respect to
assumed forms of the distributional component G (Verbeke and Lesaffre, 1996; Heagerty and Kurland,
2001; Agresti et al, 2004). The question, therefore, is how the misspecification of the distribution of the
random-effects (individual abilities) affects on the classification of the students. To answer this question,
we follow a Bayesian semi-parametric approach. It consists in estimating from the data the distribution
G generating the individual abilities. Mixture of Dirichlet Process (MP) (Antoniak, 1974) and Mixture
of Polya Tree Process (MTP) (Lavine, 1992) have been used as nonparametric prior distributions for G.
By doing so, the Bayesian nonparametric approach not only provides an estimation for G, but also a
comparison between such an estimation and the parametric distribution. We compare the nonparametric
alternative with the distribution typically assumed for the random-effects, namely a normal distribution.
The conclusion of this study is that the misspecification of the distribution of the random effects has not
a dramatic impact on the classification of the students. A theoretical justification will be provided.
We will use the information provided by the estimation of G to make a second classification of the
students. In fact, the methodology we develop in this paper uses individual abilities predicted from the
estimation of G. We make comparisons between both classifications.
Finally, the semi-parametric model we are using is an identified model in the sense that the fixed
effects and the distribution generating the random effects are identified by one observation provided two
repeated measures are at least available.
Keywords: Cut-off, Minimally competent student, Rasch Poisson Count Model, Semi-parametric
Bayesian Inference.
136
Distribuições Exponenciais Bivariadas: Uma Aproximação
Bayesiana Usando o Software WinBUGS
Carlos Aparecido dos Santos
Departamento de Estatı́stica
Universidade Estadual de Maringá
Jorge Alberto Achcar
Departamento de Medicina Social
FMRP, Universidade de São Paulo
Neste artigo, apresentamos uma análise Bayesiana para algumas das mais populares distribuições
exponenciais bivariadas introduzidas na literatura: a de Block & Basu, a de Farlie-Gumbel-Morgenstern e
a de Freund; usando métodos de Monte Carlo em Cadeias de Markov (MCMC). Uma grande simplificação
computacional para simular amostras da distribuição a posteriori conjunta de interesse é obtida usando o
software WinBUGS. Também introduzimos uma ilustração numérica considerando os diferentes modelos.
Palavras-chave: distribuições de sobrevivência bivariadas, software WinBUGS, observações correlacionadas, “fragilidades”, análise Bayesiana.
137
Modelo Logı́stico Misto com Classes de Distribuições mais
Flexı́veis para os Efeitos Aleatórios
Cristiano de Carvalho Santos
Departamento de Estatı́stica - UFMG
Rosângela Helena Loschi
Departamento de Estatı́stica - UFMG
Dados binários frequentemente ocorrem em diversas áreas da ciência, como por exemplo, nas pesquisas
médicas, sociais, econômicas e na agricultura. O Modelo de Regressão Logı́stica é um método muito útil
e efetivo que leva em consideração uma relação não linear entre uma resposta binária e um conjunto
de variáveis explicativas. Esse modelo pode ser estendido, através da introdução de um termo de efeito
aleatório, com o objetivo de estudar a relação entre uma resposta binária e um conjunto de variáveis
explicativas quando estes resultados binários não são independentes, ou para acomodar uma eventual
variabilidade extra, ou ainda para representar o efeito das variáveis explicativas que não foram medidas.
Assume-se, em geral, que os efeitos aleatórios são normalmente distribuı́dos e independentes. Neste
trabalho pretende-se considerar classes mais flexı́veis de distribuições para os efeitos aleatórios, entre estas
consideramos a distribuição normal assimétrica e a distribuição t de Student. Utilizamos a abordagem
Bayesiana para o ajuste do modelo de Regressão Logı́stica com efeito aleatório e através de métodos
de simulação Monte Carlo via Cadeia de Markov (MCMC) encontramos amostras das distribuições a
posteriori para os parâmetros do modelo e para as quantidade de interesse que são obtidas em função
destes parâmetros, como por exemplo, a Razão de Chances entre dois indivı́duos. Com estas amostras
encontramos estimativas a posteriori para os parâmetros de interesse e demais quantidades de interesse.
Para dados reais, comparamos os modelos ajustados através de medidas que avaliam a capacidade de
predição do modelo, como por exemplo, a taxa de classificação correta. Através de um estudo de
simulação avaliamos as consequências da má-especificação da distribuição de probabilidades para o efeito
aleatório.
138
Comparison of Classical and Bayesian Approaches for
Intervention Analysis in Structural Models
Thiago R. Santos
Departamento de Estatı́stica, UFMG
Glaura da Conceição Franco
Departamento de Estatı́stica, UFMG
Dani Gamerman
Departamento de Métodos Estatı́sticos, UFRJ
This paper provides comparisons of the classical and Bayesian approaches to estimation and prediction
on intervention models. In this work, transfer functions are used to model different forms of intervention
to the mean level of a time series into the framework of state-space or structural models. Two canonical
forms of intervention are considered: pulse and step functions. Also, the models considered allow for static
and dynamic explanation of the intervention effects. Classical inference for these models is introduced
and comparison between the two approaches, classical and Bayesian, is performed through Monte Carlo
simulation. Bootstrap and MCMC methods are used for approximate classical and Bayesian inferences,
respectively. Results are compared in terms of point and interval estimation. Point estimation shows
that the maximum likelihood and the posterior mode estimators perform better than posterior mean and
median. Interval estimation shows that Bayesian credibility intervals perform better than the respective
classical confidence intervals.
139
Metodologia Bayesiana para Detecção de Itens Assimétricos em
Modelos da Teoria de Resposta do Item
Vera Lúcia Filgueira dos Santos
UFRJ
Dani Gamerman
UFRJ
Tufi Machado Soares
UFJF
A Teoria de Resposta ao Item (TRI) para respostas dicotômicas considera, em geral, um conjunto de
J itens aplicados a I indivı́duos. Os modelos simétricos mais utilizados para descrever a probabilidade
de resposta correta a tais itens, também conhecidos como Curvas Caracterı́sticas dos Itens (CCI), são as
distribuições Normal e Logı́stica. Esses modelos levam em conta os parâmetros dos itens (a discriminação,
a dificuldade e a probabilidade de acerto ao acaso) e a habilidade ou traço latente dos indivı́duos para
caracterizar tais probabilidades. Entretanto, à medida que o uso da TRI cresce, surgem algumas questões,
como por exemplo, se as CCI’s simétricas comumente utilizadas são adequadas.
O principal objetivo deste trabalho é propor generalizações do modelo simétrico de três parâmetros, onde um parâmetro de assimetria é incorporado com o intuito de permitir formas mais gerais
para as CCI’s. Tais generalizações diferem entre si na modelagem deste parâmetro: em uma delas,
um mecanismo para detecção de itens assimétricos será considerado. Estudos simulados serão feitos
utilizando metodologia Bayesiana e implementando via métodos MCMC. Posteriormente, um conjunto
de dados reais será analisado.
140
Clustering Gene Expression Data using a Split-Merge-Birth
Procedure
Erlandson Ferreira Saraiva
Departamento de Estatı́stica, Universidade Federal de São Carlos
Luı́s A. Milan
Departamento de Estatı́stica, Universidade Federal de São Carlos
The DNA arrays technology has become an important tool for genomic research due its capacity of
measuring simultaneously the expression levels of a great number of genes or fragments of genes in different experimental conditions. An important point in gene expression data analysis is the identification of
clusters of genes which present similar expression levels since it may help biologists to identify possible
relationships among genes. We propose a new procedure for estimating the mixture model for clustering
of gene expression data. The proposed method is a posterior split-merge-birth MCMC procedure which
does not require the specification of the number of components. The split-merge movements are proposed
directly in the configuration of the latent variables and are accepted according to the Metropolis-Hastings
probability. These movements allows a major change in configuration of latent variables in a single iteration of the algorithm, avoiding possible local modes. The birth movement is obtained from the update
procedure of the latent variables and occurs whenever an observation determines a new cluster. The
performance of the method is verified using two syntectic data sets and a real data set.
141
Modelos Espaço-Temporais para Dados Temporalmente
Agregados
Alexandre Sousa da Silva
Instituto de Matemática - UFRJ
Alexandra Mello Schmidt
Instituto de Matemática - UFRJ
Paulo Justiniano Ribeiro Jr.
Laboratório de Geoestatı́stica e Geoinformação - UFPR
O principal objetivo deste trabalho é considerar modelos para observações agregadas no tempo e
desalinhadas no espaço. O estudo é motivado por um experimento de monitoramento da popula ção de
ovos do mosquito Aedes aegypti transmissor da dengue, capturados através de armadilhas de oviposição.
Os dados foram coletados no escopo projeto SAUDAVEL, em bairros selecionados da cidade de Recife,
PE, por um perı́odo de dois anos em um esquema amostral em que 25% das armadilhas eram monitoradas
a cada semana.
Assuma que observações são feitas em n localizações fixas de uma região de interesse, a cada instante
de tempo t. Em particular, a cada tempo t, apenas 25% das n localizações são visitadas. Portanto, todas
as localizações são visitadas em ciclos de 4 instantes de tempo. Dessa forma, a cada visita, observamos
o valor acumulado do processo nos últimos K = 4 instantes de tempo.
Considere Yt (s) como sendo a observação feita no tempo t e localização s, s ⊂ R2 . De fato, Yt (s) =
PK
w=1 YKt−w+1 representa o total observado num perı́odo acumulado de K instantes de tempo. Nosso
objetivo é propor modelos que peguem informação emprestada ao longo do tempo e do espaço, obtendo
assim estimativas do processo em locais e instantes não observados. Para capturar a estrutura temporal
utilizamos modelos dinâmicos espacialmente estruturados. Inicialmente são consideradas as coletas em
um dos bairros estudados e extensões incluem a incorporaç ao de informac̃c oes espec ı́ficas de cada
armadilha e atributos meteorológicos.
142
Medidas de Associação em Tabelas de Contingência: Uma
Abordagem Genuinamente Bayesiana
Patrı́cia Viana da Silva
Departamento de Estatı́stica - Universidade de São Paulo
Victor Fossaluza
Departamento de Estatı́stica - Universidade de São Paulo
Carlos Alberto de Bragança Pereira
Departamento de Estatı́stica - Universidade de São Paulo
O estudo da associação entre variáveis categóricas é um assunto de grande interesse na inferência
estatı́stica. A abordagem frequentista para esse problema usualmente limita-se a um teste de hipóteses
baseado na estatı́stica de qui-quadrado, onde a conclusão é se existe ou não independência entre as
variáveis. Contudo, muitas vezes o interesse do pesquisador é estudar a força e o sentido dessa associação
e, nesse contexto, muitas medidas de associação foram propostas na literatura estatı́stica. O objetivo
deste trabalho é estudar as propriedades de algumas dessas medidas por meio de exemplos. Serão
apresentadas estimativas pontuais, intervalos de credibilidade e testes de hipóteses para essas medidas
sob a abordagem bayesiana.
143
Comparação de Modelos para a Identificação de um Ponto de
Mudança em Retornos de Mercados Emergentes
Vanessa Loureiro Silva
Departamento de Estatı́stica, ICEx, UFMG
Rosângela Helena Loschi
Departamento de Estatı́stica, ICEx, UFMG
Normalidade e estrutura regular ao longo do tempo podem ser fortes suposições para conjuntos de
dados provindos de diversas áreas de aplicação. Na área financeira, por exemplo, sabe-se que mercados
emergentes são mais suscetı́veis ao cenário polı́tico do que mercados desenvolvidos. Nestes casos, as
distribuições empı́ricas dos retornos desses mercados de valores freqüentemente exibem assimetria, bem
como mudanças estruturais.
De trabalhos anteriores, como Rocha (2007) e Castro et. al (2008), observou-se que a classe de
distribuições normais assimétricas, associada ou não à teoria de pontos de mudança, pode ser uma
boa alternativa para a modelagem de retornos de mercados emergentes. Os modelos disponı́veis na
literatura identificam pontos de mudança, no máximo, no parâmetro de assimetria da distribuição dos
retornos. Sabe-se, contudo, que os retornos também apresentam mudanças estruturais no valor médio e
na volatilidade (medida através da variância).
Neste trabalho, propomos um modelo bayesiano mais flexı́vel para os dados de retornos emergentes
que os apresentados na literatura, baseado na distribuição normal assimétrica com um ponto de mudança,
e comparamos todos os modelos, via medidas Bayesianas. Para os modelos com ponto de mudança, testase se realmente houve mudança nos parâmetros de interesse através do Teste de Significância Bayesiano
Completo (FBST).
144
Redes Bayesianas KDB Aplicadas à Credit Scoring
Anderson Luiz de Souza
Centro de Estudos do Risco - CER, DEs UFSCar
Francisco Louzada-Neto
Centro de Estudos do Risco - CER, DEs UFSCar
Luis Aparecido Milan
Centro de Estudos do Risco - CER, DEs UFSCar
O processo de avaliação de risco de crédito tem sido um interesse comum entre os pesquisadores. Neste
contexto, temos o interesse de identificar clientes bons e maus pagadores através de métodos de classificação binária. Assim, em diversas instituições financeiras, técnicas como análise discriminante, análise
probito, regressão logı́stica e redes neurais podem ser utilizadas para modelar esse tipo de problema.
Alternativamente, a técnica de Redes Bayesianas tem se mostrado um método prático de classificação e
com aplicações bem sucedidas em diversos campos. Assim, neste trabalho, visamos exibir a aplicação das
Redes Bayesianas com k-dependência, também conhecidas como redes KDB, e comparar seu desempenho
com as técnicas convencionais aplicadas no contexto de Credit Scoring. Desta forma, exibiremos como
resultado aplicações da técnica baseadas em conjuntos de dados reais e artificiais.
145
Modelos Multivariados de Regressão Beta para Estimação em
Pequenas Áreas
Debora Ferreira de Souza
Departamento de Métodos Estatı́sticos - UFRJ
Fernando Antonio da Silva Moura
Departamento de Métodos Estatı́sticos - UFRJ
Neste trabalho são propostos modelos de regressão multivariada em nı́vel de área, onde as variáveis
dependentes (Y1 , ..., Yk ) são restritas ao intervalo (0, 1), seguem distribuição beta e representam taxas,
proporções e ı́ndices estimados em pequenas áreas com base no desenho de uma pesquisa amostral. O
primeiro modelo utiliza funções de cópulas para construir a distribuição conjunta das variáveis resposta,
enquanto a segunda proposta faz uso de efeitos aleatórios correlacionados. Ambos modelos são estimados
sob enfoque Bayesiano e os resultados dos ajustes dos modelos multivariados são comparados àqueles
fornecidos pelas regressões individuais.
146
Measuring the Cost Efficiency of Brazilian Electricity
Distribution Utilities by Bayesian SFA Models
Marcus Vinicius Pereira de Souza
PUC-RJ − Pontifı́cia Universidade Católica do Rio de Janeiro
Reinaldo Castro Souza
PUC-RJ − Pontifı́cia Universidade Católica do Rio de Janeiro
Madiagne Diallo
PUC-RJ − Pontifı́cia Universidade Católica do Rio de Janeiro
Tara Keshar Nanda Baidya
PUC-RJ − Pontifı́cia Universidade Católica do Rio de Janeiro
This paper shows efficiency indices for 60 Brazilian electricity distribution utilities. The efficiency
scores are obtained by Bayesian Stochastic Frontier Analysis (BSFA) models. In this specification, it
is possible to reduce the information asymmetry and improving the regulator’s skill to compare the
performance of the utilities, a fundamental procedure in incentive regulation squemes.
147
Estimação Bayesiana em Modelos de Regressão Beta
Mariana Albi de Oliveira Souza
Universidade Federal do Rio de Janeiro
Helio dos Santos Migon
Universidade Federal do Rio de Janeiro
Cibele Q. Silva
Universidade de Brası́lia
Modelos de regressão são amplamente utilizados em diversas áreas de conhecimento pois contemplam
situações em que a resposta de interesse depende de um conjunto de variáveis explicativas. Em particular, modelos lineares normais são os mais comumente utilizados na literatura, porém nem sempre são
adequados por não contemplarem situações tais como assimetria, domı́nios limitados, etc.
Como alternativa a estes modelos, trataremos do modelo de regressão beta. Neste, assumiremos
respostas contı́nuas restritas ao intervalo (0, 1) modeladas através de distribuições beta cujas médias
dependem de variáveis explicativas através de uma função de ligação. Além de acomodar assimetrias
devido a flexibilidade desta famı́lia de distribuições, este modelo é especialmente interessante para análise
de taxas, percentuais e proporções.
Abordaremos tal modelo através de uma perspectiva Bayesiana, apresentando diferentes métodos
de estimação e comparando os resultados. Em particular, estimativas serão obtidas tanto através de
estratégias numéricas, com a utilização de métodos de Monte Carlo via cadeias de Markov, quanto através
de aproximações analı́ticas, com a utilização do INLA (Integrated Nested Laplace Approximation).
Exemplos com dados simulados e dados reais serão apresentados com o intuito de ilustrar os métodos.
148
Estimando o Risco na Concessão de Empréstimo Pessoal
através da Regressão Logı́stica Bayesiana
Shirlaine Moraes e Souza
Faculdade de Estatı́stica, Instituto de Ciências Exatas e Naturais, UFPA
Gilson Pereira Prata
Faculdade de Estatı́stica, Instituto de Ciências Exatas e Naturais, UFPA
Maria Regina Madruga
Faculdade de Estatı́stica, Instituto de Ciências Exatas e Naturais, UFPA
O modelo de Regressão Logı́stica Dicotômica foi ajustado a dados de uma instituição financeira
relacionados a 527 clientes que tomaram empréstimo pessoal, observando-se como variável resposta a
ocorrência ou não de atraso em alguma parcela. Foram utilizadas prioris não-informativas no processo
de estimação Bayesiano, realizado no software Winbugs. Com o objetivo de prever riscos na concessão
de empréstimo a clientes, o modelo ajustado detectou duas covariáveis significativas: renda do cliente e
número de parcelas do empréstimo. A amostra utilizada foi dividida em duas partes: uma amostra de
467 clientes, selecionados aleatoriamente, foi usada na estimação dos parâmetros do Modelo de Regressão
Logı́stica, e a amostra restante, com 60 clientes, foi usada para fazer a validação do modelo ajustado.
149
Previsão de Resultados de Jogos de Futebol com o Uso de um
Painel de Especialistas: Uma Abordagem Bayesiana
Adriano Kamimura Suzuki
Universidade Federal de São Carlos
Luis Ernesto Bueno Salasar
Universidade Federal de São Carlos
José Galvão Leite
Universidade Federal de São Carlos
Francisco Louzada Neto
Universidade Federal de São Carlos
Neste trabalho propomos uma abordagem Bayesiana para previsão dos resultados dos jogos da Copa
do Mundo de 2006 utilizando os escores da FIFA para quantificar a qualidade técnica das equipes e a
distribuição a priori obtida por meio de um painel de especialistas. Assumimos que o número de gols
de uma equipe em uma partida de futebol tem distribuição de Poisson. Como aplicação, calculamos a
probabilidade de cada seleção obter vitória, empate e derrota em uma partida, de classificação para a
fase seguinte e de ser campeã.
150
Bayesian Selection for Heston Models with Volatilities
Determined by Fourier Series Method
Rodrigo dos Santos Targino
UFRJ - Brazil
Yuri F. Saporito
IMPA - Brazil
Milan Merkle
University of Belgrade - Serbia
The aim of this work is to present a methodology of comparison of two diffusion models based on
a continuous version of the Bayes Factor. This method is strongly dependent on the estimate of the
instantaneous volatility and since it is well known that the classical estimate becomes unstable for nonconstant diffusion coefficients, a different approach is proposed. The method proposed for estimation
of the volatility is the Fourier Series Method of Malliavin and Mancino. As an application of this
methodology we present a simulated example based on the well known Heston Stochastic Volatility
Model.
151
Uma Abordagem Bayesiana para Modelos de Intensidades
Hı́bridos com Termos de Fragilidades e Estresse Limiar
Cynthia A. V. Tojeiro
CER-DEs-UFSCar
Francisco Louzada-Neto
CER-DEs-UFSCar
Gleici S. C. Perdoná
HC-FMRP-USP
Neste trabalho propomos uma extensão dos modelos de riscos hı́bridos com threshold stress (Tojeiro
e Louzada-Neto, 2009), os quais generalizam os modelos de riscos proporcionais de Cox e os de taxa
de falha acelerada, introduzindo na função de risco do modelo efeitos aleatórios, também conhecidos
como termos de fragilidade, com o objetivo de captar uma possı́vel dependência e heterogeneidade não
observada em dados de sobrevivência. Em termos estatı́sticos, um modelo de fragilidade pode ser visto
como um modelo de efeitos aleatórios para dados de eventos recorrentes no tempo, onde o efeito aleatório
tem um efeito multiplicativo na função de risco base. Quando mais de um tempo de sobrevivência é
observado para cada indivı́duo e para os quais a suposição de dependência é válida, temos dados de
sobrevivência multivariados. No caso univariado, onde cada indivı́duo tem sua própria fragilidade, o
efeito aleatório é introduzido para que se possa medir uma possı́vel heterogeneidade, de modo que a
influência de covariáveis não observadas, possa ser identificada.
A metodologia é ilustrada com dados de sobrevivência univariados, para descrever a influência de
covariáveis não observadas (heterogeneidade), em um conjunto de dados de pacientes com câncer de
mama do HC-FMRP USP. Através do Threshold Stress obtemos a dose de docetaxel a qual deve ser
aplicada as pacientes em fase de quimioterapia. Além disso mostramos através de um conjunto de
dados artificiais, a probabilidade de cobertura dos parâmetros envolvidos em diferentes tamanhos de
amostras, onde observa-se que, em tamanhos de amostras pequenos ou moderados, a inferência clássica
não funciona muito bem, o que nos leva a considerar a abordagem Bayesiana como uma alternativa. A
vantagem dessa abordagem é também eliminar o problema da verossimilhança a qual fica condicionada
ao termo aleatório, o que não ocorre na inferência Bayesiana.
152
Distribuição a Posteriori de Referência Log-Gama Negativa
para a Função de Sobrevivência do Modelo Exponencial
Vera Lucia D. Tomazella
Universidade Federal de São Carlos
Mayara Piani Luna da Silva
Universidade Federal de São Carlos
Camila Bertini Martins
Universidade Federal de São Carlos
Neste artigo estudamos sob a perspectiva de análise de referência Bayesiana objetiva a construção
da priori e posteriori de referência para a função de sobrevivência do modelo exponencial. A análise de
referência Bayesiana introduzida por Bernardo (1979) é um método de produzir afirmações inferênciais
que dependem apenas do modelo assumido e dos dados observados. O objetivo é encontrar uma especı́fica função a priori de referência para os parâmetros desconhecidos do modelo e uma distribuição a
posteriori de referência, a qual será dominada pelos dados observados. As distribuições a posteriori de
referência são obtidas através do uso formal do teorema de Bayes com a função a priori de referência,
onde os resultados encontrado neste trabalho conduziu a distribuições a priori e a posteriori conhecidas
na literatura podendo, estas serem utilizadas para estimações dos parâmetros de interesse.
Palavras-Chave: Análise de referência bayesina objetiva, Priori de referência, Função de sobrevivência, Modelo exponencial.
153
Análise Bayesiana do Modelo Log-Binomial: Comparação
Empı́rica de Três Prioris Não-Informativas
Vanessa Bielefeldt Leotti Torman
Departamento de Estatı́stica e Programa de Pós-Graduação em
Epidemiologia - UFRGS
Suzi Alves Camey
Departamento de Estatı́stica e Programa de Pós-Graduação em
Epidemiologia - UFRGS
O modelo log-binomial modela a relação entre um desfecho dicotômico e preditores (contı́nuos ou
não), com a vantagem de estimar diretamente o risco relativo (RR), medida de grande interesse em
epidemiologia. Entretanto, este modelo não é comumente utilizado pois os programas usuais de análise
clássica frequentemente enfrentam problemas de convergência do algoritmo de maximização da verossimilhança. Neste trabalho, fez-se a análise Bayesiana do modelo log-binomial através do WinBUGS para
um conjunto de dados onde os programas SAS e R não convergem. Três prioris não-informativas foram
utilizadas. A abordagem Bayesiana para o modelo log-binomial superou facilmente a dificuldade de convergência. Entre as três prioris propostas, a priori Uniforme teve o pior desempenho, recomendando-se
assim a priori Normal ou dflat.
154
Modelos para Dados Categóricos com Estrutura Temporal
Patrı́cia Lusie Coelho Velozo
Universidade Federal do Rio de Janeiro
Alexandra Mello Schmidt
Universidade Federal do Rio de Janeiro
Neste trabalho estamos interessadas em modelar categorias de quantidade de chuva. Neste caso,
não estamos interessadas em quanto choveu, mas se choveu muito ou pouco, isto é, desejamos apenas
apontar perı́odos de chuva intensa ou de seca. A chuva categorizada é uma variável discreta e ordinal.
Utilizamos a temperatura e a umidade como variáveis explicativas do modelo. Pode-se supor que existe
uma variável latente contı́nua. Esta variável contı́nua é dividida em intervalos e cada intervalo representa
uma categoria. Estas categorias representam a variável resposta. Incluindo esta variável na modelagem,
a estimação dos parâmetros torna-se mais simples. Em geral, supõe-se que a distribuição desta variável
contı́nua é uma distribuição normal. Porém, no caso da chuva, esta variável representa a quantidade de
chuva em um determinado perı́odo. Logo, esta variável é não-negativa e inflacionada de zeros. Portanto,
não é razoável supor uma distribuição normal. Neste trabalho, propomos que uma transformação desta
variável latente possui distribuição normal. O enfoque do trabalho é Bayesiano e o modelo é ajustado
usando MCMC.
155
Desempate Técnico
Filipe Jaeger Zabala
Departamento de Estatı́stica - Universidade Federal de São Paulo
Sérgio Wechsler
Departamento de Estatı́stica - Universidade Federal de São Paulo
Neste trabalho faz-se uma comparação entre as inferências bayesiana e frequentista para a estimação
de proporções em um processo eleitoral brasileiro. Foi feito um contraponto entre as probabilidades a
posteriori bayesianas e os intervalos/regiões de confiança frequentistas. Mostrou-se que os intervalos de
confiança apresentados pelos institutos de pesquisa brasileiros não possuem a confiança que afirmam ter,
levando o autor a desenvolver uma metodologia alternativa, denominada neste trabalho como frequentista
correta. De posse das abordagens bayesiana, frequentista correta e dos institutos, encontrou-se um
teorema – em um cenário com dois candidatos – que relaciona intervalos de confiança frequentistas com
probabilidades a posteriori bayesianas. Para três candidatos são apresentados exemplos que contradizem
a noção de empate técnico definida pelos intitutos, largamente veiculada nos meios de comunicação.
156
Modelling Disease Risk Space-Time Interaction
Patricia Klarmann Ziegelmann
Federal University of Rio Grande do Sul, Brazil
Nicky Best
Imperial College London, United Kingdom
Sylvia Richardson
Imperial College London, United Kingdom
The use of Bayesian hierarchical models has become widespread in disease mapping. Abellan et al.
(2008) both present a model that incorporates a space-time interaction and propose a mixture prior for
those parameters that helps in classifying areas with localized excess risk. In this paper we present this
model and investigate its performance in the context of Poisson variability. We use a comprehensive set
of simulations where the number of expected events per area-time was fixed between 4 and 18. As a
result we found that the mixture prior is appropriated to classify areas with unstable pattern over time
when Poisson variability is considered in the first stage of the hierarchical model.
157
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
21 a 24 de março de 2010
March 21 to 24, 2010
E-mail dos Participantes
E-mail of Participants
158
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
E-mail dos Participantes
E-mail of Participants
Adriana Strieder Philippsen
Adriano Kamimura Suzuki
Alan E. Gelfand
Alessandro Jose Queiroz Sarnaglia
Alexandra Mello Schmidt
Alexandre Sousa da Silva
Aline Araújo Nobre
Ana Carolina Carioca da Costa
Anderson Luiz de Souza
Anthony O’Hagan
Antônio Eduardo Gomes
Aparecida Doniseti Pires de Souza
Basilio de Braganca Pereira
Caio Lucidius Naberezny Azevedo
Camila Maria Casquilho Resende
Carlos Alberto de Bragança Pereira
Carlos Antonio Abanto-Valle
Carlos Aparecido dos Santos
Carlos M. Carvalho
Caroline Cavatti Vieira
Celso Rômulo Barbosa Cabral
Cibele Queiroz da Silva
Clarice Garcia Borges Demétrio
Cléber da Costa Figueiredo
Cleber Nascimento do Carmo
Cleyton Zanardo de Oliveira
Cristiano de Carvalho Santos
Cynthia Arantes Vieira Tojeiro
Daiane Aparecida Zuanetti
Dani Gamerman
Debora Ferreira de Souza
Eder Angelo Milani
Edna Afonso Reis
Eduardo Yoshio Nakano
Elias Teixeira Krainski
Erica Castilho Rodrigues
Erlandson Ferreira Saraiva
Estelina Serrano de M. Capistrano
Esther Salazar Gonzales
Eufrázio de Souza Santos
Fábio Nogueira Demarqui
Fernanda Bührer Rizzato
Fernanda Gomes de Oliveira
USP
UFSCar
Duke, USA
UFMG
UFRJ
UFRJ
Fiocruz
UFRJ
UFSCar
Sheffield, UK
UnB
UNESP
UFRJ
Unicamp
UFRJ
USP
UFRJ
UEM
Chicago, USA
UFMG
UFAM
UnB
ESALQ/USP
ESPM e EESP/FGV
UFRJ e ENSP/Fiocruz
UFSCar
UFMG
UFSCar
Itaú Unibanco
UFRJ
UFRJ
UFSCar
UFMG
UnB e USP
UFPR
UFMG
UFSCar
UFRJ
Duke, USA
UFRPE
UFMG
ESALQ/USP
ITA
159
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
ericaa [email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
E-mail dos Participantes
E-mail of Participants
Fernando Antônio da Silva Moura
Fernando Antônio Moala
Fernando Ferraz do Nascimento
Fidel Ernesto Castro Morales
Flavio Augusto Ziegelmann
Flávio Bambirra Gonçalves
Fortunato Silva de Menezes
Francisco Louzada-Neto
Frederico Zanqueta Poleto
Gareth Roberts
Gilberto de Araujo Pereira
Gislene Araujo Pereira
Gladys Dorotea Cacsire Barriga
Guilherme Biz
Havard Rue
Heleno Bolfarine
Helio dos Santos Migon
Ingrid Brizotti
Jacqueline Alves Ferreira
João Batista de Morais Pereira
Jorge A. Achcar
Jorge Luis Bazán
José Carlos S. de Miranda
Josemar Rodrigues
Josiane da Silva Cordeiro
Juan Carlos Vivar Rojas
Juliana Cobre
Juliana Garcia Cespedes
Júlio César Pereira
Julio Michael Stern
Kelly Cristina Mota Gonçalves
Larissa de Carvalho Alves
Laura L. R. Rifo
Leonardo S. Bastos
Leonardo da Cruz Nassif
Letı́cia Cavalari Pinheiro
Leticia Lima Milani
Lia Hanna Martins Morita
Magda Carvalho Pires
Marcelo Azevedo Costa
Marcelo de Souza Lauretto
Márcia D’Elia Branco
Marcia Helena Barbian
UFRJ
UNESP
UFRJ
UFRJ
UFRGS
Warwick, UK
UFLA
UFSCar
USP
Warwick, UK
UFSCar e UFTM
UNIFAL
UNESP
ESALQ/USP
NTNU, NO
USP
UFRJ
Itaú Unibanco
UFMG
UFRJ
USP
PUCP, Perú
USP
UFSCar
UFRJ
Duke, USA
UFSCar
UNIFEI
UFSCar
IME/USP
UFRJ
UFRJ
Unicamp
Sheffield, UK
UFRJ
UFMG
UNIFAL
UFMT
UFMG
UFMG
EACH / USP
USP
UFMG
160
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
pereira [email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
E-mail dos Participantes
E-mail of Participants
Marco A. R. Ferreira
Marco A. Rodrı́guez
Marcos Henrique Cascone
Marcus Vinicius Pereira de Souza
Mari Roman
Maria Soledad Torres Dı́az
Mariana Albi de Oliveira Souza
Mariane Branco Alves
Marilia Sa Carvalho
Marina S. Paez
Maristela Dias de Oliveira
Matt A. Taddy
Mauricio Castro
Maximo Concepción Mitacc Meza
Mayna Dias Justa Pereira Bastos
Nancy L. Garcia
Neale Ahmed El Dash
Nick Polson
Niedja Maristone de O. B. Queiroz
Patricia Klarmann Ziegelmann
Patricia Lusie Coelho Velozo
Paula Virgı́nia Tófoli
Paulo César de Resende Andrade
Paulo Henrique Ferreira da Silva
Rafael Braz Azevedo Farias
Rafael Izbicki
Ramiro Ruiz Cárdenas
Raquel de Vasconcellos C. de Oliveira
Renata Souza Bueno
Renato Martins Assuncao
Renato Nunes Pereira
Ricardo Luis dos Reis
Ricardo Sandes Ehlers
Rodrigo dos Santos Targino
Ronaldo Dias
Rosangela Helena Loschi
Roseli Aparecida Leandro
Rubens de Melo Marinho Jr.
Rubiane Maria Pires
Sandra Cristina de Oliveira
Shane T. Jensen
Sheila Klem Rodrigues das Neves
Silvia Emiko Shimakura
Missouri, USA
UQTR, Canada
UFSCar
PUC-RJ
UFSCar
UV, Chile
UFRJ
UERJ
Fiocruz
UFRJ
UFMG
Chicago, USA
UDEC, Chile
ULIMA, Perú
UFRJ
Unicamp
USP
Chicago, USA
Hemope
UFRGS
UFRJ
UFRGS
UFVJM
UFSCar
USP
USP
UFMG
Fiocruz
UFRJ
UFMG
ESALQ/USP
USP
USP
UFRJ
Unicamp
UFMG
ESALQ/USP
ITA
UFSCar
UNESP
Penn, USA
UFRJ
UFPR
161
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
mariana [email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
ramiro [email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
10o Encontro Brasileiro de Estatı́stica Bayesiana
10th Bayesian Statistics Brazilian Meeting
E-mail dos Participantes
E-mail of Participants
Silvia Maria Prado
Silvio Sandoval Zocchi
Teresa Cristina Martins Dias
Thais Cristina Oliveira da Fonseca
Thelma Safadi
Thiago Guerrera Martins
Tufi Machado Soares
Valmária Rocha da Silva Ferraz
Vanessa Bielefeldt Leotti Torman
Vanessa Loureiro Silva
Vera Lucia Damasceno Tomazella
Vicente Garibay Cancho
Victor Fossaluza
Vinicius Fernando Calsavara
Vinicius Pinheiro Israel
Wellington Betencurte da Silva
UFMT
ESALQ/USP
UFSCar
Warwick, UK
UFLA
UFRJ
UFJF
UFRJ
UFRGS
UFMG
UFSCar
USP
USP
UFSCar
UFRJ
COPPE/UFRJ
162
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
Download

do Livro de Resumos completo