Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Aula 1: Introdução à Modelagem
SER-202 Estatística: Aplicações ao Sensoriamento Remoto
Thiago S. F. Silva [email protected]
23/04/2013
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
1 Apresentações
2 Informações Gerais
3 Modelagem Estatística
4 Discussão - Gigerenzer et al. (2004)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Quem sou eu?
Thiago Sanna Freire Silva
Graduado em Biologia pela UFRN em 2002
Mestre em Sensoriamento Remoto pelo INPE em 2004
Doutor em Geografia Física pela UVic (Canada) em 2009
Bolsista de Pós-doutorado FAPESP
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Quem sou eu?
Thiago Sanna Freire Silva
Graduado em Biologia pela UFRN em 2002
Mestre em Sensoriamento Remoto pelo INPE em 2004
Doutor em Geografia Física pela UVic (Canada) em 2009
Bolsista de Pós-doutorado FAPESP
Área de Atuação
Sensoriamento Remoto Multisensor (Óptico + SAR)
Ecologia de Ecossistemas e da Paisagem
Áreas Úmidas (Wetlands) Tropicais
Impactos Antrópicos e Mudanças Climáticas
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Quem são vocês?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
INFORMAÇÕES GERAIS
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Avaliações
Exercícios Semanais: 30%
Prova/Trabalho Final: 70%
Nota Final
NotaFinal =
(NotaCamilo + NotaThiago)
2
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Avaliações
Exercícios Semanais: 30%
Prova/Trabalho Final: 70%
Nota Final
NotaFinal =
(NotaCamilo + NotaThiago)
2
Obs 1: Please, identifiquem-se no nome do arquivo (ex:
thiago_sanna_exercicio_1.pdf)
Obs 2: Please x 2, usem o seu e-mail do INPE para enviar o
trabalho (filtro de e-mails)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Mudanças de Horários
AGU Americas - 14/05/2013 (Ter?a) e 16/05/2013 (Quinta)
Concurso - ????
SORRY!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que usar R?
R: Pacote para análise e programação
estatística
Livre, gratuito, tem se tornado
“padrão” para análises científicas
Difícil no início, mas o tempo é
recuperado depois
Programação = liberdade
Todos os exemplos desta parte do
curso serão dados em R
Assume-se que todos tenham
instalado o R 3.0 e a interface
RStudio
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que usar R?
R: Pacote para análise e programação
estatística
Livre, gratuito, tem se tornado
“padrão” para análises científicas
Difícil no início, mas o tempo é
recuperado depois
Programação = liberdade
Todos os exemplos desta parte do
curso serão dados em R
Assume-se que todos tenham
instalado o R 3.0 e a interface
RStudio
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que usar R?
R: Pacote para análise e programação
estatística
Livre, gratuito, tem se tornado
“padrão” para análises científicas
Difícil no início, mas o tempo é
recuperado depois
Programação = liberdade
Todos os exemplos desta parte do
curso serão dados em R
Assume-se que todos tenham
instalado o R 3.0 e a interface
RStudio
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que usar R?
R: Pacote para análise e programação
estatística
Livre, gratuito, tem se tornado
“padrão” para análises científicas
Difícil no início, mas o tempo é
recuperado depois
Programação = liberdade
Todos os exemplos desta parte do
curso serão dados em R
Assume-se que todos tenham
instalado o R 3.0 e a interface
RStudio
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que usar R?
R: Pacote para análise e programação
estatística
Livre, gratuito, tem se tornado
“padrão” para análises científicas
Difícil no início, mas o tempo é
recuperado depois
Programação = liberdade
Todos os exemplos desta parte do
curso serão dados em R
Assume-se que todos tenham
instalado o R 3.0 e a interface
RStudio
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que será abordado nas próximas 12 aulas?
1
Introdução (Hoje)
8
Extensões da Regressão:
Modelos Lineares Gerais,
Generalizados, Mistos
2
Análise Exploratória de
Dados e Análise Gráfica
3
Regressão Linear Simples
9
Autocorrelação I - Séries
Temporais
4
Regressão Linear Múltipla
5
Diagnóstico e Avaliação do
Modelo
10
Autocorrelação II Correlação Espacial
6
Análise e Partição da
Variância
11
7
Exemplos de Aplicações
Técnicas de Ordenação e
Agrupamento - PCA, CCA,
Cluster, etc.
12
Em aberto (revisão,
reposição, falta de tempo,
etc.)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
MODELAGEM ESTATÍSTICA
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que é um modelo?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Y = β0 + β1X ?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
O que é um modelo?
Uma representação simplificada da realidade
Busca descrever alguns aspectos de interesse, ignorando outros
“All models are wrong. Some are useful.”
George E. P. Box
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
“Modelo” é um termo bastante genérico
Síndrome do “eu trabalho com modelagem”
Existem tipos e tipos de modelos
Que tipos de modelos nos interessam nesse curso?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Uma taxonomia de modelos
Modelos
Conceituais Quantitativos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Uma taxonomia de modelos
Modelos
Conceituais
Quantitativos
Matemáticos Estatísticos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Uma taxonomia de modelos
Modelos
Conceituais
Quantitativos
Matemáticos
Estatísticos
Determinísticos Estocásticos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Uma taxonomia de modelos
Modelos
Conceituais
Quantitativos
Matemáticos
Estatísticos
Determinísticos Estocásticos
Teóricos
Thiago S. F. Silva [email protected]
Empíricos
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Uma taxonomia de modelos
Modelos
Conceituais
Quantitativos
Matemáticos
Estatísticos
Determinísticos Estocásticos
Teóricos
Empíricos
OBS: Essas são relações “fuzzy”, não “binárias”!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Outras dicotomias
Analítico vs. Numérico (Computacional)
Dinâmico vs. Estático
Contínuo vs. Discreto
Baseado em Populações vs. Baseado em Indivíduos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Outras dicotomias
Analítico vs. Numérico (Computacional)
Dinâmico vs. Estático
Contínuo vs. Discreto
Baseado em Populações vs. Baseado em Indivíduos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Outras dicotomias
Analítico vs. Numérico (Computacional)
Dinâmico vs. Estático
Contínuo vs. Discreto
Baseado em Populações vs. Baseado em Indivíduos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Outras dicotomias
Analítico vs. Numérico (Computacional)
Dinâmico vs. Estático
Contínuo vs. Discreto
Baseado em Populações vs. Baseado em Indivíduos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Modelos Estatísticos
1
São baseados em probabilidades (estocásticos)
Determinístico (matemático):Y = f (X )
Estocástico (estatístico):Y ∼ N(µ, σ) = f (X ∼ N(µ, σ))
2
Incluem incertezas
Y = β0 + β1 X + e
3
Costumam ser derivados empiricamente
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Modelos Estatísticos
1
São baseados em probabilidades (estocásticos)
Determinístico (matemático):Y = f (X )
Estocástico (estatístico):Y ∼ N(µ, σ) = f (X ∼ N(µ, σ))
2
Incluem incertezas
Y = β0 + β1 X + e
3
Costumam ser derivados empiricamente
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Modelos Estatísticos
1
São baseados em probabilidades (estocásticos)
Determinístico (matemático):Y = f (X )
Estocástico (estatístico):Y ∼ N(µ, σ) = f (X ∼ N(µ, σ))
2
Incluem incertezas
Y = β0 + β1 X + e
3
Costumam ser derivados empiricamente
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Modelos Estatísticos
1
São baseados em probabilidades (estocásticos)
Determinístico (matemático):Y = f (X )
Estocástico (estatístico):Y ∼ N(µ, σ) = f (X ∼ N(µ, σ))
2
Incluem incertezas
Y = β0 + β1 X + e
3
Costumam ser derivados empiricamente
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Modelos Estatísticos
1
São baseados em probabilidades (estocásticos)
Determinístico (matemático):Y = f (X )
Estocástico (estatístico):Y ∼ N(µ, σ) = f (X ∼ N(µ, σ))
2
Incluem incertezas
Y = β0 + β1 X + e
3
Costumam ser derivados empiricamente
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
0
2
4
y
6
8
10
Modelos Estatísticos
0
2
4
6
8
10
x
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
0
2
4
y
6
8
10
Modelos Estatísticos
0
2
4
6
8
10
x
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que modelar?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que modelar?
Dois objetivos principais:
Compreensão (explicação) de um fenômeno
Predição de um fenômeno
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que modelar?
Dois objetivos principais:
Compreensão (explicação) de um fenômeno
Predição de um fenômeno
Compreensão
Será que a adição de um fertilizante aumenta a produção de
biomassa?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Compreensão
sem
4
3
2
Call:
lm(formula = cont ~ tempo)
Coefficients:
(Intercept)
-0.0286
tempo
0.1983
1
com
Com fertilizante
Sem fertilizante
0
biomassa (kg m2)
5
6
##
##
##
##
##
##
##
0
5
10
15
tempo
20
25
30
##
##
##
##
##
##
##
Call:
lm(formula = trat ~ tempo)
Coefficients:
(Intercept)
-0.0253
Thiago S. F. Silva [email protected]
tempo
0.4054
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Por que modelar?
Dois objetivos principais:
Compreensão (explicação) de um fenômeno
Predição de um fenômeno
Predição
Qual a biomassa média de biomassa de uma plantação 10 dias
após fertilização?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Previsão
com
4
3
Call:
lm(formula = trat ~ tempo)
Coefficients:
(Intercept)
-0.0253
tempo
0.4054
2
1
Com fertilizante
Sem fertilizante
0
biomassa (kg m2)
5
6
##
##
##
##
##
##
##
0
5
10
15
20
25
Y = −0.0253 + 0.4054 ∗ X + e
30
tempo
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Previsão
com
4
3
Call:
lm(formula = trat ~ tempo)
Coefficients:
(Intercept)
-0.0253
tempo
0.4054
2
1
Com fertilizante
Sem fertilizante
0
biomassa (kg m2)
5
6
##
##
##
##
##
##
##
0
5
10
15
20
25
30
Y = −0.0253 + 0.4054 ∗ X + e
Y = −0.0253 + 0.4054 ∗ 10 + e
tempo
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Previsão
com
4
3
Call:
lm(formula = trat ~ tempo)
Coefficients:
(Intercept)
-0.0253
tempo
0.4054
2
1
Com fertilizante
Sem fertilizante
0
biomassa (kg m2)
5
6
##
##
##
##
##
##
##
0
5
10
15
tempo
20
25
30
Y = −0.0253 + 0.4054 ∗ X + e
Y = −0.0253 + 0.4054 ∗ 10 + e
Y = −0.0253 + 4.054 + e
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Previsão
com
4
3
Call:
lm(formula = trat ~ tempo)
Coefficients:
(Intercept)
-0.0253
tempo
0.4054
2
1
Com fertilizante
Sem fertilizante
0
biomassa (kg m2)
5
6
##
##
##
##
##
##
##
0
5
10
15
tempo
20
25
30
Y
Y
Y
Y
= −0.0253 + 0.4054 ∗ X + e
= −0.0253 + 0.4054 ∗ 10 + e
= −0.0253 + 4.054 + e
= 4.0287 + e
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Compreensão vs. Predição
Existe uma diferença fundamental entre os dois objetivos. Qual?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Compreensão vs. Predição
Existe uma diferença fundamental entre os dois objetivos. Qual?
Compreensão/Explicação busca a generalidade
Predição busca a especificidade
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Compreensão vs. Predição
Existe uma diferença fundamental entre os dois objetivos. Qual?
Compreensão/Explicação busca a generalidade
Predição busca a especificidade
Ao se priorizar um, necessariamente se sacrifica o outro
Y = β0 + β1 ∗ X + e
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
A importância do modelo conceitual
A modelagem começa antes de qualquer análise numérica
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
A importância do modelo conceitual
A modelagem começa antes de qualquer análise numérica
Qual o seu modelo conceitual?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
A importância do modelo conceitual
A modelagem começa antes de qualquer análise numérica
Qual o seu modelo conceitual?
O computador sempre vai nos dar uma resposta. . .
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
A importância do modelo conceitual
A modelagem começa antes de qualquer análise numérica
Qual o seu modelo conceitual?
O computador sempre vai nos dar uma resposta. . .
. . . independentemente da realidade.
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
fonte: http://thesocietypages.org/socimages/2011/03/18/
illustrating-a-spurious-relationship-passport-ownership-and-diabetes/
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
fonte: http://thesocietypages.org/socimages/2011/03/18/
illustrating-a-spurious-relationship-passport-ownership-and-diabetes/
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Modelos quantitativos são apenas uma ferramenta a mais para
adquirir esse conhecimento
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Modelos quantitativos são apenas uma ferramenta a mais para
adquirir esse conhecimento
A formalização matemática de modelos nos ajuda a entender a
realidade. . .
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Modelos quantitativos são apenas uma ferramenta a mais para
adquirir esse conhecimento
A formalização matemática de modelos nos ajuda a entender a
realidade. . .
. . . mas jamais será um substituto para este entendimento.
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Modelos quantitativos são apenas uma ferramenta a mais para
adquirir esse conhecimento
A formalização matemática de modelos nos ajuda a entender a
realidade. . .
. . . mas jamais será um substituto para este entendimento.
Pode ser muito poderosa, mas nada supera o bom-senso e a
experiência
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Modelos quantitativos são apenas uma ferramenta a mais para
adquirir esse conhecimento
A formalização matemática de modelos nos ajuda a entender a
realidade. . .
. . . mas jamais será um substituto para este entendimento.
Pode ser muito poderosa, mas nada supera o bom-senso e a
experiência
Com grandes poderes, vêm grandes responsabilidades
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Concluindo
Praticamente todo o conhecimento humano é baseado em modelos
Modelos quantitativos são apenas uma ferramenta a mais para
adquirir esse conhecimento
A formalização matemática de modelos nos ajuda a entender a
realidade. . .
. . . mas jamais será um substituto para este entendimento.
Pode ser muito poderosa, mas nada supera o bom-senso e a
experiência
Com grandes poderes, vêm grandes responsabilidades
Os modelos (e a estatística) são o meio, e não o fim
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
The Journal of Socio-Economics 33 (2004) 587–606
Mindless statistics
Gerd Gigerenzer∗
Max Planck Institute for Human Development, Lentzeallee 94, 14195 Berlin, Germany
Abstract
Statistical rituals largely eliminate statistical thinking in the social sciences. Rituals are indispensable for identification with social groups, but they should be the subject rather than the procedure of
science. What I call the “null ritual” consists of three steps: (1) set up a statistical null hypothesis, but
do not specify your own hypothesis nor any alternative hypothesis, (2) use the 5% significance level
for rejecting the null and accepting your hypothesis, and (3) always perform this procedure. I report
evidence of the resulting collective confusion and fears about sanctions on the part of students and
teachers, researchers and editors, as well as textbook writers.
© 2004 Elsevier Inc. All rights reserved.
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
588
G. Gigerenzer / The Journal of Socio-Economics 33 (2004) 587–606
Página 2 of in psychology. I asked the author why he removed the chapter on Bayes as well as
the innocent sentence from all subsequent editions. “What made you present statistics as
if it had only a single hammer, rather than a toolbox? Why did you mix Fisher’s and
Neyman–Pearson’s theories into an inconsistent hybrid that every decent statistician would
reject?”
To his credit, I should say that the author did not attempt to deny that he had produced
the illusion that there is only one tool. But he let me know who was to blame for this.
There were three culprits: his fellow researchers, the university administration, and his
publisher. Most researchers, he argued, are not really interested in statistical thinking, but
only in how to get their papers published. The administration at his university promoted
researchers according to the number of their publications, which reinforced the researchers’
attitude. And he passed on the responsibility to his publisher, who demanded a single-recipe
cookbook. No controversies, please. His publisher had forced him to take out the chapter
on Bayes as well as the sentence that named alternative theories, he explained. At the end of
our conversation, I asked him what kind of statistical theory he himself believed in. “Deep
in my heart,” he confessed, “I am a Bayesian.”
If the author was telling me the truth, he had sold his heart for multiple editions of a
famous book whose message he did not believe in. He had sacrificed his intellectual integrity
for success. Ten thousands of students have read his text, believing that it reveals the method
of science. Dozens of less informed textbook writers copied from his text, churning out a
flood of offspring textbooks, and not noticing the mess.
Por que fazemos ciência?
1. The null ritual
Textbooks and curricula in psychology almost never teach the statistical toolbox, which
contains tools such as descriptive statistics, Tukey’s exploratory methods, Bayesian statisThiago S. F. Silvadecision
[email protected]
1: Introdução
à Modelagem
tics, Neyman–Pearson
theory and Wald’sAula
sequential
analysis. Knowing
the contents
Página 2
researchers according to the numberOutline
of their publications, which reinforced the researchers’
Apresentações
attitude. And he passed on the
responsibility to his publisher, who demanded a single-recipe
Informações Gerais
cookbook. No controversies,
please.
His publisher had forced him to take out the chapter
Modelagem
Estatística
on Bayes
as well-as
the sentence
that(2004)
named alternative theories, he explained. At the end of
Discussão
Gigerenzer
et al.
our conversation, I asked him what kind of statistical theory he himself believed in. “Deep
in my heart,” he confessed, “I am a Bayesian.”
If the author was telling me the truth, he had sold his heart for multiple editions of a
famous book whose message he did not believe in. He had sacrificed his intellectual integrity
for success. Ten thousands of students have read his text, believing that it reveals the method
of science. Dozens of less informed textbook writers copied from his text, churning out a
flood of offspring textbooks, and not noticing the mess.
1. The null ritual
Textbooks and curricula in psychology almost never teach the statistical toolbox, which
contains tools such as descriptive statistics, Tukey’s exploratory methods, Bayesian statistics, Neyman–Pearson decision theory and Wald’s sequential analysis. Knowing the contents
of a toolbox, of course, requires statistical thinking, that is, the art of choosing a proper tool
for a given problem. Instead, one single procedure that I call the “null ritual” tends to be
featured in texts and practiced by researchers. Its essence can be summarized in a few lines:
The null ritual:
1. Set up a statistical null hypothesis of “no mean difference” or “zero correlation.” Don’t
specify the predictions of your research hypothesis or of any alternative substantive
hypotheses.
2. Use 5% as a convention for rejecting the null. If significant, accept your research hypothesis. Report the result as p < 0.05, p < 0.01, or p < 0.001 (whichever comes next to
the obtained p-value).
3. Always perform this procedure.
The null ritual has sophisticated aspects I will not cover here, such as alpha adjustment
and ANOVA
But these do not changeAula
its essence.
Often, àtextbooks
also teach
Thiago S.procedures.
F. Silva [email protected]
1: Introdução
Modelagem
Página 2
Outline to his publisher, who demanded a single-recipe
attitude. And he passed on the responsibility
cookbook. No controversies,Apresentações
please. His publisher had forced him to take out the chapter
Informações
on Bayes as well as the sentence that Gerais
named alternative theories, he explained. At the end of
Modelagem Estatística
our conversation,
I asked himetwhat
kind of statistical theory he himself believed in. “Deep
Discussão - Gigerenzer
al. (2004)
in my heart,” he confessed, “I am a Bayesian.”
If the author was telling me the truth, he had sold his heart for multiple editions of a
famous book whose message he did not believe in. He had sacrificed his intellectual integrity
for success. Ten thousands of students have read his text, believing that it reveals the method
of science. Dozens of less informed textbook writers copied from his text, churning out a
flood of offspring textbooks, and not noticing the mess.
1. The null ritual
Textbooks and curricula in psychology almost never teach the statistical toolbox, which
contains tools such as descriptive statistics, Tukey’s exploratory methods, Bayesian statistics, Neyman–Pearson decision theory and Wald’s sequential analysis. Knowing the contents
of a toolbox, of course, requires statistical thinking, that is, the art of choosing a proper tool
for a given problem. Instead, one single procedure that I call the “null ritual” tends to be
featured in texts and practiced by researchers. Its essence can be summarized in a few lines:
The null ritual:
A mecanização
dahypothesis
ciência
1. Set up a statistical null
of “no mean difference” or “zero correlation.” Don’t
specify the predictions of your research hypothesis or of any alternative substantive
hypotheses.
2. Use 5% as a convention for rejecting the null. If significant, accept your research hypothesis. Report the result as p < 0.05, p < 0.01, or p < 0.001 (whichever comes next to
the obtained p-value).
3. Always perform this procedure.
The null ritual has sophisticated aspects I will not cover here, such as alpha adjustment
and ANOVA procedures. But these do not change its essence. Often, textbooks also teach
concepts alien to the ritual, such as statistical power and effect sizes, but these additions tend
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Página 2
attitude. And he passed on the responsibility to his publisher, who demanded a single-recipe
Outline
cookbook. No controversies, please.
His publisher had forced him to take out the chapter
Apresentações
on Bayes as well as the sentence
that named alternative theories, he explained. At the end of
Informações Gerais
our conversation, I Modelagem
asked him what
kind
of statistical theory he himself believed in. “Deep
Estatística
in myDiscussão
heart,” he -confessed,
Bayesian.”
Gigerenzer“Ietam
al.a (2004)
If the author was telling me the truth, he had sold his heart for multiple editions of a
famous book whose message he did not believe in. He had sacrificed his intellectual integrity
for success. Ten thousands of students have read his text, believing that it reveals the method
of science. Dozens of less informed textbook writers copied from his text, churning out a
flood of offspring textbooks, and not noticing the mess.
1. The null ritual
Textbooks and curricula in psychology almost never teach the statistical toolbox, which
contains tools such as descriptive statistics, Tukey’s exploratory methods, Bayesian statistics, Neyman–Pearson decision theory and Wald’s sequential analysis. Knowing the contents
of a toolbox, of course, requires statistical thinking, that is, the art of choosing a proper tool
for a given problem. Instead, one single procedure that I call the “null ritual” tends to be
featured in texts and practiced by researchers. Its essence can be summarized in a few lines:
The null ritual:
A mecanização
dahypothesis
ciência
1. Set up a statistical null
of “no mean difference” or “zero correlation.” Don’t
specify the predictions of your research hypothesis or of any alternative substantive
O que
é o ritual nulo?
hypotheses.
2. Use 5% as a convention for rejecting the null. If significant, accept your research hypothesis. Report the result as p < 0.05, p < 0.01, or p < 0.001 (whichever comes next to
the obtained p-value).
3. Always perform this procedure.
The null ritual has sophisticated aspects I will not cover here, such as alpha adjustment
and ANOVA procedures. But these do not change its essence. Often, textbooks also teach
concepts alien to the ritual, such as statistical power and effect sizes, but these additions tend
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Página 2
cookbook. No controversies, please. His publisher had forced him to take out the chapter
on Bayes as well as the sentence thatOutline
named alternative theories, he explained. At the end of
Apresentações
our conversation, I asked
him what kind of statistical theory he himself believed in. “Deep
Informações Gerais
in my heart,” he confessed,
“I am
a Bayesian.”
Modelagem
Estatística
If the
author -was
telling me
the (2004)
truth, he had sold his heart for multiple editions of a
Discussão
Gigerenzer
et al.
famous book whose message he did not believe in. He had sacrificed his intellectual integrity
for success. Ten thousands of students have read his text, believing that it reveals the method
of science. Dozens of less informed textbook writers copied from his text, churning out a
flood of offspring textbooks, and not noticing the mess.
1. The null ritual
Textbooks and curricula in psychology almost never teach the statistical toolbox, which
contains tools such as descriptive statistics, Tukey’s exploratory methods, Bayesian statistics, Neyman–Pearson decision theory and Wald’s sequential analysis. Knowing the contents
of a toolbox, of course, requires statistical thinking, that is, the art of choosing a proper tool
for a given problem. Instead, one single procedure that I call the “null ritual” tends to be
featured in texts and practiced by researchers. Its essence can be summarized in a few lines:
The null ritual:
1. Set up a statistical null hypothesis of “no mean difference” or “zero correlation.” Don’t
specify the predictions of your research hypothesis or of any alternative substantive
hypotheses.
2. Use 5% as a convention for rejecting the null. If significant, accept your research hypothesis. Report the result as p < 0.05, p < 0.01, or p < 0.001 (whichever comes next to
the obtained p-value).
3. Always perform this procedure.
The null ritual has sophisticated aspects I will not cover here, such as alpha adjustment
and ANOVA procedures. But these do not change its essence. Often, textbooks also teach
concepts alien to the ritual, such as statistical power and effect sizes, but these additions tend
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações
Geraisof Socio-Economics 33 (2004) 587–606
G. Gigerenzer / The Journal
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Página 3
589
to disappear when examples are given. They just don’t fit. More recently, the ritual has been
labeled null hypothesis significance testing, for short, NHST or sometimes NHSTP (with
P for “procedure”). It became institutionalized in curricula, editorials, and professional
associations in psychology in the mid-1950s (Gigerenzer, 1987, 1993). The 16th edition of
a highly influential textbook, Gerrig and Zimbardo’s Psychology and Life (2002), portrays
the null ritual as statistics per se and calls it the “backbone of psychological research” (p.
46). Its mechanical nature is sometimes presented like the rules of grammar. For instance,
the 1974 Publication Manual of the American Psychological Association told authors what
to capitalize, when to use a semicolon, and how to abbreviate states and territories. It also
told authors how to interpret p-values: “Caution: Do not infer trends from data that fail by
a small margin to meet the usual levels of significance. Such results are best interpreted as
caused by chance and are best reported as such. Treat the result section like an income tax
return. Take what’s coming to you, but no more” (p. 19; this passage was deleted in the
3rd ed., 1983). Judgment is not invited. This reminds me of a maxim regarding the critical
ratio, the predecessor of the significance level: “A critical ratio of three, or no Ph.D.”
Anonymity is essential. The ritual is virtually always presented without names, as statistics per se. If names such as Fisher or Pearson are mentioned in textbooks in psychology,
they are usually done so in connection with a minor detail, such as to thank E.S. Pearson
for the permission to reprint a table. The major ideas are presented anonymously, as if they
were given truths. Which text written for psychologists points out that null hypothesis testing was Fisher’s idea? And that Neyman and Pearson argued against null hypothesis testing?
If names of statisticians surface, the reader is typically told that they are all of one mind.
For instance, in response to a paper of mine (Gigerenzer, 1993), the author of a statistical
textbook, S.L. Chow (1998), acknowledged that different methods of statistical inference in
fact exist. But a few lines later he fell back into the “it’s-all-the-same” fable: “To K. Pearson,
R. Fisher, J. Neyman, and E.S. Pearson, NHSTP was what the empirical research was all
about” (Chow, 1998, p. xi). Reader beware. Each of these eminent statisticians would have
rejected the null ritual as bad statistics.
Fisher is mostly blamed for the null ritual. But toward the end of his life, Fisher (1955,
1956) rejected each of its three steps. First, “null” does not refer to a nil mean difference or
S. F. but
Silva
Aula 1: AIntrodução
zeroThiago
correlation,
to [email protected]
any hypothesis to be “nullified.”
correlationàofModelagem
0.5, or a reduction
Será que não podemos realmente inferir nada a partir de
dados que não atingem significância estatística (especialmente
por uma pequena margem?)
Outline
Apresentações
Informações
Geraisof Socio-Economics 33 (2004) 587–606
G. Gigerenzer / The Journal
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Página 3
589
to disappear when examples are given. They just don’t fit. More recently, the ritual has been
labeled null hypothesis significance testing, for short, NHST or sometimes NHSTP (with
P for “procedure”). It became institutionalized in curricula, editorials, and professional
associations in psychology in the mid-1950s (Gigerenzer, 1987, 1993). The 16th edition of
a highly influential textbook, Gerrig and Zimbardo’s Psychology and Life (2002), portrays
the null ritual as statistics per se and calls it the “backbone of psychological research” (p.
46). Its mechanical nature is sometimes presented like the rules of grammar. For instance,
the 1974 Publication Manual of the American Psychological Association told authors what
to capitalize, when to use a semicolon, and how to abbreviate states and territories. It also
told authors how to interpret p-values: “Caution: Do not infer trends from data that fail by
a small margin to meet the usual levels of significance. Such results are best interpreted as
caused by chance and are best reported as such. Treat the result section like an income tax
return. Take what’s coming to you, but no more” (p. 19; this passage was deleted in the
3rd ed., 1983). Judgment is not invited. This reminds me of a maxim regarding the critical
ratio, the predecessor of the significance level: “A critical ratio of three, or no Ph.D.”
Anonymity is essential. The ritual is virtually always presented without names, as statistics per se. If names such as Fisher or Pearson are mentioned in textbooks in psychology,
they are usually done so in connection with a minor detail, such as to thank E.S. Pearson
for the permission to reprint a table. The major ideas are presented anonymously, as if they
were given truths. Which text written for psychologists points out that null hypothesis testing was Fisher’s idea? And that Neyman and Pearson argued against null hypothesis testing?
If names of statisticians surface, the reader is typically told that they are all of one mind.
For instance, in response to a paper of mine (Gigerenzer, 1993), the author of a statistical
textbook, S.L. Chow (1998), acknowledged that different methods of statistical inference in
fact exist. But a few lines later he fell back into the “it’s-all-the-same” fable: “To K. Pearson,
R. Fisher, J. Neyman, and E.S. Pearson, NHSTP was what the empirical research was all
about” (Chow, 1998, p. xi). Reader beware. Each of these eminent statisticians would have
rejected the null ritual as bad statistics.
Fisher is mostly blamed for the null ritual. But toward the end of his life, Fisher (1955,
1956) rejected each of its three steps. First, “null” does not refer to a nil mean difference or
S. F. but
Silva
Aula 1: AIntrodução
zeroThiago
correlation,
to [email protected]
any hypothesis to be “nullified.”
correlationàofModelagem
0.5, or a reduction
Será que não podemos realmente inferir nada a partir de
dados que não atingem significância estatística (especialmente
por uma pequena margem?)
"Judgement is not invited". Então por que vocês estão aqui?
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
p < 0.05 ?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
p < 0.05 ?
P(D | H) < 0.05 ?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
p < 0.05 ?
P(D | H) < 0.05 ?
ou
P(H | D) < 0.05 ?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Teorema de Bayes
P(A | B) =
P(B | A)P(A)
P(B)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Teorema de Bayes
P(H | D) =
P(D | H)P(H)
P(D)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Teorema de Bayes
P(H | D) =
P(D | H)P(H)
P(D)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
p-valor
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Teorema de Bayes
P(H | D) =
P(D | H)P(H)
P(D)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Normalização
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Teorema de Bayes
P(H | D) =
P(D | H)P(H)
P(D)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Priori
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Mas se P(D | H) está proximo de
zero, não é razoável imaginar que
P(H | D) também?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Fixa a a geração de números aleatórios
set.seed(30)
Cria uma amostra com n=30, e distribuição normal
média = 5, d.p. =2
p1 <- rnorm(30,5,2)
Segunda amostra,
Uma transformação conhecida da primeira
p2 <- p1 + 0.5
Histogram of p2
2
3
Frequency
4
3
1
2
0
1
0
Frequency
4
5
5
6
7
6
Histogram of p1
2
4
6
8
p1
Thiago S. F. Silva [email protected]
2
4
6
8
p2
Aula 1: Introdução à Modelagem
10
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
# Teste t para diferença
t.test(p1, p2, alternative = "two.sided", var.equal = TRUE)
##
##
##
##
##
##
##
##
##
##
##
Two Sample t-test
data: p1 and p2
t = -0.9889, df = 58, p-value = 0.3268
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.5121 0.5121
sample estimates:
mean of x mean of y
4.339
4.839
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
# Cria outra amostra com os mesmos parâmetros, n
# = 300
p1.big <- rnorm(300, 5, 2)
p2.big <- p1.big + 0.5
# teste t novamente
t.test(p1.big, p2.big, alternative = "two.sided", var.equal = TRUE)
##
##
##
##
##
##
##
##
##
##
##
Two Sample t-test
data: p1.big and p2.big
t = -2.905, df = 598, p-value = 0.003811
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.8381 -0.1619
sample estimates:
mean of x mean of y
4.791
5.291
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
# E se a diferença fosse menor?
p3.big <- p1.big + 0.1
t.test(p1.big, p3.big, alternative = "two.sided", var.equal = TRUE)
##
##
##
##
##
##
##
##
##
##
##
Two Sample t-test
data: p1.big and p3.big
t = -0.5809, df = 598, p-value = 0.5615
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.4381 0.2381
sample estimates:
mean of x mean of y
4.791
4.891
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
# Será?
p1.gigante <- rnorm(30000, 5, 2)
p3.gigante <- p1.gigante + 0.1
# Nope.
t.test(p1.gigante, p3.gigante, alternative = "two.sided",
var.equal = TRUE)
##
##
##
##
##
##
##
##
##
##
##
Two Sample t-test
data: p1.gigante and p3.gigante
t = -6.126, df = 59998, p-value = 9.061e-10
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.13199 -0.06801
sample estimates:
mean of x mean of y
5.019
5.119
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
0.6
p−valor, teste t
0.4
0.2
0.0
# De fato, podemos simular
# a relação entre n e p-val:
pvals <- rep(0,5000)
for (i in c(3:5000)){
p1.sim <- rnorm(i,5,2)
p3.sim <- p1.sim + 0.1
t <- t.test(p1.sim,p3.sim,
alt="two.sided",var.equal=TRUE)$p.value
pvals[i] <- t
}
0.8
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
0
1000
2000
3000
n
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
4000
5000
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
# Dando um 'zoom' de 300 a 500
plot(300:500, pvals[300:500], type = "l", xlab = "n",
ylab = "p-valor, teste t")
0.50
p−valor, teste t
0.42
0.46
0.6
0.4
0.2
0.0
p−valor, teste t
0.8
0.54
# Todos os valores de 3 a 3000
plot(3:5000, pvals[3:5000], type = "l", xlab = "n",
ylab = "p-valor, teste t")
abline(v = c(300, 500), col = "red")
0
1000
2000
3000
4000
5000
n
Thiago S. F. Silva [email protected]
300
350
400
n
Aula 1: Introdução à Modelagem
450
500
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Quanto menor o n, maior a chance de que você tenha uma
amostra que aproxima mal a população, causando flutuações
no seu valor p!
# Simulação de múltiplas instancias, para
# n=10,50,100,500 e 5000
psim <- data.frame(n = rep(c(10, 50, 100, 500, 5000),
each = 500), p = rep(NA, 2500))
for (i in c(1, 500, 1000, 1500, 2000)) {
for (j in c(0:499)) {
ind <- i + j
p1.sim2 <- rnorm(psim$n[ind], 5, 2)
p3.sim2 <- p1.sim2 + 0.1
t2 <- t.test(p1.sim2, p3.sim2, alternative = "two.sided",
var.equal = TRUE)$p.value
psim$p[ind] <- t2
}
}
psim$nfac <- as.factor(psim$n)
boxplot(p ~ nfac, data = psim, xlab = "n", ylab = "p-valor, teste t (500 replica??es)")
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
0.8
0.6
0.4
0.2
0.0
p−valor, teste t (500 replicações)
Quanto menor o n, maior a chance de que você tenha uma
amostra que aproxima mal a população, causando flutuações
no seu valor p!
10
50
100
500
5000
n
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Os três métodos
Ritual Nulo:
1
2
3
Fisher:
Set up a statistical null
hypothesis of "no mean
difference"or "zero
correlation."Don’t specify the
predictions of your research
hypothesis or of any alternative
substantive hypotheses.
Use 5% as a convention for
rejecting the null. If significant,
accept your research hypothesis.
Report the result as p < 0.05,
p < 0.01, or p < 0.001
(whichever comes next to the
obtained p-value).
Neyman-Pearson:
1
Set up a statistical null
hypothesis. The null need not
be a nil hypothesis (i.e., zero
difference).
2
Report the exact level of
significance (e.g., p = 0.051 or
p = 0.049). Do not use a
conventional 5% level, and do
not talk about accepting or
rejecting hypotheses.
3
1
Set up two statistical
hypotheses, H1 and H2 , and
decide about α, β, and n
before the experiment, based on
subjective cost-benefit
considerations. These define a
rejection region for each
hypothesis.
2
If the data falls into the
rejection region of H1 , accept
H2 ; otherwise accept H1 . Note
that accepting a hypothesis
does not mean that you
believe in it, but only that you
act as if it were true.
3
The usefulness of the procedure
is limited to situations where
you have a disjunction of
hypotheses (e.g., either µ1 = 8
or µ2 = 8 is true) and you can
make meaningful cost-benefit
trade-offs for alpha and beta.
Use this procedure only if you
know very little about the
problem at hand.
Always perform this procedure.
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Níveis de significância
Nível de Significância = α (Neyman-Pearson)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Níveis de significância
Nível de Significância = α (Neyman-Pearson)
Deve ser pré-definido, junto com β, especificando os erros
Tipo I e Tipo II que você considera toleráveis, e então
estabelecer o n necessário para detectar um certo tamanho de
efeito com essas probabilidades de erro.
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Níveis de significância
Nível de Significância = α (Neyman-Pearson)
Deve ser pré-definido, junto com β, especificando os erros
Tipo I e Tipo II que você considera toleráveis, e então
estabelecer o n necessário para detectar um certo tamanho de
efeito com essas probabilidades de erro.
Nível de Significância = valor exato (Fisher)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Níveis de significância
Nível de Significância = α (Neyman-Pearson)
Deve ser pré-definido, junto com β, especificando os erros
Tipo I e Tipo II que você considera toleráveis, e então
estabelecer o n necessário para detectar um certo tamanho de
efeito com essas probabilidades de erro.
Nível de Significância = valor exato (Fisher)
Grau de certeza que você tem sobre a relação entre os dados
observados e uma certa hipótese (geralmente a hipótese nula)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Níveis de significância
Nível de Significância = α (Neyman-Pearson)
Deve ser pré-definido, junto com β, especificando os erros
Tipo I e Tipo II que você considera toleráveis, e então
estabelecer o n necessário para detectar um certo tamanho de
efeito com essas probabilidades de erro.
Nível de Significância = valor exato (Fisher)
Grau de certeza que você tem sobre a relação entre os dados
observados e uma certa hipótese (geralmente a hipótese nula)
p → 1 não significa "aceito H0 ", e sim "Não posso dizer com
certeza que H0 é falsa".
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Níveis de significância
Nível de Significância = α (Neyman-Pearson)
Deve ser pré-definido, junto com β, especificando os erros
Tipo I e Tipo II que você considera toleráveis, e então
estabelecer o n necessário para detectar um certo tamanho de
efeito com essas probabilidades de erro.
Nível de Significância = valor exato (Fisher)
Grau de certeza que você tem sobre a relação entre os dados
observados e uma certa hipótese (geralmente a hipótese nula)
p → 1 não significa "aceito H0 ", e sim "Não posso dizer com
certeza que H0 é falsa".
Para Fisher, p é uma propriedade da amostra; para N-P,
é uma propriedade to teste!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho (magnitude) do efeito = valor de real interesse científico
25
y1
20
Pearson's product-moment correlation
15
data: x1 and y1
t = 1.679, df = 8, p-value = 0.1318
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1758 0.8627
sample estimates:
cor
0.5103
10
##
##
##
##
##
##
##
##
##
##
##
30
set.seed(1979)
x1 <- runif(10, 1, 10)
y1 <- 10 + 2 * x1 + rnorm(10, 0, 4)
cor.test(x1, y1)
3
4
5
6
x1
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
7
8
9
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho (magnitude) do efeito = valor de real interesse científico
Interpretação errada: Não existe efeito de X sobre Y
25
y1
20
Pearson's product-moment correlation
15
data: x1 and y1
t = 1.679, df = 8, p-value = 0.1318
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1758 0.8627
sample estimates:
cor
0.5103
10
##
##
##
##
##
##
##
##
##
##
##
30
set.seed(1979)
x1 <- runif(10, 1, 10)
y1 <- 10 + 2 * x1 + rnorm(10, 0, 4)
cor.test(x1, y1)
3
4
5
6
x1
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
7
8
9
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho (magnitude) do efeito = valor de real interesse científico
Interpretação correta: é provável que haja efeito de X sobre Y , porém
mais amostras são necessárias para que se tenha certeza
25
y1
20
Pearson's product-moment correlation
15
data: x1 and y1
t = 1.679, df = 8, p-value = 0.1318
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.1758 0.8627
sample estimates:
cor
0.5103
10
##
##
##
##
##
##
##
##
##
##
##
30
set.seed(1979)
x1 <- runif(10, 1, 10)
y1 <- 10 + 2 * x1 + rnorm(10, 0, 4)
cor.test(x1, y1)
3
4
5
6
x1
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
7
8
9
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho (magnitude) do efeito = valor de real interesse científico
y2
10.2
Pearson's product-moment correlation
9.8
data: x2 and y2
t = 14.34, df = 498, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4755 0.5999
sample estimates:
cor
0.5406
9.6
##
##
##
##
##
##
##
##
##
##
##
10.6
x2 <- runif(500, 1, 10)
y2 <- 10 + 0.05 * x2 + rnorm(500, 0, 0.2)
cor.test(x2, y2)
2
4
6
x2
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
8
10
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho (magnitude) do efeito = valor de real interesse científico
Interpretação errada: X tem um forte efeito sobre Y , porque p 0.05
y2
10.2
Pearson's product-moment correlation
9.8
data: x2 and y2
t = 14.34, df = 498, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4755 0.5999
sample estimates:
cor
0.5406
9.6
##
##
##
##
##
##
##
##
##
##
##
10.6
x2 <- runif(500, 1, 10)
y2 <- 10 + 0.05 * x2 + rnorm(500, 0, 0.2)
cor.test(x2, y2)
2
4
6
x2
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
8
10
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho (magnitude) do efeito = valor de real interesse científico
Interpretação correta: Afirmo que X possui um fraco efeito sobre Y , com
alto grau de certeza
y2
10.2
Pearson's product-moment correlation
9.8
data: x2 and y2
t = 14.34, df = 498, p-value < 2.2e-16
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.4755 0.5999
sample estimates:
cor
0.5406
9.6
##
##
##
##
##
##
##
##
##
##
##
10.6
x2 <- runif(500, 1, 10)
y2 <- 10 + 0.05 * x2 + rnorm(500, 0, 0.2)
cor.test(x2, y2)
2
4
6
x2
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
8
10
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Tamanho do efeito
y2
10.2
9.6
9.8
15
10
y1
20
25
10.6
30
Algo errado?
0
2
4
6
8
10
x1
Thiago S. F. Silva [email protected]
0
2
4
6
x2
Aula 1: Introdução à Modelagem
8
10
30
25
y2
20
15
10
15
10
y1
20
25
30
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
0
2
4
6
8
10
x1
Thiago S. F. Silva [email protected]
0
2
4
6
x2
Aula 1: Introdução à Modelagem
8
10
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Se os exemplos anteriores fossem resultados preliminares do
teste de duas drogas, capazes de aumentar o seu desempenho
na prova de Princípios Físicos. . .
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Se os exemplos anteriores fossem resultados preliminares do
teste de duas drogas, capazes de aumentar o seu desempenho
na prova de Princípios Físicos. . .
. . . qual droga você tomaria?
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
30
25
y2
20
15
10
15
10
y1
20
25
30
Tamanho do efeito
0
2
4
6
8
10
x1
0
2
4
6
8
x2
Para dose = 8, a droga 1 te dá uma performance entre 17 - 26. Talvez.
Para dose = 8, a droga 2 te dá uma performance entre 10.1 - 10.6. Com certeza.
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
10
a bit harsh on blaming Fisher rather the null ritual; recall that Fisher also proposed other
Outline
statistical tools, and in the 1950s, he
thought of null hypothesis testing as adequate only for
situations in which we know nothing or little. Meehl (1978) made a challenging prediction
concerning null hypothesis tests in nonexperimental settings, where random assignment to
treatment and control group is not possible, due to ethical or practical constraints. It can be
summarized as follows:
Páginas 15 e 16
Meehl’s conjecture:
A conjectura de Meehl
In nonexperimental settings with large sample sizes, the probability of rejecting the null
hypothesis of nil group differences in favor of a directional alternative is about 0.50.
Isn’t that good news? We guess that X is larger than Y—and we get it right half of the
time. For instance, if we make up the story that Protestants have a higher memory span than
Catholics, slower reaction times, smaller shoe size, and higher testosterone levels, each of
these hypotheses has about a 50% chance of being accepted by a null hypothesis test. If we
do not commit to the direction and just guess that X and Y are different, we get it right virtually 100% of the time. Meehl reasoned that in the real world––as opposed to experimental
settings––the null hypothesis (“nil” as defined by the null ritual, not by Fisher) is always
wrong. Some difference exists between any natural groups. Therefore, with sufficient
statistical power, one will almost always find a significant result. If one randomly guesses
the direction of the difference, it follows that one will be correct in about 50% of the cases
(with a unidirectional alternative hypothesis, one will be correct in about 100% of them).
Niels Waller (2004) set out to test Meehl’s conjecture empirically. He had access to the
data of more than 81,000 individuals who had completed the 567 items of the Minnesota
Multiphase Personality Inventory—Revised (MMPI-2). The MMPI-2 asks people about a
broad range of contents, including health, personal habits, attitudes toward sex, and extreme
manifestations of psychopathology. Imagine a gender theorist who has concocted a new
theory that predicts directional gender differences, that is, women will score higher on some
item than men, or vice versa. Can we predict the probability of rejecting the null hypothesis
in favor of the new theory? According to Meehl’s conjecture, it is about 50%. In Waller’s
simulation, the computer picked the first of the 511 items of the MMPI-2 (excluding 56 for
their known ability to discriminate between the sexes), determined randomly the direction
of the alternative hypothesis, and computed whether the difference was significant in the
predicted
This
procedure was repeatedAula
with1:allIntrodução
511 items. The
result: 46% of the
Thiagodirection.
S. F. Silva
[email protected]
à Modelagem
a bit harsh on blaming Fisher rather the null ritual; recall that Fisher also proposed other
The routine reliance on the nullOutline
ritual discourages not only statistical thinking but also
statistical tools, and in the 1950s, he
thought of null hypothesis testing as adequate only for
theoretical thinking. One does not need to specify one’s hypothesis, nor any challenging
situations in which we know nothing or little. Meehl (1978) made a challenging prediction
alternative hypothesis. There is no premium on “bold” hypotheses, in the sense of Karl
concerning null hypothesis tests in nonexperimental settings, where random assignment to
Popper or Bayesian model comparison (MacKay, 1995). In many experimental papers in
treatment and control group is not possible, due to ethical or practical constraints. It can be
social and cognitive psychology, there is no theory in shooting distance, but only surrogates
summarized as follows:
such as redescription of the results (Gigerenzer, 2000, chapter 14). The sole requirement is
to reject a null that is identified with “chance.” Statistical theories such as Neyman–Pearson
Meehl’s conjecture:
theory and Wald’s theory, in contrast, begin with two or more statistical hypotheses.
In the absence of theory, the temptation is to look first at the data and then see what
In nonexperimental settings with large sample sizes, the probability of rejecting the null
is significant. The physicist Richard Feynman (1998, pp. 80–81) has taken notice of this
hypothesis of nil group differences in favor of a directional alternative is about 0.50.
misuse of hypothesis testing. I summarize his argument.
Páginas 15 e 16
A conjectura de Meehl
Isn’t that good news? We guess that X is larger than Y—and we get it right half of the
Feynman’s conjecture:
time. For instance, if we make up the story that Protestants have a higher memory span than
Catholics, slower reaction times, smaller shoe size, and higher testosterone levels, each of
To report a significant result and reject the null in favor of an alternative hypothesis is
these hypotheses has about a 50% chance of being accepted by a null hypothesis test. If we
meaningless unless the alternative hypothesis has been stated before the data was obtained.
do not commit to the direction and just guess that X and Y are different, we get it right virtually 100% of the time. Meehl reasoned that in the real world––as opposed to experimental
settings––the null hypothesis (“nil” as defined by the null ritual, not by Fisher) is always
wrong. Some difference exists between any natural groups. Therefore, with sufficient
statistical power, one will almost always find a significant result. If one randomly guesses
the direction of the difference, it follows that one will be correct in about 50% of the cases
(with a unidirectional alternative hypothesis, one will be correct in about 100% of them).
Niels Waller (2004) set out to test Meehl’s conjecture empirically. He had access to the
data of more than 81,000 individuals who had completed the 567 items of the Minnesota
Multiphase Personality Inventory—Revised (MMPI-2). The MMPI-2 asks people about a
broad range of contents, including health, personal habits, attitudes toward sex, and extreme
manifestations of psychopathology. Imagine a gender theorist who has concocted a new
theory that predicts directional gender differences, that is, women will score higher on some
item than men, or vice versa. Can we predict the probability of rejecting the null hypothesis
in favor of the new theory? According to Meehl’s conjecture, it is about 50%. In Waller’s
simulation, the computer picked the first of the 511 items of the MMPI-2 (excluding 56 for
their known ability to discriminate between the sexes), determined randomly the direction
of the alternative hypothesis, and computed whether the difference was significant in the
predicted
This
procedure was repeatedAula
with1:allIntrodução
511 items. The
result: 46% of the
Thiagodirection.
S. F. Silva
[email protected]
à Modelagem
A conjectura de Feynman
a bit harsh on blaming Fisher rather the null ritual; recall that Fisher also proposed other
The routine reliance on the nullOutline
ritual discourages not only statistical thinking but also
statistical tools, and in the 1950s, he
thought of null hypothesis testing as adequate only for
theoretical thinking. One does not need to specify one’s hypothesis, nor any challenging
situations in which we know nothing or little. Meehl (1978) made a challenging prediction
alternative hypothesis. There is no premium on “bold” hypotheses, in the sense of Karl
concerning null hypothesis tests in nonexperimental settings, where random assignment to
Popper or Bayesian model comparison (MacKay, 1995). In many experimental papers in
treatment and control group is not possible, due to ethical or practical constraints. It can be
social and cognitive psychology, there is no theory in shooting distance, but only surrogates
summarized as follows:
such as redescription of the results (Gigerenzer, 2000, chapter 14). The sole requirement is
to reject a null that is identified with “chance.” Statistical theories such as Neyman–Pearson
Meehl’s conjecture:
theory and Wald’s theory, in contrast, begin with two or more statistical hypotheses.
In the absence of theory, the temptation is to look first at the data and then see what
In nonexperimental settings with large sample sizes, the probability of rejecting the null
is significant. The physicist Richard Feynman (1998, pp. 80–81) has taken notice of this
hypothesis of nil group differences in favor of a directional alternative is about 0.50.
misuse of hypothesis testing. I summarize his argument.
Páginas 15 e 16
A conjectura de Meehl
Isn’t that good news? We guess that X is larger than Y—and we get it right half of the
Feynman’s conjecture:
time. For instance, if we make up the story that Protestants have a higher memory span than
Catholics, slower reaction times, smaller shoe size, and higher testosterone levels, each of
To report a significant result and reject the null in favor of an alternative hypothesis is
these hypotheses has about a 50% chance of being accepted by a null hypothesis test. If we
meaningless unless the alternative hypothesis has been stated before the data was obtained.
do not commit to the direction and just guess that X and Y are different, we get it right virtually 100% of the time. Meehl reasoned that in the real world––as opposed to experimental
settings––the null hypothesis (“nil” as defined by the null ritual, not by Fisher) is always
wrong. Some difference exists between any natural groups. Therefore, with sufficient
statistical power, one will almost always find a significant result. If one randomly guesses
the direction of the difference, it follows that one will be correct in about 50% of the cases
(with a unidirectional alternative hypothesis, one will be correct in about 100% of them).
Niels Waller (2004) set out to test Meehl’s conjecture empirically. He had access to the
data of more than 81,000 individuals who had completed the 567 items of the Minnesota
Multiphase Personality Inventory—Revised (MMPI-2). The MMPI-2 asks people about a
broad range of contents, including health, personal habits, attitudes toward sex, and extreme
manifestations of psychopathology. Imagine a gender theorist who has concocted a new
theory that predicts directional gender differences, that is, women will score higher on some
item than men, or vice versa. Can we predict the probability of rejecting the null hypothesis
in favor of the new theory? According to Meehl’s conjecture, it is about 50%. In Waller’s
simulation, the computer picked the first of the 511 items of the MMPI-2 (excluding 56 for
their known ability to discriminate between the sexes), determined randomly the direction
of the alternative hypothesis, and computed whether the difference was significant in the
predicted
This
procedure was repeatedAula
with1:allIntrodução
511 items. The
result: 46% of the
Thiagodirection.
S. F. Silva
[email protected]
à Modelagem
A conjectura de Feynman
No mundo real, nunca existe diferença ou relação
verdadeiramente zero
O interesse, desta maneira, está em determinar o tamanho da
distância entre esta diferença/relação e zero (ou algum outro
valor basal).
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Em resumo
O p-valor é uma medida de confiança, não de impacto
Se você está realmente fazendo um experimento, pré-defina α, β e
n, para ter certeza de que vai conseguir medir o efeito esperado
Se é um estudo observacional, reporte os p-valores exatos. . .
. . . e interprete-os apenas como uma medida de certeza
O mais importante sempre será o tamanho do efeito!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Em resumo
O p-valor é uma medida de confiança, não de impacto
Se você está realmente fazendo um experimento, pré-defina α, β e
n, para ter certeza de que vai conseguir medir o efeito esperado
Se é um estudo observacional, reporte os p-valores exatos. . .
. . . e interprete-os apenas como uma medida de certeza
O mais importante sempre será o tamanho do efeito!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Em resumo
O p-valor é uma medida de confiança, não de impacto
Se você está realmente fazendo um experimento, pré-defina α, β e
n, para ter certeza de que vai conseguir medir o efeito esperado
Se é um estudo observacional, reporte os p-valores exatos. . .
. . . e interprete-os apenas como uma medida de certeza
O mais importante sempre será o tamanho do efeito!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Em resumo
O p-valor é uma medida de confiança, não de impacto
Se você está realmente fazendo um experimento, pré-defina α, β e
n, para ter certeza de que vai conseguir medir o efeito esperado
Se é um estudo observacional, reporte os p-valores exatos. . .
. . . e interprete-os apenas como uma medida de certeza
O mais importante sempre será o tamanho do efeito!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Em resumo
O p-valor é uma medida de confiança, não de impacto
Se você está realmente fazendo um experimento, pré-defina α, β e
n, para ter certeza de que vai conseguir medir o efeito esperado
Se é um estudo observacional, reporte os p-valores exatos. . .
. . . e interprete-os apenas como uma medida de certeza
O mais importante sempre será o tamanho do efeito!
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Outline
Apresentações
Informações Gerais
Modelagem Estatística
Discussão - Gigerenzer et al. (2004)
Thiago S. F. Silva [email protected]
Aula 1: Introdução à Modelagem
Download

Aula 1: Introdução à Modelagem - SER-202 Estatística - DPI