Estatística
Daniel Vieira Ferreira
Exemplos da utilização de Estatística
Exportações brasileiras de carne bovina in natura em volume (mil toneladas) e
receita (US$ milhões /ton)
Exemplos da utilização de Estatística
Exemplos da utilização de Estatística
Exemplos da utilização de Estatística
Coleta de dados – Amostragem
IMPORTÂNCIA DA AMOSTRAGEM
População
Amostra
Parâmetros
Média
Desvio padrão
Proporção etc.
Inferência
Estatísticas
Média
Desvio padrão
Proporção etc.
Coleta de dados – Amostragem
IMPORTÂNCIA DA AMOSTRAGEM
“Não é preciso comer um bolo inteiro para ver se é bom.”
“Não é necessário analisar 100 toneladas de minério de ferro para
saber sua composição química. Basta fazer uma boa amostragem e
analisar quantidades bem menores, conhecendo-se o erro que se
corre.”
Avaliar a temperatura da água da piscina mergulhando a ponta do
pé;
Assistir um programa de tv por alguns minutos para ver se vale a
pena assisti-lo até o fim;
Fabricar lotes pilotos para depois se lançar à fabricação em grande
escala.
Amostragem
Problemas: quanto pesa, em média, uma folha de eucalipto? 1 kg? 1 g? 1 g
quantas folhas tem, em média, um eucalipto? 2? 1.000? 1.000.000.000?
Amostragem ou Censo?
Por que fazer amostragem?
- população infinita
- diminuir custo
- aumentar velocidade na caracterização (medidas que variam no tempo)
- aumentar a representatividade
- melhorar a precisão (mais cuidado na obtenção dos dados)
- minimizar perdas por medidas destrutivas
Por que fazer censo?
- população pequena ou amostragem muito grande em relação a população
- precisão completa (não se permite erros)
- já se dispõe da informação completa
Amostragem
Problemas: quanto pesa, em média, uma folha de eucalipto? 1 kg? 1 g? 1 g
quantas folhas tem, em média, um eucalipto? 2? 1.000? 1.000.000.000?
Quanto amostrar?
Depende:
- da variabilidade original dos dados (maior variância  maior n)
- da precisão requerida no trabalho (maior precisão  maior n)
- do tempo disponível (menor o tempo  menor n)
- do custo da amostragem (maior o custo  menor n)
Como amostrar?
- amostragem probabilística X não probabilística
Amostragem
Amostragem Probabilística e Não Probabilística
Amostragem probabilística:
cada elemento da população tem uma probabilidade (não nula) de ser escolhido
Amostragem não probabilística:
- amostragem restrita aos elementos que se tem acesso (ex: drogados)
- escolha a esmo (ex: coelhos numa gaiola, escolha de parafusos numa caixa)
- impossibilidade de sorteio (ex: sangue)
- amostragem intencional ou por julgamento (ex: escolha de elementos “típicos”)
- voluntários (ex: testes de vacina)
Amostragem
Amostragem Aleatória Simples
Escolhe-se n elementos de uma população de tamanho N
amostra = {X1, X2, ..., Xn}
Exemplo: escolher 10 pixels de uma imagem 13x17
etapas: rotular cada pixel com um código único
sortear aleatoriamente 10 códigos
(tabelas ou geradores de números aleatórios)
identificar os pixels selecionados
OBS:
método mais simples
pressupõe população homogênea
Amostragem
Amostragem Aleatória Estratificada
Primeiramente a população (N) é dividida em L sub-populações (estratos) com
N1, N2, ..., NL elementos. Para cada estrato, escolhe-se ni elementos
aleatoriamente, totalizando n elementos.
todos iguais
ni
ni 
proporcionais a Ni
n
L
ni  n
Ni
N
tamanho ótimo (considera a variabilidade)
ni  n
N i si
L
N s
i 1
i i
Exemplo: escolher 10 pixels de uma imagem 13x17
etapas: selecionar um estrato
rotular cada pixel com um código único
sortear aleatoriamente ni códigos
(tabelas ou geradores de números aleatórios)
identificar os pixels selecionados
repetir o processo para todos os estratos
OBS:
usado para população heterogênea
(estratos homogêneos)
Amostragem
Amostragem Sistemática
Se os elementos da população já se encontram ordenados segundo algum critério,
pode-se selecionar um elemento qualquer e escolher um “passo” que definirá
qual será o próximo elemento escolhido.
1
10
20
passo = 5
Exemplo: escolher pixels de uma imagem 13x17 com
passos 5 em x e 4 em y
etapas: escolher aleatoriamente um pixel na janela
5x4 superior esquerda
com base nesse pixel, definir uma grade com
espaçamento de 5x4 elementos
identificar os pixels selecionados
OBS:
amostra-se uniformemente todo o espaço
Amostragem
Outras Amostragens
Amostragem em múltiplos estágios
amostragem sistemática
dentro do talhão
talhões
Amostragem por conglomerados
amostra-se todos (ou alguns)
elementos do conglomerado
conglomerados
Amostragem
Solução:
 Inferência Estatística, que consiste na
extração de pelo menos uma amostra da
população, que após trabalhada terá seus
resultados inferidos para a população.
Amostragem
Questões que surgem:
 Como obter uma boa amostra?
 O que trabalhar na amostra?
 No processo de inferência, qual o erro da
pesquisa?
 Quais as decorrências lógicas do processo
inferencial?
Amostragem
Técnicas de Amostragem
1.1 - AMOSTRAGEM POR CONVENIÊNCIA
(NÃO PROBABILÍSTICA): a amostra é
formada obedecendo a algum tipo de
conveniência de quem forma a amostra
ou de quem vai participar da amostra ou
de ambos.
Amostragem
Técnicas de Amostragem
1.2
- AMOSTRAGEM PROBABILÍSTICA.
Teoricamente é identificada pela existência
de uma probabilidade conhecida associada a
cada elemento de participar da amostra.
Alguns exemplos clássicos são:
amostragem aleatória simples, amostagem
sistemática, amostragem estratificada e
amostragem por conglomerado.
Técnicas de Amostragem
1.2.1 – AMOSTRAGEM ALEATÓRIA
SIMPLES ( AAS )
Todos os elementos da população tem
mesma probabilidade de pertencer à
amostra, isto é, 1/N.
A amostragem pode ser feita com ou sem
reposição.
Usa-se a Tabela de Números Aleatórios.
Amostragem
Técnicas de Amostragem
1.2.2 – AMOSTRAGEM SISTEMÁTICA
Determina-se a cota amostral pela fórmula,
k = N/n. Escolhe-se aleatoriamente um
elemento no intervalo; este será o
primeiro elemento da amostra. O segundo
elemento será o primeiro mais k, e assim
sucessivamente.
Amostragem
Técnicas de Amostragem
1.2.3 – AMOSTRAGEM ESTRATIFICADA
Divide-se a população em subgrupos (estratos)
de
itens
similares,
procedendo-se
à
amostragem em cada estrato, proporcional ao
tamanho do estrato. Como os subgrupos são
relativamente homogêneos, a variabilidade é
menor, necessitando de um tamanho menor de
amostra.
Exemplo: estratos por idade, renda, ...
Amostragem
Técnicas de Amostragem
1.2.3 – AMOSTRAGEM ESTRATIFICADA
Para determinar o número de elementos da população
no i-ésimo estrato que irá participar da amostra (ni )
podemos usar a seguinte fórmula:
n
ni = -------- Ni
N
onde n é o tamanho da amostra, N é o tamanho da
população e Ni é o tamanho do estrato. O quociente
n/N é denominado fração amostral e notado por f.
Amostragem
Técnicas de Amostragem
1.2.4– AMOSTRAGEM POR CONGLOMERADOS
Dispõem-se os itens da população em subgrupos
fisicamente
próximos
e
heterogêneos,
representativos da população global.
Exemplo: um quarteirão de uma cidade, bairros,
municípios.
Amostragem
2. COMPONENTES BÁSICOS DA
REPRESENTATIVIDADE DE UMA AMOSTRA
 De maneira geral, quando trabalha-se com variáveis
qualitativas, o tamanho da amostra varia de 100 a
2000; se a variável é quantitativa o número de
elementos da amostra varia de 30 a 100.
 Estes valores são estabelecidos de acordo com as
restrições de tempo e de custo de cada pesquisa.
 Se não houver restrição de nenhuma natureza faz-se
n=2000 (qualitativa) ou n=100 (quantitativa).
 Se a população é homogênea com cadastro,
recomenda-se usar a amostragem aleatória simples.
Amostragem
3. Plano Amostral
a) População única com cadastro.
Ex : População dos funcionários das Agências
Publicitárias no R.S.
Usar a técnica de AAS.
b) População única volúvel.
Ex : População de clientes de um shopping, de
um super-mercado, etc.
Usar Amostragem Sistemática.
Amostragem
3. Plano Amostral
Ex.: Suponhamos que se quer fazer uma pesquisa de
opinião em uma população de tamanho 40.000
(N=40.000)  vamos tomar uma amostra de tamanho
2.000 (n=2.000) pois a variável é qualitativa e não há
restrição de tempo, custo, etc.
Quota amostral: k = N / n = 40.000 / 2.000 = 20.
A cada 20 clientes, 1 será investigado.
O 1º elemento da amostra é escolhido aleatoriamente
na população, suponhamos o 12º cliente ; o 2º
elemento será o 32º cliente (12 + 20) ; o 3º elemento
será o 52º cliente (32 + 20) e, assim sucessivamente.
Amostragem
3. Plano Amostral
a)
População segmentada. Ex : População de clientes
de uma empresa que possui várias filiais.
Usar Amostragem Estratificada.
Ex.:Suponhamos que quer se fazer uma pesquisa de
opinião sobre o atendimento, ou a aceitabilidade de
um produto, em uma empresa que possui 4 filiais tal
que
Filial 1 : N1 = 5.000 clientes
Filial 2 : N2 = 12.000 clientes
Filial 3 : N3 = 8.000 clientes
 40.000 clientes
Filial 4 : N4 = 15.000 clientes
Amostragem
3. Plano Amostral
Como é uma pesquisa de opinião sem
restrições de tempo, custo, etc, vamos
tomar n = 2.000.
Fração amostral : f = n / N = 2.000 / 40.000 =
0,05 (constante).
Composição da amostra:
n1 = 0,05 x 5.000 = 250
n2 = 0,05 x 12.000 = 600
n3 = 0,05 x 8.000 = 400
n4 = 0,05 x 15.000 = 750
Amostragem
Exemplo 1: Comparação: Testes sobre medicamentos

Avaliação sobre novo analgésico
10 tomam novo medicamento

20 indivíduos selecionados
10 tomam remédio padrão
Remédio
Quantos relataram
diminuição da dor
Novo
8
Padrão
5
A diferença observada é
real ou aleatória?
Amostragem
Exemplo 2: Previsão: Demanda por produtos e serviços

Quantos leitos hospitalares serão necessários?

Quantas vagas serão necessárias nas diferentes séries escolares?

Quanto um supermercado venderá nas festas de fim de ano?
(Métodos estatísticos de previsão)
Amostragem
Exemplo 3. Explicação de resultados

Fatores de prognóstico para pacientes

Fatores de risco para doenças

Determinantes de desempenho escolar
Coleta de Dados – Tipos de dados
DADOS
Dados qualitativos
Dados quantitativos
Ou dados categóricos ou atributos
(podem ser distribuídos em
categorias mutuamente exclusivas.
Consistem em números
que representam
contagens ou medidas
Se distinguem por alguma
característica não-numérica
Ordinais: tem ordenação natural.
Ex: grau de instrução (1a , 2a, etc.)
Nominais (Sexo, cor, causa de
morte, grupo sanguíneo, etc.)
Exemplos: idade,
estatura, peso, etc.
Discretos (inteiros)
Contínuos (cm, kg, etc.)
Coleta de Dados – Tipos de Dados
Como são classificados os dados quantitativos?
DADOS DISCRETOS
São dados referentes às variáveis discretas que assumem valores
inteiros e são resultantes de uma contagem de itens
Representam contagem
São dados quantitativos
DADOS CONTÍNUOS
São os dados referentes às variáveis contínuas que podem assumir
qualquer valor num intervalo contínuo
São dados quantitativos
Representam mensurações (medidas)
Coleta de Dados – Tipos de Dados
Dado
peso de bêbes recém-nascidos
contínuo discreto
X
X
número de cds vendidos no shopping
dureza dos materiais ferrosos
X
X
número de pedestres/min na passarela
altura dos edifícios do centro de BH
X
densidade dos fluidos de petróleo
X
tempo de aula
X
velocidade dos carros de fórmula 1
X
número de carros fabricados em abril
número de animais do pasto abatidos
X
X
Coleta de Dados – Tipos de Dados
DADOS
QUALITATIVOS: ou dados
QUANTITATIVOS: são números que
categóricos ou atributos
representam contagens ou medidas
Nominais
Ordinais
Discretos
Contínuos
São nomes,
rótulos ou
categorias. Não
podem estar
dispostos num
esquema
ordenado.
São dados que
podem estar
dispostos em
alguma ordem,
mas as diferenças
entre os valores
não podem ser
determinadas.
Resultam de um
conjunto finito de
valores possíveis,
sendo dados
normalmente
inteiros.
Representam
contagens.
Resultam de um
conjunto infinito de
valores que podem
estar associados
numa escala
contínua;
Representam
mensurações.
Ex.: Bebida
preferida, tipos de
falhas, etc..
Ex.: Níveis de
avaliação de um
serviço.
Ex.: número de
falhas de cada
máquina da linha.
Ex.: Variações do
diâmetros de um
eixo fabricado.
Coleta de Dados – Tipos de Dados
Dados da mesma população originam diferentes tipos de dados.
natureza dos dados
populações
alunos 2º
grau
contínuo
discreto
nominal
por postos
ou ordinal
idades,
pesos
nº alunos
menino/menina
2º grau
nº defeitos /
carro
automóveis
velocidade
Km/h
vendas de
imóveis
valor em R$ nº ofertas
cores
acima do preço
grau de
limpeza
muito
dispendioso
Coleta de Dados - Introdução
INFORMAÇÕES, DADOS..........
Coleta de
dados
Organização
Análise
Tomada
de decisão
Dados primários
Dados coletados por você
Dados secundários
Dados coletados por
outros
O bom planejamento da
coleta (amostragem)
qualidade dos dados
A quantidade de erros podem até destruir ou prejudicar a validade
dos resultados
Coleta de Dados - Introdução
Quando os dados secundários não estão disponíveis ou eles
são inadequados
O que fazemos
Coletamos os nossos próprios dados
toda a
população
coleta
amostra
levantamento do dinheiro
contido nos caixas do
banco no final do dia
Exame de fezes, de
sangue, urina
Coleta de Dados - Amostragem
AMOSTRAGEM
População
Amostra
Parâmetros
Média
Desvio padrão
Proporção etc.
Inferência
Estatísticas
Média
Desvio padrão
Proporção etc.
Coleta de Dados – Conceitos Importantes
POPULAÇÃO
É uma coleção completa de todos elementos (valores, pessoas, medidas etc.)
a serem estudados.
AMOSTRA
É uma parte extraída dos elementos da população.
CENSO
É uma coleção de dados relativos a todos elementos de uma população.
Coleta de Dados – Conceitos Importantes
POPULAÇÃO, AMOSTRA E CENSO
População
Amostra
Altura de todos alunos do colégio
Altura dos alunos da turma 23 do
colégio
Carros que passam no posto de
pedágio no período de 24:00h
Carros que passam no posto de
pedágio no período de 11:00 às
12:00h
Produção de 30 dias de uma fábrica Produção de 1 dia de uma fábrica
Número de notas fiscais emitidas
em 2006
Número de notas fiscais emitidas
em 1 mês do ano de 2006
PH dos vinhos produzidos na safra
de 2006 no Brasil
PH dos vinhos de 800 garrafas da
safra de 2006 no Brasil
Peso dos pacotes (1Kg) de
macarrão produzidos em dez/2006
Peso de 300 pacotes de macarrão (1
kg) da produção de dez/2006
Download

aula 01 Est[3] - Webgiz