III - Amostragem
Prof. Herondino
População e amostra
 População
 uma população é o conjunto de todos os itens, objetos, coisas
ou pessoas a respeito das quais a informação é desejada para a
solução de um problema.
 Amostra
 Uma amostra é um grupo de itens selecionados por um
método cuidadosamente concebido e projetado a partir de
uma população.
Tipos e procedimento de amostragem
Amostragem Simples ou ocasional
 Todos os elementos da população têm igual probabilidade de
serem escolhidos. Para uma população finita o processo deve
ser sem reposição.
 Todos os elementos da população devem ser numerados. Para
realizar o sorteio dos elementos devemos usar a Tabela de
Números Aleatórios.
Amostragem Sistemática
 Sendo N o tamanho da população e n o tamanho da amostra
desejado, define-se a quantidade
chamado intervalo de
amostragem.
 Faz-se um sorteio entre os números 1, 2, 3, ..., K, e se obtém
o valor i, onde será o meu primeiro elemento, os
demais elementos poderão ser calculados pelo termo geral de
uma progressão aritmética.
Exemplo
 Suponha que uma empresa de telefonia fixa deseja saber o
grau de satisfação de seus usuários com serviços prestados. O
número de assinantes é da ordem de 50.000 e nos desejamos
selecionar uma amostra aleatória de 1.000 assinantes com o
intuito de obter a avaliação sobre os serviços.
 Solução via Amostragem Aleatória Simples:
 Devemos ter os assinantes numerados sequencialmente
 de 1 a 50.000 e somente após seriam selecionados os 1.000
assinantes. Vejamos usando o Excel.
Exemplo:
sorteio entre os números 1, 2, 3, ..., K
Amostragem estratificada
 É um processo de amostragem usado quando nos deparamos
com populações heterogêneas, no qual pode-se distinguir
subpopulações mais ou menos homogêneas, denominados
estratos.
 Após a determinação dos estratos, seleciona-se uma amostra
aleatória de cada uma subpopulação (estrato).
 As diversas subamostras retiradas das subpopulações
devem ser proporcionais aos respectivos números de
elementos dos estratos e guardarem a proporcionalidade em
relação a variabilidade de cada estrato, obtendo-se uma
estratificação ótima
Exemplo
 Vamos obter uma amostra estratificada de 10% da população
para a pesquisa da estatura de 90 alunos de uma escola sendo
que destes 54 sejam meninos e 36 sejam meninas.
 São, portanto dois estratos (gênero feminino e gênero
masculino) e queremos uma amostra de 10% da população.
Numeramos os alunos de 1 a 90, sendo que de 01 a 54 correspondem
meninos e de 55 a 90, meninas.
Tabela de Números Aleatórios
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
28 22 53 18 03 – para os meninos;
57 90 80 56 – para as meninas;
Com reposição das amostras
Sem reposição das amostras
V - Descrição e Apresentação dos
Dados
Dados
 A palavra "dados" é um termo relativo, tratamento de dados
comumente ocorre por etapas, e os "dados processados" a
partir de uma etapa podem ser considerados os "dados
brutos" do próximo. (Wikipédia)
 Dados Brutos
 Em informática dados brutos (raw data) designam os
dados/valores recolhidos e estocados tal qual foram
adquiridos, sem terem sofrido o menor tratamento
(Wikipédia)
Dados Brutos
 Suponhamos o seguintes dados Brutos como sendo a idade
de alunos de uma turma de informática
14
12
13
11
12
13
16
14
14
15
17
14
11
13
14
15
13
12
14
13
14
13
15
16
12
12
Frequência
 A frequência de uma observação é o número de repetições
dessa observação no conjunto de observações, ou ainda, é o
número de vezes que conjuntos de dados aparecem em uma
“população”.
Distribuição de Frequência Simples ( f i)
Dados ou
variável
(Idade)
xi
fi
11
2
12
5
13
6
14
7
15
3
16
2
17
1
Frequência
(nº de Alunos)
Frequências Relativas
 A frequência relativa é o valor da frequência absoluta dividido
pelo número total de observações.
Variável
(idade)
xi
frequência absoluta
(Nº de alunos)
frequência relativa
fr
fi
11
2
2/26 = 0,0769
12
5
5/26 = 0,1923
13
6
6/26 = 0,2308
14
7
7/26 = 0,2692
15
3
3/26 = 0,1154
16
2
2/26 = 0,0769
17
1
1/26 = 0,0385
TOTAL
N   fi
= 26
1,0000
Frequência Acumulada
Variável
freqüência
absoluta
xi
freqüência relativa
fr
fi
frequência
absoluta
acumulada
fa
frequência
relativa acumulada
f ra
11
2
2/26 = 0,0769
2
2/26 = 0,0769
12
5
5/26 = 0,1923
7
7/26 = 0,2692
13
6
6/26 = 0,2308
13
13/26 = 0,5000
14
7
7/26 = 0,2692
20
20/26 = 0,7692
15
3
3/26 = 0,1154
23
23/26 = 0,8846
16
2
2/26 = 0,0769
25
25/26 = 0,9615
17
1
1/26 = 0,0385
26
26/26 = 1,0000
TOTAL
 f = 26
i
f
r
=1,0000
Regras de arredondamento na
Numeração Decimal
 Norma ABNT NBR 5891
 1) Quando o algarismo imediatamente seguinte ao último
algarismo a ser conservado for inferior a 5, o último
algarismo a ser conservado permanecerá sem modificação
 Exemplo:
1,333 3 arredondado à primeira decimal tornar-se-á 1,3
Regras de arredondamento na
Numeração Decimal
 2) Quando o algarismo imediatamente seguinte ao último
algarismo a ser conservado for superior a 5, ou, sendo 5,
for seguido de no mínimo um algarismo diferente
de zero, o último algarismo a ser conservado deverá ser
aumentado de uma unidade
 Exemplo
 1,666 6 arredondado à primeira decimal tornar-se-á: 1,7.
4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.
Regras de arredondamento na
Numeração Decimal
 3) Quando o algarismo imediatamente seguinte ao
último algarismo a ser conservado for 5 seguido de
zeros, dever-se-á arredondar o algarismo a ser conservado
para o algarismo par mais próximo. Consequentemente, o
último a ser retirado, se for ímpar, aumentará uma unidade.
 Exemplo:
4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6.
Regras de arredondamento na
Numeração Decimal
4) Quando o algarismo imediatamente seguinte ao último
a ser conservado for 5 seguido de zeros, se for par o
algarismo a ser conservado, ele permanecerá sem
modificação.
 Exemplo:
4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.
Atividade - III
Verificar a altura em centímetro de cada aluno da turma e
construir uma sequência de Dados Brutos;
2. A partir dos Dados Brutos obtidos, construir a distribuição
de frequência absoluta simples, a frequência relativa,
frequência acumulada e frequência relativa acumulada. Para
o arredondamento utilize a regra da ABNT 5891.
1.
Histograma
 Um histograma é uma representação gráfica de uma única
variável que representa a frequência de ocorrências (valores
dos dados) dentro de categorias de dados.
 O histograma tanto pode ser representado para as
frequências absolutas como para as frequências relativas.
Histograma de frequência acumulada
(ou ogiva)
 histograma de frequência acumulada (ou ogiva) é a
representação gráfica do comportamento da frequência
acumulada.
Distribuição de Frequência em Classe
 Quando tratamos de variáveis quantitativas contínuas os valores





observados devem ser tabulados em intervalos de classes.
Para a determinação dessas classes não existe uma regra pré
estabelecida, sendo necessário um pouco de tentativa e erro para a
solução mais adequada.
1. Definir o número de classes
Se n representa o número de observações (na amostra ou na
população, conforme for o caso) o número aproximado de classes
pode ser calculado por Número de Classes = n arredondando os
resultados.
Eexemplo :
Se n = 18 e podemos adotar um número de 5 classes, que será
razoável.
 2. Calcular a amplitude das classes
 Essa será obtida conhecendo-se o número de classes e
amplitude total dos dados.
 A amplitude total dos dados é o resultado da subtração valor
máximo - valor mínimo da série de dados
Valor Max - Valor Min
Amplitude de classe =
número de classes
 2. Preparar a tabela de seleção com os limites de
cada classe
 O limite superior de cada classe é aberto (e
consequentemente, o limite inferior de cada classe é
fechado), ou seja, cada intervalo de classe não inclui o valor
de seu limite superior, com exceção da última classe
Referência
 HAIR, Joseph F. et al. Análise Multivariada de
Dados. 5ª Porto Alegre, Rs: Bookman, 1998. 51 p.
Download

Amostra