III - Amostragem Prof. Herondino População e amostra População uma população é o conjunto de todos os itens, objetos, coisas ou pessoas a respeito das quais a informação é desejada para a solução de um problema. Amostra Uma amostra é um grupo de itens selecionados por um método cuidadosamente concebido e projetado a partir de uma população. Tipos e procedimento de amostragem Amostragem Simples ou ocasional Todos os elementos da população têm igual probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição. Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos devemos usar a Tabela de Números Aleatórios. Amostragem Sistemática Sendo N o tamanho da população e n o tamanho da amostra desejado, define-se a quantidade chamado intervalo de amostragem. Faz-se um sorteio entre os números 1, 2, 3, ..., K, e se obtém o valor i, onde será o meu primeiro elemento, os demais elementos poderão ser calculados pelo termo geral de uma progressão aritmética. Exemplo Suponha que uma empresa de telefonia fixa deseja saber o grau de satisfação de seus usuários com serviços prestados. O número de assinantes é da ordem de 50.000 e nos desejamos selecionar uma amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços. Solução via Amostragem Aleatória Simples: Devemos ter os assinantes numerados sequencialmente de 1 a 50.000 e somente após seriam selecionados os 1.000 assinantes. Vejamos usando o Excel. Exemplo: sorteio entre os números 1, 2, 3, ..., K Amostragem estratificada É um processo de amostragem usado quando nos deparamos com populações heterogêneas, no qual pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos. Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada uma subpopulação (estrato). As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos números de elementos dos estratos e guardarem a proporcionalidade em relação a variabilidade de cada estrato, obtendo-se uma estratificação ótima Exemplo Vamos obter uma amostra estratificada de 10% da população para a pesquisa da estatura de 90 alunos de uma escola sendo que destes 54 sejam meninos e 36 sejam meninas. São, portanto dois estratos (gênero feminino e gênero masculino) e queremos uma amostra de 10% da população. Numeramos os alunos de 1 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas. Tabela de Números Aleatórios 57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 28 22 53 18 03 – para os meninos; 57 90 80 56 – para as meninas; Com reposição das amostras Sem reposição das amostras V - Descrição e Apresentação dos Dados Dados A palavra "dados" é um termo relativo, tratamento de dados comumente ocorre por etapas, e os "dados processados" a partir de uma etapa podem ser considerados os "dados brutos" do próximo. (Wikipédia) Dados Brutos Em informática dados brutos (raw data) designam os dados/valores recolhidos e estocados tal qual foram adquiridos, sem terem sofrido o menor tratamento (Wikipédia) Dados Brutos Suponhamos o seguintes dados Brutos como sendo a idade de alunos de uma turma de informática 14 12 13 11 12 13 16 14 14 15 17 14 11 13 14 15 13 12 14 13 14 13 15 16 12 12 Frequência A frequência de uma observação é o número de repetições dessa observação no conjunto de observações, ou ainda, é o número de vezes que conjuntos de dados aparecem em uma “população”. Distribuição de Frequência Simples ( f i) Dados ou variável (Idade) xi fi 11 2 12 5 13 6 14 7 15 3 16 2 17 1 Frequência (nº de Alunos) Frequências Relativas A frequência relativa é o valor da frequência absoluta dividido pelo número total de observações. Variável (idade) xi frequência absoluta (Nº de alunos) frequência relativa fr fi 11 2 2/26 = 0,0769 12 5 5/26 = 0,1923 13 6 6/26 = 0,2308 14 7 7/26 = 0,2692 15 3 3/26 = 0,1154 16 2 2/26 = 0,0769 17 1 1/26 = 0,0385 TOTAL N fi = 26 1,0000 Frequência Acumulada Variável freqüência absoluta xi freqüência relativa fr fi frequência absoluta acumulada fa frequência relativa acumulada f ra 11 2 2/26 = 0,0769 2 2/26 = 0,0769 12 5 5/26 = 0,1923 7 7/26 = 0,2692 13 6 6/26 = 0,2308 13 13/26 = 0,5000 14 7 7/26 = 0,2692 20 20/26 = 0,7692 15 3 3/26 = 0,1154 23 23/26 = 0,8846 16 2 2/26 = 0,0769 25 25/26 = 0,9615 17 1 1/26 = 0,0385 26 26/26 = 1,0000 TOTAL f = 26 i f r =1,0000 Regras de arredondamento na Numeração Decimal Norma ABNT NBR 5891 1) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação Exemplo: 1,333 3 arredondado à primeira decimal tornar-se-á 1,3 Regras de arredondamento na Numeração Decimal 2) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for superior a 5, ou, sendo 5, for seguido de no mínimo um algarismo diferente de zero, o último algarismo a ser conservado deverá ser aumentado de uma unidade Exemplo 1,666 6 arredondado à primeira decimal tornar-se-á: 1,7. 4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9. Regras de arredondamento na Numeração Decimal 3) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for 5 seguido de zeros, dever-se-á arredondar o algarismo a ser conservado para o algarismo par mais próximo. Consequentemente, o último a ser retirado, se for ímpar, aumentará uma unidade. Exemplo: 4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6. Regras de arredondamento na Numeração Decimal 4) Quando o algarismo imediatamente seguinte ao último a ser conservado for 5 seguido de zeros, se for par o algarismo a ser conservado, ele permanecerá sem modificação. Exemplo: 4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8. Atividade - III Verificar a altura em centímetro de cada aluno da turma e construir uma sequência de Dados Brutos; 2. A partir dos Dados Brutos obtidos, construir a distribuição de frequência absoluta simples, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891. 1. Histograma Um histograma é uma representação gráfica de uma única variável que representa a frequência de ocorrências (valores dos dados) dentro de categorias de dados. O histograma tanto pode ser representado para as frequências absolutas como para as frequências relativas. Histograma de frequência acumulada (ou ogiva) histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento da frequência acumulada. Distribuição de Frequência em Classe Quando tratamos de variáveis quantitativas contínuas os valores observados devem ser tabulados em intervalos de classes. Para a determinação dessas classes não existe uma regra pré estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada. 1. Definir o número de classes Se n representa o número de observações (na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculado por Número de Classes = n arredondando os resultados. Eexemplo : Se n = 18 e podemos adotar um número de 5 classes, que será razoável. 2. Calcular a amplitude das classes Essa será obtida conhecendo-se o número de classes e amplitude total dos dados. A amplitude total dos dados é o resultado da subtração valor máximo - valor mínimo da série de dados Valor Max - Valor Min Amplitude de classe = número de classes 2. Preparar a tabela de seleção com os limites de cada classe O limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite superior, com exceção da última classe Referência HAIR, Joseph F. et al. Análise Multivariada de Dados. 5ª Porto Alegre, Rs: Bookman, 1998. 51 p.