Probabilidade e Estatística Ciência da Computação Parte 5 Introdução à Estatística Prof. Adriano Pasqualotti Objetivos n n n n Definir os termos utilizados na área de Estatística Definir dados quantitativos e qualitativos Definir os níveis de mensuração Descrever os métodos de amostragem 2/46 Problema n Programa de televisão realiza pesquisa para verificar a opinião dos telespectadores sobre a permanência da sede das Nações Unidas nos USA n n Os telespectadores pagavam 50 centavos de dólar para fazer a chamada telefônica Dos 186.000 que responderam, 67% disseram que a sede da ONU devia sair dos USA 3/46 1 Estatística n A palavra pode ser usada com dois sentidos n n n Em relação a números específicos obtidos de dados Como método de análise É uma coleção de métodos para planejar experimento, obter, organizar, resumir, analisar, interpretar e extrair conclusões de dados 4/46 Definição de termos extensamente utilizados n População (N) n n Consiste na totalidade de unidades de observação a partir das quais se deseja tomar uma decisão Censo n Exame de todas as unidades de observação de uma população 5/46 Definição de termos extensamente utilizados n Amostra (n) n n Parâmetro n n Conjunto de unidades selecionadas de uma população É uma medida numérica que descreve uma característica de uma população Estatística n É uma medida numérica que descreve uma característica de uma amostra 6/46 2 A natureza dos dados n Dados qualitativos (dados categóricos ou atributos) n n Podem ser separados em diferentes categorias que se distinguem por alguma característica não-numérica Dados quantitativos n Consistem em números que representam contagem ou medidas 7/46 A natureza dos dados quantitativos n Dados discretos n n Resultam de um conjunto finito de valores possíveis ou infinito enumerável Dados contínuos (numéricos) n Resultam de um conjunto infinito de valores possíveis que podem ser associados a pontos em uma escala contínua 8/46 Exemplos de dados qualitativos n n n n n Sexo: masculino e feminino Religião: católica, judaica e protestante Naturalidade: carioca, paulista, gaúcho e mineiro Cor dos olhos: castanho, verdes e azuis Faixa etária: até 25 anos, de 26 a 49 anos e acima de 50 anos 9/46 3 Exemplos de dados quantitativos discretos n n n n Quantidade de valores de uma moeda: 1, 2, 5, 10, 20, 50 e 100 Número de alunos em uma sala de aula Número de enfermeiros em um hospital Quantidade de sabores de um suco: tangerina, laranja, maracujá, abacaxi e maçã 10/46 Exemplos de dados quantitativos contínuos n n n Valor do patrimônio dos hospitais de Passo Fundo: R$ 1.700.000,00; R$ 11.240,00; R$ 120.977.174,96 Duração de uma bateria de marcapasso: 463h, 345h35min, e 1.280h Valor de cirurgia paga pelo SUS: R$ 170,32 e R$ 11,24 11/46 Exercício proposto n Identifique cada número como discreto ou contínuo. 12/46 4 Problemas n n n Cada cigarro Camel tem 16,13 mg de alcatrão O altímetro de um avião da American Airlines indica uma altitude de 21.359 pés Uma pesquisa efetuada com 1.015 pessoas indica que 40 delas são assinantes de um serviço de computador on-line 13/46 Escalas utilizadas n Nominal n n Os dados consistem em nomes, rótulos ou categorias Ordinal n Os dados podem ser dispostos em alguma ordem 14/46 Escalas utilizadas n Intervalar n n n Os dados podem ser dispostos em alguma ordem e também há variação numérica entre as características Uma unidade de medida (arbitrária e fixa) Um zero relativo (convencional) 15/46 5 Escalas utilizadas n Racional n n n n Os dados podem ser dispostos em alguma ordem e também há variação numérica entre as características Uma unidade de medida (arbitrária e fixa) Um zero absoluto Diferenças e razões entre os dados têm significado 16/46 Exemplos de níveis de mensuração n Nominal n n n Sexo dos alunos em uma turma de estatística Respostas do tipo “sim” ou “não” Ordinal n n Editor classifica originais como excelente, “bons” ou “maus” Posição de corretores em uma prova 17/46 Exemplos de níveis de mensuração n Intervalar n n n Os anos 1000, 2000, 1876 e 1984 As temperaturas anuais médias (em °C) das capitais dos estados brasileiros Racional n n Pesos de artigos de material plástico descartados pelos hospitais Duração (em min) de filmes 18/46 6 Exercício proposto n Determine o nível de mensuração mais adequado. 19/46 Problemas n n n Classificação como superior, acima da média, médio, abaixo da média ou pobre para encontros marcados com desconhecidos Conteúdo de nicotina (em mg) de cigarros Camel Números de inscrições no INSS 20/46 Problemas n n n Rendas anuais de enfermeiras Carros classificados como subcompacto, compacto, intermediário ou grande Classificação do prefeitos da capitais da região sul (em uma escala de 0 a 10): Curitiba 6,7; Porto Alegre 6,4; Florianópolis 6,4 21/46 7 Amostragem n n Processo pelo qual uma amostra de unidade da população é observada Envolve pelo menos dois passos n n n Escolha das unidades Registro das observações Sem reposição n As unidades são selecionadas apenas uma vez 22/46 Amostragem n Com reposição n n As unidades são selecionadas mais de uma vez Justificativas para o seu uso n n n Escassez de tempo e recursos Testes destrutivos Impossibilidade de estudar a totalidade 23/46 Amostragem n Coleta de dados por observação direta n n n As unidades de observação são obtidas pelo próprio pesquisador Através de um instrumento Coleta de dados por observação indireta n As unidades de observação são obtidas através de consulta à fontes secundárias 24/46 8 Tipos de amostragem n Amostragem aleatória simples n n Processo de retirada de uma amostra de população no qual cada unidade tem a mesma chance de ser retirada Nomes em cartões ou tabela de dígitos pseudo-aleatórios 124-222 671-481 25/46 Exemplo amostragem aleatória simples n Selecionar, aleatoriamente, dez unidades de uma população de tamanho N = 874 n Utilizando tabela de dígitos pseudoaleatórios 874; 855; 422; 257; 706; 362; 434; 338; 365, 922; 767; 26/46 Tipos de amostragem n Amostragem estratificada n Subdivide a população em, no mínimo, duas subpopulações (estratos) que compartilham das mesmas características e, em seguida, extraí-se uma amostra de cada estrato 27/46 9 Exemplo amostragem estratificada n O TER dos Estados quer verificar, no conjunto do eleitores, quanto são homens ou mulheres, quanto estão em cada faixa etária pesquisada e quantos estão na capital ou no interior n n Dividir a população em termos de sexo, faixa etária e tipo de cidade Escolha da unidade por sorteio aleatório 28/46 Tipos de amostragem n Amostragem sistemática n Escolhe-se um ponto de partida, e seleciona-se cada k-ésimo elemento da população 29/46 Exemplo amostragem sistemática n Selecionar, aleatoriamente, dez unidades de uma população de tamanho N = 874 n Definir intervalo de seleção: 874/10 = 87,4 ≅ 87 (aproxima-se sempre para menos) 87; 174; 261; 348; 435; 522; 609; 696; 783; 870; 30/46 10 Tipos de amostragem n Amostragem por conglomerado n Divide-se a área da população em seções (conglomerados); em seguida escolhe-se algumas dessas seções e, finalmente, toma-se todos os elementos das seções escolhidas 31/46 Exemplo amostragem por conglomerado n Um enfermeiro quer entrevistar todos os pacientes internados em uma UTI de cada 10 hospitais das cidades da região do planalto n n n Dividir em seções as UTIs dos hospitais Selecionar aleatoriamente alguma dessas UTIs Tomar todos os pacientes dessas UTIs 32/46 Exercícios proposto n Identifique o tipo de amostragem utilizado: aleatória, estratificada, sistemática ou por conglomerado. 33/46 11 Problemas n n Quando escreveu Women and love: A Cultural Revolution, a autora Shere Hite baseou-se suas conclusões em 4.500 respostas a 100.000 questionários distribuídos a mulheres Um sociólogo da UPF seleciona 12 homens e 12 mulheres de cada uma das quatro turmas de inglês 34/46 Problemas n n Um psicólogo da Universidade de Nova York faz uma pesquisa sobre todos os estudantes de cada uma de 20 turmas selecionadas aleatoriamente A empresa Sony seleciona cada 200º CD de uma linha de produção e faz um teste de qualidade rigoroso 35/46 Problemas n n Um cabo eleitoral escreve o nome de cada senador do Brasil em cartões separados, mistura-os e extrai 10 nomes O programa Planejamento Familiar pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais 36/46 12 Problemas n n Um pesquisador de mercado da Varing entrevista todos os passageiros de cada um de 10 vôos selecionados aleatoriamente Um repórter da revista Veja entrevista todo 50º gerente geral constante da relação dos 1000 hospitais com maior número de internações pelo SUS 37/46 Exercício proposto n Selecionar unidades de observação de uma população utilizando a tabela de dígitos pseudo-aleatórios 38/46 Problema n Selecionar, aleatoriamente, 15 unidades de uma população de tamanho N = 3.467. A leitura deverá iniciar de baixo para cima, a partir da última coluna 39/46 13 Solução do problema – tabela de dígitos pseudo-aleatórios 2700; 753; 1014; 1475; 3361; 2124; 3205; 2770; 990; 3262; 3062; 559; 395; 3060; 1467; 40/46 Tipos de estudos n Observacional n n Verifica e mede-se as características específicas, mas não tenta-se manipular ou modificar os elementos a serem estudados Experimento n Aplica-se determinados tratamentos e passa-se a observar seus efeitos 41/46 Exercícios proposto n Determine se a descrição dada corresponde a um estudo observacional ou a um experimento. 42/46 14 Problemas n n Mede-se o conteúdo de alcatrão, nicotina e monóxido de carbono em diferentes marcas de cigarro Pede-se a fumantes que reduzem à metade o número de cigarros consumidos diariamente, para que se possam medir os efeitos sobre a freqüência de pulsação 43/46 Problema n Em uma turma de educação física, estuda-se o efeito dos exercícios físicos sobre a pressão sanguínea, determinando-se que a metade dos estudantes ande 2 km cada dia, enquanto a outra metade corra 2,0 km diariamente 44/46 Problema n Estuda-se a relação entre os pesos de ursos e seus comprimentos, tomandose as medidas e ursos anestesiados 45/46 15 Atividade em grupo n Deseja-se fazer uma pesquisa junto a estudantes de tempo integral do curso de Computação da UPF. Planeja e descreva detalhadamente um processo para obter uma amostra aleatória de 100 estudantes. 46/46 16