Estatística Básica Utilizando o Excel Fernando Augusto Silva Marins [email protected] 1a. Aula – Estatística Descritiva Novembro/2004 FEG & FOSJC 1 1. Introdução à Estatística Há um século, H. G. Wells dizia: “Raciocinar estatisticamente será um dia tão necessário quanto a habilidade de ler e escrever” Hoje: problema não é de escassez de informação, mas como utilizar a informação abundante disponível para tomar as melhores decisões Novembro/2004 FEG & FOSJC 2 Por que um Pesquisador Precisa Conhecer Estatística? Apresentar e descrever informações de forma adequada Tirar conclusões a partir de amostras Melhorar os Processos Obter Previsões confiáveis Variáveis de Interesse Novembro/2004 a partir de FEG & FOSJC 3 Por que um Pesquisador Precisa Conhecer Estatística? Apresentar e Descrever Informações Estatística Descritiva Conclusões sobre a população a partir de Amostras Distribuições de Probabilidade Estimação de Parâmetros Novembro/2004 Testes de Hipóteses Melhorar Processos Obter Previsões Confiáveis Aplicações Estatísticas em CQ e na Produtividade Correlação e Regressão Simples Regressão Múltipla Análise de Séries Temporais FEG & FOSJC 4 O Crescimento e o Desenvolvimento da Estatística Moderna Últimos 30 anos de Estatística: Mainframes (1960 – 1970): SAS, SPSS Microcomputadores (1980 – hoje): Pacotes: SAS, SPSS, MINITAB, STATISTICA, STATGRAPHICS Planilhas: VISICALC (1979) LOTUS 1-2-3 (1983), EXCEL (Microsoft Office – integra planilha de cálculo, editor de texto e gráficos) Novembro/2004 FEG & FOSJC 5 Estatística Descritiva & Estatística Indutiva Estatística Descritiva: coleta, apresentação e caracterização de conjunto de dados Formulação da Teoria da Probabilidade (Jogos de azar) e Amostragem Estatística Indutiva (final século 19): fornece elementos para tomada de decisão referente à população com base em amostras Novembro/2004 FEG & FOSJC 6 Definições População (universo) é considerados no estudo a totalidade dos itens Amostra é a parte da população selecionada para análise Parâmetro é uma medida calculada para descrever uma característica de toda uma população estatística é uma medida calculada para descrever uma característica de apenas uma amostra da população Novembro/2004 FEG & FOSJC 7 População e Amostra População Amostra estatísticas para estimar atitudes Parâmetros para estimar atitudes Conclusões sobre a População a partir da Amostra Novembro/2004 FEG & FOSJC 8 Estatística Descritiva Coletar dados Apresentar dados Pesquisa (Survey) Tabelas e gráficos Caracterizar dados Média Amostral = Novembro/2004 X i n FEG & FOSJC 9 Estatística Indutiva Estimação Estimar o peso médio da população usando o peso médio de uma amostra Testes de Hipóteses Testar se o peso médio da população é maior que 70 quilos Tirando conclusões e/ou tomando decisões sobre a população baseado em resultados amostrais. Novembro/2004 FEG & FOSJC 10 Por que dados são necessários? Oferecer insumo para pesquisa/estudo Avaliar desempenho (conformidade) de processo de produção/serviço em andamento Assessorar formulação de ações alternativas na tomada de decisão Novembro/2004 FEG & FOSJC 11 Por que dados são necessários? Afinal, o que são dados? Informação numérica necessária para a tomada de decisão bem fundamentada Novembro/2004 FEG & FOSJC 12 Fontes de Dados Primária Secundária Coletar dados Dados Compilados Observação Survey Impresso ou Eletrônico Experimentação Novembro/2004 FEG & FOSJC 13 Tipos de Dados Dado (Variável) Categorizada (Qualitativa) Numérica (Quantitativa) Discreta Novembro/2004 Contínua FEG & FOSJC 14 Variáveis Qualitativas Resulta de uma classificação por tipos ou atributos População: peças produzidas numa máquina Variável: qualidade (perfeita ou defeituosa) Novembro/2004 FEG & FOSJC 15 Variáveis Quantitativas Valores podem ser expressos em números Discretas: interpretação do seu valor é exatamente este valor População: aparelhos produzidos numa linha de montagem Variável: número de defeitos por aparelho Contínuas: interpretação do seu valor é que se trata de um valor aproximado (depende do instrumento de medida usado) População: peças produzidas numa máquina Variável: diâmetro externo Novembro/2004 FEG & FOSJC 16 Tipos de Métodos de Amostragem Motivos para efetuar Amostragem Menos tempo e custo menor que um censo Mais eficiente e prático que um censo Inacessibilidade à toda a população Novembro/2004 FEG & FOSJC 17 Tipos de Métodos de Amostragens Amostra Probabilística Não-probabilística Aleatória Simples Intencional A Esmo Sistemática Voluntária Novembro/2004 Estratificada Grupo (Cluster) FEG & FOSJC 18 Amostragem Não-probabilística População-objeto e População amostrada (acessível) Simples (Ex: Retirar 50 parafusos a esmo de 1 caixa com 10.000) Uso por impossibilidade de se obterem amostras probabilísticas (Ex:população líquida) Inacessibilidade a toda a população (Ex1: minério, Ex2: parte da população é hipotética) Pode ser equivalente ao uso de amostras probabilísticas Novembro/2004 FEG & FOSJC 19 Amostragem Probabilística Itens da amostra escolhidos com base em probabilidades conhecidas Amostra Probabilística Aleatória Simples Novembro/2004 Sistemática Estratificada Cluster FEG & FOSJC 20 Amostra Aleatória Simples Cada item tem a mesma chance de ser selecionado Selecionamento reposição pode ser com ou sem Uso de Tabelas de Números Aleatórios Novembro/2004 FEG & FOSJC 21 Uso de Tabelas de Números Aleatórios Empresa deseja selecionar amostra de 20 trabalhadores de horário integral a partir da população de 500 colaboradores nessa situação. Amostra Aleatória Simples: Associar um código de 3 dígitos a cada colaborador, ordenados por ordem alfabética, de 001 a 500. Escolher, ao acaso, um dígito de partida na Tabela de Números Aleatórios Indo da esquerda para a direita, e de cima para baixo, na tabela, selecionar 20 números com 3 dígitos entre 001 e 500, sem pular ou repetir, identificando assim a amostra. Novembro/2004 FEG & FOSJC 22 Uso de Tabelas de Números Aleatórios Coluna Linha 12345 67890 12345 67890 12345 67890 ... ............................................................................. 05 33850 58555 51438 85507 71865 79488 ... 06 97340 03364 88472 04334 63919 36394 ... 07 70543 29776 10087 10072 55980 64688 ... .............................................................................. Escolhido dígito para iniciar: Linha 06 e Coluna 05 Números gerados: 003, 364, 433, 463, 363, ... Novembro/2004 FEG & FOSJC 23 Amostragem Sistemática Decidir tamanho da amostra: n Calcular k=N/n Aleatoriamente selecionar 1 item Selecionar os k-ésimos ítens a partir desse inicial N = 64 n=8 Novembro/2004 k=8 FEG & FOSJC 24 Amostra Estratificada População é dividida em 2 ou mais grupos de acordo com alguma característica em comum Em cada grupo aleatória simples aplicar a amostragem As amostras são combinadas em uma única Novembro/2004 FEG & FOSJC 25 Amostras de Grupos (Clusters) População é composta representativos de vários clusters Aplicar amostragem aleatória simples em alguns clusters Combinar as amostras em uma única 4 clusters foram escolhidos. Novembro/2004 FEG & FOSJC 26 Tipos de Erros em Pesquisas Qual é o objetivo? Usa Amostragem Probabilística? Erro de Cobertura – Listagem adequada? Erro por falta de resposta – follow up Erros de Medidas formuladas? – boas questões Erros de Amostragem – Margem de precisão Novembro/2004 FEG & FOSJC 27 Tipos de Erros em Pesquisas Itens Excluídos Erro de Cobertura Erros por Falta de Resposta Erros de Amostragem Erros de Medidas Novembro/2004 Follow up nas faltas de respostas. Oportunidade diferente de Amostra para Amostra. FEG & FOSJC 28