ESTATÍSTICA EXPLORATÓRIA Prof Paulo Renato A. Firmino [email protected] Aulas 01-02 Motivação/Justificativa • brain storm: Escreva o que vier à cabeça ao ler os textos: “SUA PROFISSÃO” “A ESTATÍSTICA” • Haverá mesmo alinhamento entre esses dois mundos? “A ESTATÍSTICA NA MINHA PROFISSÃO” Elaborem (em grupos de até 3) um problema característico da sua futura área de atuação profissional cuja solução requeira conceitos estatísticos • • Descrevam em, no máximo, 500 palavras Enviem por email até a próxima aula Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 2 Referências • 1. 2. 3. 4. 5. 6. 7. • 1. 2. 3. 4. BÁSICAS BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística: para cursos de engenharia e informática. 3ª Ed. São Paulo: Atlas, 2010. BUSSAB, W. O. & MORETIN, C. A. Estatística Básica. 6 ed. SP: Saraiva, 2010. HOFFMANN, R. Estatística para Economistas. 3ª. ed. rev. e ampl. São Paulo: Livraria Pioneira,1998. 430 p. VIEIRA, S.; HOFFMANN, R. Estatística Experimental. São Paulo: Editora Atlas, l989. 179 p. GONÇALVES, F. A. Introdução à Estatística: estatística descritiva. São Paulo: Atlas, 1976. 224p. http://www.r-tutor.com/content/r-tutorial-ebook http://rstudio.org/ COMPLEMENTAR: SPIEGEL, Murray R. Estatística. 2ª. São Paulo: McGraw-Hill, 1985. 454 p. BERQUO, Elza S.; SOUZA, José M.P.; GOTLIEL, Sabina. Bioestatística. 2ªed. São Paulo: EPU, 1981. 350p. HOEL, Paul G. Estatística Elementar. São Paulo: Editora Atlas, 1992. 430 p. FONSECA, Jairo S. da, MARTINS, Gilberto de A. Curso de Estatística. São Paulo: Editora Atlas, 1982. Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 3 Estatística Exploratória - Sumário • 06243_EstatExplor_planoDeEnsino.pdf 4 Estatística • Busca-se responder questões, testar hipóteses, prever o futuro, diagnosticar causas • Converte dados em informação, permitindo um diferencial competitivo: Maior controle interno Maior capacidade de planejamento Redução de incertezas Otimização • A Estatística ajuda a medir e elevar a Qualidade • Elas nos permite medir riscos Decidir racionalmente Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 5 Estatística • Estágios para o estudo estatístico: Exemplo Formulação: Declara-se o problema e discrima-se as variáveis de interesse 1. • • Perfil sócio-econômico dos alunos da turma Variáveis de interesse: ??? Planejamento: Determina-se como coletar os dados e quais ferramemtas estatísticas serão adotadas 2. • • Selecioar aleatoriamente 8 alunos Como coletar? Análise exploratória: Tem-se o primeiro contato estatístico com os dados disponíveis. Filtra-se prováveis erros de digitação 4. Análise Inferencial: Modela-se o problema e infere-se sobre a população baseando-se nas conclusões amostrais 3. Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 6 Tipos de Variáveis • Qualitativas: Seus possíveis resultados são qualidades, atributos, categorias: • Quantitativas: Seus possíveis resultados são quantidades numéricas, resultantes de uma contagem ou mensuração: • Nominais: Não há qualquer relação matemática entre as categorias da variável Ordinais: Pode-se ordenar as categorias Discretas: Seus possíveis resultados formam um conjunto finito ou enumerável Contínuas: Seus possíveis resultados formam um inervalo de números reais Rotineiramente variáveis qualitativas são registradas com valores numéricos, gerando a falsa impressão de serem quantitativas discretas Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 7 Tipos de variáveis Variáveis Funções dos resultados do experimento Qualitativas Valores são qualidades Nominais Valores não permitem qualquer operação matemática •Marca (1- Dell, 2-HP, 3-Positivo, ...) •Cor (1- branco, 2- prata, 3- preto, ...) •País de origem (1- BR, 2- CH, 3-EUA, ...) Ordinais Valores permitem ordenação •Nível de estresse (1- baixo, 2-médio, 3-alto) •Escolaridade(1-ens fundam, 2-ens médio, 3ens sup) •Qualidade de vida (1- boa, 2- ruim) Quantitativas Valores são quantidades Discretas Valores formam um conjunto finito ou enumerável Contínuas Valores são números reais •Nº de itens defeituosos (0, 1, 2, ...) •Nº de reincidências de quebra (0, 1, 2, ...) •Nº de peças defeituosas dentre n compradas (0, 1, ..., n) •Peso (>0) •Tempo até o reparo (≥0) •Saldo bancário (número real) 8 Variáveis (Qualitativas) Nominais • Cada categoria pode ser rotulada por um número, o qual não possui significado matemático: • É comum o uso da freqüência de ocorrências de cada categoria [freq(·)] como fonte de análise: • • 3+3=6 é falsa, 5>3 é falsa … freq(1) + freq(2) = 6 é verdadeira, freq(1) > freq(3) é verdadeira … As categorias devem ser mutuamente exclusivas e exaustivas Exemplo: cor de produto, marca de produto, região de procedência de insumo Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 9 Variáveis (Qualitativas) Ordinais • Cada categoria pode ser rotulada por um número proporcional à sua magnitude relativa às demais categorias: • Contudo, a distância entre os rótulos das categorias não é matemática definida: • • Suas categorias podem ser ordenadas entre si 1 < 2 é verdadeira… 6 = 2·3 pode ser falsa, 4 – 3 = 1 pode ser falsa … As categorias devem ser mutuamente exclusivas e exaustivas Exemplo: Avaliação (de péssimo a ótimo), Condição (de inaceitável a ideal), Degradação (de mínima a máxima) Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 10 Variáveis Quantitativas • Cada categoria é, de fato, um número real (para variáveis contínuas) ou inteiro (para variáveis discretas): • Pode-se usar todas as operações matemáticas • A distância entre as categorias é matematicamente definida 1 < 2 é verdadeira, 4 – 3 = 1 é verdadeira … 6 = 2·3 é verdadeira, 4 = 16/4 é verdadeira … Exemplo: Número de ocorrências de determinada categoria de uma variável nominal [freq(·)], Peso de componente, Tempo de falha de componente, inflação, juros Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 11 Tipos de Variáveis - Exercício • Exercício 1: Identificar (justificando se preciso) o tipo e a escala (conjunto de possíveis resultados) das seguintes variáveis: 1. 2. 3. 4. 5. 6. 7. Tempo até a falha Preferência por dada marca Cor da peça Satisfação de um cliente Tempo de execução de determinada tarefa manual Tipo de memória a ser fabricada PIB Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 12 Tipos de Variáveis • Note-se que a depender do tipo da variável em mãos, o analista pode ou não utilizar medidas como a média e a variância, por exemplo • A média aritmética soma valores e ao final divide tal soma pelo número de observações Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 13 Estatística Descritiva – Tabelas • Distribuições de frequência: Expõem distribuições de percentagens, proporções, freqüências Agrupam os dados relativos a uma variável Degradação (Y) Baixa Moderada Alta freq 53 40 7 Tempo de falha (T) freq [0, 20) 53 [20, 30) 38 [30, 40) 7 [40, -) 2 table(x) Fornecedor (X) A freq 53 B 47 limits<-range(x) nIntervals <- 4 delta <- (limits[2]-limits[1])/nIntervals grid <- seq(limits[1], limits[2], by=delta) freq <- cut(x, grid, right=FALSE) table(freq) Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 14 Estatística Descritiva – Tabelas • Exercício 1: Elabore a distribuição de frequências para os seguintes casos 1. Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1, 1, 2, 1 2. Grau de instrução de entrevistados (1- sem formação, 2-1º grau, 32º grau, 4-outros): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 2, 2, 3 3. Nº de homens em grupos de 6 pessoas de uma comunidade: 0, 3, 2, 1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0 4. Elabore distribuições de frequência para o conjunto de dados “BSI01”, em anexo. Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 15 Estatística Descritiva – Tabelas • Distribuições de frequência para Variáveis contínuas: 1. O número de subintervalos (partições, classes), k, pode ser definido como o inteiro mais próximo da raiz quadrada de n (o número de observações) 2. Os subintervalos podem ter a mesma amplitude (diferença entre os extremos) ou amplitudes diferentes 3. A amplitude dos subintervalos pode ser definida como a razão entre a amplitude da amostra e k Exemplo: tempo até a falha = {5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4, 0.3} Exercício 2: agrupar os dados relativos aos tempos de manutenção: {2, 14, 1.2, 7, 5.4, 3, 7, 3.5, 4, 1.9, 4.7, 1.3, 7.9, 9.5, 1.2} Estatí Estatística Explorató Exploratória - Paulo Renato A. Firmino 16