Janeiro, 2015 Estatística Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa>, A Estatística Estatística: É a parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados para utilização em tomadas de decisão. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 2 Fases do Método Estatístico Coleta de Dados: Onde são coletadas as informações que irão gerar dados para analise. Crítica dos Dados: Procura de possíveis falhas e imperfeições, que possam influir nos resultados. Apuração dos Dados: A soma e o processamento dos dados obtidos. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 3 Fases do Método Estatístico Exposição dos Dados: Tabelas, gráficos. Análise dos Dados: Conclusões obtidas a partir de informações por parte representativa do todo Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 4 Estatística Variáveis Variáveis: Os objetos escolhidos para estudo. Exemplo: Dentro de um determinado grupo de pessoas que foram ao cinema, podemos estudar os seguintes itens: Estado Civil Sexo Escolaridade Renda Mensal Idade Meio de Transporte Etc... Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 5 Estatística Tipos de Variáveis (Qualitativa / Quantitativa) Podemos classificar em: Qualitativa Classifica os elementos de uma população em estudo segundo uma qualidade particular ou algum tipo de atributo. Exemplo: Cor de pele (branca, negra, etc); cor dos olhos (azul, verde, castanho, etc); comprimento do cabelo (longo, curto). Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 6 Estatística Tipos de Variáveis (Qualitativa / Quantitativa) Quantitativa Quando pesquisadas resultam em valores numéricos. Exemplo: Renda familiar; Peso; altura; etc A variável quantitativa pode ser dividida em: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 7 Estatística Variável Quantitativa (Continua/Discreta) Contínua Quando assumir, teoricamente, qualquer valor entre dois limites. Exemplo: A medida da temperatura do corpo humano não pode passar de 36º para 37,5º, sem percorrer os valores intermediários. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 8 Estatística Variável Quantitativa (Continua/Discreta) Discreta Quando resulta de uma contagem. Exemplo: A quantidade de defeitos observados em uma determinada superfície pintada, resultando em números inteiros. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 9 Estatística População: Conjunto de todos os elementos existentes ou possíveis de existirem que possua, pelo menos, uma característica em comum.. Lote: Conjunto de elementos fabricados por um processo num determinado intervalo de tempo. Amostra: Conjunto formado de um ou de vários elementos retirados de um lote, utilizado para extrair informações sobre a população. A quantidade de elementos da amostra é conhecida como Tamanho da Amostra (“n”) Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 10 Estatística Distribuição de Frequência Dados Brutos: Conjunto de números extraídos de uma população (amostra) que ainda não foram numericamente organizados. Exemplo: Notas de um determinado grupo de 20 alunos em uma avaliação. (3, 7, 5, 6, 4, 3, 2, 5, 9, 4, 2, 1, 4, 6, 7, 8, 5, 5, 6, 4, 3, 7, 5, 6, 4, 3, 7, 5, 8, 4, 7, 7, 4, 6, ) Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 11 Estatística Distribuição de Frequência Rol: É o arranjo dos dados numéricos brutos em ordem crescente ou decrescente de grandeza. Exemplo: (1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 9) Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 12 Organizar os dados – ROL Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Distribuição de Frequência Frequência Absoluta (fi): É a ocorrência de algumas variáveis, ou seja, quantas vezes a variável se repete dentro dos dados colhidos. Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 14 Gerar tabela de frequências – xi, fi Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Distribuição de Frequência Frequência Absoluta Relativa (fri): Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 16 Gerar tabela de frequências – fri Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Distribuição de Frequência Frequência Acumulada (Fi): É a soma de uma frequência absoluta considerada com todos os valores da frequências absolutas anteriores. Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 18 Gerar tabela de frequências – Fi Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Distribuição de Frequência Frequência Acumulada Relativa (Fri): É o quociente entre cada frequência acumulada e o total de dados da analise. Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 20 Gerar tabela de frequências – Fri Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Distribuição de Frequência Frequência Absoluta Relativa Percentual (fri%): É o produto da frequência absoluta relativa por 100. Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 22 Gerar tabela de frequências – fri% Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Distribuição de Frequência Frequência Acumulada Relativa Percentual (Fri%): É o produto da frequência acumulada relativa por 100. Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 24 Gerar tabela de frequências – Fri% Exercício Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa>, Estatística Análise Simples Dados emFreq Freq Freq Freq. Freq. Freq. Acumulada Acumulada Acumulada Absoluta análiseAbsolutaRelativa : Relativa Percentual Percentual Total Somatória de dados = último Fri Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 26 100% dos dados = último Fri% Estatística Regras para Número de Classes Analise por Classes: Divide-se os dados em classes. Número de Classes (K): A escolha do número de classes, é um julgamento pessoal. Há várias regras que determinam esse número, embora o número de dados disponível sirva de orientação. A regra que adotaremos para nós será a Regra de Sturges. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 27 Estatística Regra de Sturges: n 3–5 K 3 Onde : 6 – 11 4 K é o número de classes; 12 – 22 5 n é o número total dados 23 – 46 6 Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 47 – 90 7 91 – 181 8 182 – 362 9 28 Estatística Intervalo de Classes Encontrando o Intervalo de Classe: Para determinar o intervalo de classe, utilizamos a amplitude da amostra, isto é, o maior valor coletado menos o menor valor e divide pelo número de classes. Maior valor 9 Menor valor 1 Amplitude 8 6 Nº de classes 6 1,33... Intervalo de classes 20 18 2 Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 29 Estatística Intervalo de Classes Montando a tabela: Utilizando o intervalo de classes Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 30 Estatística Análise por Classes Ordem das classes Conjunto de cada classes Freq. Acumulada Freq. Visualização Freq. Freq. Freq. Freq. Relativa Absoluta da Normal Relativa Acumulada relativa Acumulada Percentual Percentual Relativa Total de dados Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 31 Estatística Intervalo de Classes Notações utilizadas: A B Inclui A mas não inclui B A B Não inclui A mas inclui B A B Inclui A e B Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 32 Gerar tabela de frequências com Intervalo de Classes Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Gráficos Gráfico: Exemplo: Linha Gráfico Gráfico Histográma de dePizza Coluna Radar Gráfico 6 3,5 3,5 Categoria 1 6 6 Vendas 5 53 3 4 2,5 2,5 4 4 2 2 2 3 3 1,5 Categoria 4 Categoria 2 1,5 0 2 21 1 1 0,5 0,5 1 0 0 0 0 Categoria Categoria 1 Categoria Categoria Categoria Categoria 21 2,4 Categoria 3,322 Categoria 3,3 2 3 1 2,4 Categoria 33Categoria 44 Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 34 Série 1 Série 2 Série 11 Série Série 1º Tri1 Série 3 Série 2 Série 2 Série 2º Tri2 Série 4 Série 33 Série Série 3º Tri3 Série 5 4º Tri6 Série Gerar Gráfico de Pareto dos dados de fi Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Medidas de Tendência Central Medidas de Tendência Central: Determina valores em torno dos quais tende a se concentrar a maior quantidade de dados do fenômeno em estudo. Temos: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 36 Estatística Medidas de Tendência Central Média Aritmética: É representada pelo símbolo , é o quociente da divisão da soma dos valores da variável pelo número deles. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 37 Estatística Medidas de Tendência Central Mediana: Representada pelo símbolo “ ” ou “Md”, é o valor situado de tal forma que separe o conjunto em dois subconjuntos de mesmo número de elementos. Exemplo: 34 Dados (1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 9) 33 Dados (1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 9) Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 38 Estatística Medidas de Tendência Central Moda (M): É o valor que ocorre com maior frequência em uma série de valores. Exemplo: 34 Dados (1, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 9) Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 39 Calcular as Medidas de Tendência Central Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Medidas de Dispersão ou de Variabilidade Amplitude Total: É a diferença entre o maior e o menor valor observado. Exemplo: Dos Intervalos de Classes Dos dados coletados Maior valor 9 Menor valor 1 9 1 Amplitude 8 8 Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 41 Estatística Medidas de Dispersão ou de Variabilidade Variância: População Baseia-se nos desvios em torno da média aritmética. Representamos por Amostral Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 42 Estatística Medidas de Dispersão ou de Variabilidade Desvio Padrão: O desvio padrão se define como sendo a raiz quadrada da variância, representada por “S” Exemplo: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 43 Calcular as Medidas de Dispersão Exercício <Nome do elaborador – dd, mm, aaaa>, Estatística Posição Relativa da Média, Mediana e Moda na Curva Normal Curva Normal: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, Gráfico em forma de boca de sino que representa a dispersão dos dados em relação a média. 45 Estatística Posição Relativa da Média, Mediana e Moda, na Curva Normal Quando aumentamos o número de observações, ao mesmo tempo em que reduzimos a amplitude das classes, mais visível é a curva normal Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 46 Estatística Posição Relativa da Média, Mediana e Moda Observação: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 47 Estatística Posição Relativa da Média, Mediana e Moda Observação: Curva Assimétrica Negativa Curva Assimétrica Positiva Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 48 Estatística Posição Relativa da Média, Mediana e Moda Observação: Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 49 Estatística Posição Relativa da Média, Mediana e Moda Observação: Se somente causas comuns de variação estão presentes, o produto do processo segue uma distribuição estável ao longo do tempo, sendo portanto previsível. Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 50 Estatística Posição Relativa da Média, Mediana e Moda Observação: Se causas especiais de variações estão presentes, o produto do processo não segue uma distribuição estável, ao longo do tempo, não sendo previsível Adilson Cunha Rusteiko <Nome do elaborador – dd, mm, aaaa, 51