ESTATÍSTICA DECRITIVA CURSO DE SI FATEC/FUNCESI 2004-1 Questões 1) Como obter dados confiáveis? 2) Como coletá-los? 3) Como tratá-los corretamente? 4) Qual a melhor forma de representação? 5) Qual conclusões eles nos proporcionam? Estatística Descritiva Compreende: 1) Descrição (questionário e relatórios) 2) Tabulação (planilhas e tabelas) 3) Representação em forma visual adequada (Gráficos) 4) Cálculo de medidas de tendência central e variabilidade MEDIDAS DE TENDÊNCIA CENTRAL 1 - MÉDIA ARITMÉTICA SIMPLES Somam-se todos os dados e divide-se o resultado pelo número dos dados. FÓRMULA n x1 x 2 x 3 ... x n x n 40 56 38 38 63 59 52 49 46 x i 1 n 441 9 x 49, 0 9 i MEDIDAS DE TENDÊNCIA CENTRAL 2 - MEDIANA É o resultado que representa o ponto médio de uma série de dados ordenados, isto é, metade estão acima e outra metade abaixo. Procedimento: • Ordena-se o conjunto de dados • Se o conjunto for ímpar = dado do meio (metade abaixo e metade acima) • Se for par = média aritmética dos dados centrais MEDIDAS DE TENDÊNCIA CENTRAL 3 - MODA É o valor que ocorre com maior freqüência Procedimento: Toma-se o conjunto de daos e verificase o que mais se repete. EXERCÍCIOS 1) Calcular a média aritmética, a mediana e a moda das idades,das alturas e dos pesos dos alunos desta turma 2) Qual melhor representa a realidade da turma? Por que? 3) Represente as 3 medidas numa reta ordenada e faça a comparação MEDIDAS DE DISPERSÃO Dispersão = Grau de afastamento de um conjunto de dados de sua média. Representa o grau de homogeneidade ou heterogeneidade do conjunto. 1 - AMPLITUDE Distância entre o dado de maior grandeza e o de menor grandeza. Sensível a valores muito grandes ou muito pequenos. Exercício: Calcular a amplitude entre as idades dos alunos desta sala MEDIDAS DE DISPERSÃO 2 - INTERVALO INTERQUARTIL (IIQ) Distância entre o dado do 3º quartil e do 1º quartil. Exercícios: na folha à parte MEDIDAS DE DISPERSÃO 3 - DESVIO MÉDIO ABSOLUTO Média aritmética dos desvios absolutos entre todos os dados observados e a média aritmética desses dados. Exercícios: na folha à parte MEDIDAS DE DISPERSÃO 4 – DESVIO MÉDIO ABSOLUTO Dá a distância média de cada dado em relação à média da amostra. Fórmula: D.M.A x1 x x 2 x x 3 x ... x n x n MEDIDAS DE DISPERSÃO 5 – VARIÂNCIA É mais conveniente que o D.M.A. É a soma dos quadrados dos desvios de cada dados em relação à média, dividido por n. Fórmula: n ( x1 x) ( x2 x) ( x3 x) ... ( xn x) n 2 2 2 2 2 2 ( x x ) i 1 n MEDIDAS DE DISPERSÃO 6 - DESVIO PADRÃO n ( x1 x) 2 ( x2 x) 2 ( x3 x) 2 ... ( xn x) 2 n 2 ( x x ) i 1 n MEDIDAS DE DISPERSÃO VARIÂNCIA E DESVIO PADRÃO AMOSTRAL 2 2 2 2 n ( x x ) ( x x ) ( x x ) ... ( x x ) ( xi x ) 2 1 2 3 n s n1 i 1 n 1 ( x1 x ) 2 ( x 2 x ) 2 ( x 3 x ) 2 ... ( x n x ) 2 s n1 ( xi x ) n1 i 1 n MEDIDAS DE DISPERSÃO 7 – COEFICIENTE DE VARIAÇÃO Fórmula: desvio padrão Coefic . var iação média x REPRESENTAÇÃO DE DADOS 8 – TABELAS E QUADROS É a forma mais comum de apresentação de relatórios técnicos. Segue normas metodológicas rígidas (Norma ABNT). Em monografias, por exemplo, os dados devem ficar em anexo e deve-se transcrever para o corpo do texto apenas as tabelas e quadros, fazendo –se referência à fonte e ao anexo para checagem do leitor. REPRESENTAÇÃO DE DADOS 9 – GRÁFICOS O gráfico é um método de representação dos dados que permite uma melhor comunicação com o leitor. Traduz a intenção do relator em realçar ou esconder determinado dado. A escolha da escala, da cor, da textura traduzem esta intenção. É uma forma elegante de representação e tecnicamente muito bem aceita. REPRESENTAÇÃO DE DADOS 10 - PRINCIPAIS TIPOS DE GRÁFICOS: • Gráficos de barras • Gráficos de setores (pizza) • Gráficos de pontos • Gráficos de dispersão • Gráficos de linha • Pictogramas • Histogramas diagramas de freqüência DADOS AGRUPADOS 11- Histogramas Os gráficos, às vezes, não ficam bem quando tenho uma relação longa de dados. Para melhor visualização e precisão nas estatísticas, precisamos agrupá-los convenientemente. Existem softwares que fazem isso para nós: SAS, SPSS, Minitab. PROCESSO DE AGRUPAMENTO 1) Decidir o número de classes de sua tabela (sugerido: entre 5 e 20 classes) 2) Determinar a amplitude de classe, divide-se a amplitude pelo numero de classes (arredonde para mais 3) Escolher como limite inferior da primeira classe o menor valor observado ou ligeiramente inferior EXERCÍCIO 1: Fazer isso para os dados de idade de sua turma. PROCESSO DE AGRUPAMENTO 4) Some a amplitude da classe ao menor valor e obtenha a segunda classe e assim sucessivamente até completar o número de classes escolhidas. 5) Faça uma coluna com esses limites de classe 6) Conte os elementos agrupando-os em cada intervalo de classe (use traços) 7- Represente estas contagens num gráfico. EXERCÍCIO 2: Fazer os passos de 4 a 7 para os dados anteriores. EXERCÍCIO 3: Repetir os passos de 1 a 7 para peso e altura. ESTATÍSTICAS DE DADOS AGRUPADOS 12- Média aritmética ponderada n f1 x1 f 2 x2 f 3 x3 ... f n xn x n fx i i i 1 n n f1 f 2 f 3 ... f n ESTATÍSTICAS DE DADOS AGRUPADOS 13- Mediana ( N / 2 n L )w Mediana x L Onde: nm xL= limite inferior da classe da mediana N = Total de elementos da amostra nL = Número de elementos da classe abaixo da mediana nm= número de elementos da classe mediana w = amplitude da classe da mediana ESTATÍSTICAS DE DADOS AGRUPADOS PERCENTIL (0,01* kN n L ) w Pk x L nm Pk = Percentil k (1 k 100) xL= limite inferior da classe do percentil N = Total de elementos da amostra nL = Número de elementos da classe abaixo do percentil nm= número de elementos da classe percentil w = amplitude da classe do percentil ESTATÍSTICAS DE DADOS AGRUPADOS 14 - Moda É o ponto médio do intervalo de classe com maior freqüência. Pode ser mais de uma como nos dados desagrupados ESTATÍSTICAS DE DADOS AGRUPADOS 15 - Variância f1 ( xi x) f1 xi f1 xi Var( x) i 1 i 1 i 1 n n n m m 2 2 m 2 ESTATÍSTICAS DE DADOS AGRUPADOS 16 - Desvio Padrão (raiz quadrada da variância) f1 ( xi x) f1 xi f1 xi D.Padrão( x) i 1 i 1 i 1 n n n m m 2 2 m 2 ESTATÍSTICAS DE DADOS AGRUPADOS 17 – Variância e Desvio Padrão Amostral n s 2 (x i 1 i n 1 n s x) (x i 1 i 2 x) n 1 2 n n 1 n n 1 ESTATÍSTICAS DE DADOS AGRUPADOS 18 – Polígono de Freqüência É um gráfico de linha que liga os pontos médios das classes no histograma. 17 – Ogiva É um gráfico feito com as freqüências acumuladas. Representa os valores abaixo do limite superior da classe.