1 2 Moda Sumário (4ª aula), pp. 24 - 30 • Se a variável não for cardinal, não se pode calcular a 1. Conceitos básicos de estatística descritiva 1.4 Medidas de tendência central 1.4.6 Moda 1.5 Medidas de dispersão 1.5.1 Amplitude 1.5.2 Variância (desvio quadrático médio) 1.5.3 Desvio Padrão 1.5.4 Variância e desvio padrão amostrais 1.5.5 Variância e desvio padrão ponderados e com dados agrupados • Média • Mediana • Como se caracteriza os portugueses quanto a • “Barbeado”, “bigode”, “pêra”, “barba”? • Somos barbeados 3 4 Moda Moda • Barbeado é o mais frequente na população • A moda também pode ser utilizado com dados cardinais e ordinais • A moda é a classe mais frequente e pode ser utilizada com dados categóricos • Para haver classe modal temos que agrupar os indivíduos em classes • Exemplo: Em Portugal, os carros são • Fica a nota que na disciplina de Estatística aplicarão o conceito de moda a “funções distribuição”. ü 19,5% cinzentos, 13,4% brancos, ü 17,4% Vermelhos, 32,5% pretos, ü 7,5% prateados, 9,7% de outra cor. Qual é a classe modal (a moda)? 5 Medidas de dispersão • As medidas de tendência central condensam a população no “indivíduo típico”, no “indivíduo mais representativo”, no “indivíduo comum”. 6 Medidas de dispersão • Por exemplo, • Supondo que a mediana do rendimento disponível per capita em Portugal é de 3500 €/ano • Mas também interessa saber se há heterogeneidade na população • Haverá muitos pobres (abaixo de 2100 €/ano)? • Se há muitos indivíduos diferentes do típico • (o rendimento é uma aproximação da riqueza) • Haverá que muitos ricos (acima de 7000 €/ano)? 1 7 Medidas de dispersão 8 Amplitude • A tabela de frequências relativas contém • A amplitude é a diferença máxima entre dois informação sobre a dispersão /heterogeneidade indivíduos • Mas queremos • Ordenados os indivíduos • Uma medida de dispersão que condensa num número a heterogeneidade da população • É a diferença entre o “maior” e o “menor” A = x ( n ) − x (1) 9 Amplitude 10 Propriedades da Amplitude • Não é uma boa medida da variabilidade a ⋅ x( n ) − a ⋅ x(1) , a ≥ 0 A (a ⋅ x ) = = a ⋅ x(1) − a ⋅ x( n ) , a < 0 • Muito sensível a valores extremos Populações muito diferentes podem ter a mesma amplitude = a ⋅ ( x( n ) − x(1) ) = a ⋅ A( x ) • A amplitude amostral tem tendência a crescer com o tamanho da amostra 11 Propriedades da Amplitude A(a + x) = (a + x( n) ) − (a + x(1) ) 12 Variância – Desvio quadrático médio σ2 = ( x1 − µ )2 + ( x2 − µ )2 + ... + ( xn − µ )2 N N = (a − a) + ( x(n ) − x(1) ) = A( x ) = ∑ (x − µ ) 2 i i =1 N 2 13 Variância – Desvio quadrático médio 14 Desvio médio? médio? • Na física, esta medida traduz a dificuldade de um corpo rodar Porque não usar o desvio médio? ( x1 − µ ) + ( x2 − µ ) + ... + ( xn − µ ) = • Quanto maior for, maior será a energia necessária para que ele rode à velocidade de uma volta por segundo N N = • Se a patinadora fechar os braços roda mais depressa porque o seu “desvio quadrático médio” diminui. N ∑x ∑ µ i i =1 N − i =1 N = x−µ =0 15 Variância – Desvio quadrático médio Variância – Desvio quadrático médio Multiplicando por k, a variância vem multiplicada por k2 • A variância de uma população com todos os indivíduos idênticos é zero. σ2= (a − µ )2 + (a − µ )2 + ... + (a − µ )2 N N σ 2 (a ⋅ x ) = N µ =∑a/ N = a i =1 σ2= 16 (a − a ) 2 N 2 i =1 N = a 2 ⋅ ∑ (x − µ ) 2 i =1 N 2 17 Variância – Desvio quadrático médio • As unidades da variância são ao quadrado n = σ 2 ( x) n 2 2 ∑ ((a + x) − (a + µ) ) ∑ ( x − µ ) i=1 n 18 Variância – Desvio padrão • Somando k, a variância vem igual σ 2 (a + x ) = = = a 2 ⋅ σ 2 ( x) + (a − a ) + ... + (a − a) =0 N 2 ∑ (a ⋅ x − a ⋅ µ ) = i=1 n = • Por exemplo, a variância da população quanto à altura é em “metros ao quadrado” • Qual o significado de “unidades ao quadrado”? • Podemos traduzir a variância em “unidades” 3 19 Variância – Desvio padrão Variância – Desvio padrão • O desvio padrão é a raiz quadrada do desvio quadrático médio N ∑ (x σ = σ2 = 20 i =1 • Como interpretamos o desvio padrão? • Sendo que a altura média é 1,75 m e o desvio padrão é 0,15 m, o que isto quer dizer? − µ) 2 i Sem mais informação, é como se metade da população tivesse 1,60 m e a outra metade 1,90 m. N 21 Variância – Desvio padrão µ* = 22 Como obtenho a variância com uma amostra? amostra? ( µ − σ ) + ( µ + σ ) + ... (µ + µ) + (σ − σ ) + ... = =µ N N • A melhor forma é calcular o desvio quadrático médio mas dividindo por (n-1) n ( µ −σ − µ ) 2 + ( µ + σ − µ ) 2 + ... σ * = σ *2 = = N = S = 2 σ + σ + ... = σ2 =σ n 2 2 (xi − x ) (x1 − x )2 + (x2 − x )2 + ...+ (xn − x )2 ∑ i =1 n −1 = n −1 • Resultado de eu não conhecer a média da população e precisar de utilizar a média amostral. 23 Como obtenho a variância com uma amostra? amostra? • Obtenho o desvio padrão pela raiz quadrada 24 E com dados agrupados agrupados? ? • Considero na mesma o ponto médio de cada grupo S = 2 n S= S = 2 ∑ (x i =1 i − x )2 n −1 2 2 2 n w1 ( x1 − x ) + ... + wn (x n − x ) w 2 = ∑ n i ( xi − x ) w1 + ...+ wn i =1 ∑ w j =1 j n [ = ∑ fi ⋅ (xi − x ) i =1 2 ] n • A média amostral é a ponderada: x = ∑ ( fi ⋅ xi ) i =1 • Assumo que n ≈ n –1 4