1 2 Extracção aleatória Sumário (3ª aula) 1. Conceitos básicos de estatística descritiva • É escolher o indivíduo sem olhar às suas características 1.3. Noção de extracção aleatória e de probabilidade • Exemplo do Totoloto 1.4 Medidas de tendência central 1.4.1 Média aritmética simples 1.4.2 Média aritmética ponderada 1.4.3 Média aritmética calculada com dados agrupados em classes 1.4.4 Média geométrica simples 1.4.5 Mediana • Cada bola é escolhida sem olhar o número • Se se tirasse uma bola e se tornasse a colocar • Se se repetisse a extracção 10 milhões de vezes • Qual a frequência relativa do nº 1? 3 Probabilidade 4 Probabilidade • Se atirarmos muitas vezes uma moeda ao ar, sairá cara em 50% das vezes. • A priori, a frequência seria de 1/49 • Probabilidade de ocorrência: é a frequência que se observaria do “indivíduo” se se repetisse a extracção aleatória com reposição um número muito grande de vezes. • Numa moeda que se atire ao ar, a probabilidade de sair cara é 50%. 5 6 Probabilidade Probabilidade • Retirando, sem ver, uma carta do baralho de 40 cartas, qual a probabilidade de sair um ás? • Coloquei numa saca 15% de bolas pretas, 50% de brancas e 35% de bolas azuis. • E de sair uma figura? • Qual a probabilidade de sair uma azul? • E de sair um trunfo? • Qual a probabilidade de sair uma branca? 1 7 Probabilidade 8 Condensar a informação num número • Aprenderão em estatística problemas compostos z • Sair cara 3 vezes seguidas? • Fazer 21 com duas cartas? z • Tendo 18, a banca rebentar? • Furar dois pneu numa viagem de 1000 km? Tenho uma amostra com várias medidas e quero condensar a informação z Mostrei como condensar a informação numa tabela de frequências relativas E se pretender apenas um número? z No furacão, medi o vento em 100 locais e saiu a noticia de que “a velocidade do vento é de 200km/h”? 9 Média aritmética simples Média aritmética simples • Serão os Alemães maiores que os portugueses? • 10 • Medi a altura de 1753 Alemães e 247 Portugueses • Será Lisboa mais quente que o Porto? Podemos calcular o “alemão médio” e compara com “o português médio” • Podemos comparar as “temperaturas médias” de • Medi em 5 zonas das cidades a temperatura durante um ano, hora a hora (5x365x24 medidas) Lisboa e do Porto • Numas medidas são maiores e noutras menores 11 Propriedades da média aritmética simples Média aritmética simples Somam-se o valor medido da variável estatística em todos os indivíduos e divide-se pelo número de indivíduos: n x + x + ... + xn = x= 1 2 n 12 ∑x i =1 n i a) Se todos os indivíduos forem idênticos (uma constante) a média é igual a essa constante: n __ a= ∑a i =1 n = a + a + ... + a n ⋅ a = =a n n 2 13 14 Propriedades da média aritmética simples Propriedades da média aritmética simples b) Multiplicando uma constante a por todos os valores x, a média naritmética vem multiplicada por a: c) Somando uma constante a a todos os valores x, a média aritmética vem somada por a: _____ a⋅x = ∑a⋅x i i =1 n n a ⋅ x1 + a ⋅ x2 + ... + a ⋅ xn = n ________ a+x = n = a ⋅ ∑ xi i =1 n ∑ (a + x ) i i =1 n = a + x1 + a + x2 + ... + a + xn n n ___ = = a⋅ x na + ∑ xi i =1 n ___ =a+ x 15 16 Média aritmética ponderada Média aritmética ponderada •A média é calculada com uma amostra • Sendo que 8 milhões dos portugueses vivem em cidades e 2 milhões no campo • Cada pessoa da “cidade” representa 80 mil pessoas • Cada pessoa da “aldeia” representa 20 mil pessoas (83x80+3x20)/(10 000x100) (0,83x0,80+0,03x0,20) = 0,664+0,06 = 0,67 •Alguns indivíduos são mais representativos Perguntei a pessoas se têm ligação aos esgotos 83 / 100 pessoas que vivem numa cidade têm 3/ 100 pessoas que vivem numa aldeia rural Qual será a percentagem de ligação em Portugal? Serão 86/200 = 43%? • 67% das pessoas tem ligação aos esgotos 17 Média aritmética ponderada 18 Média aritmética ponderada • Sendo que cada individuo tem wi como importância n w x + w2 x2 + ... + wn xn w = ∑ n i xi = ∑ ( f i ⋅ xi ) x= 1 1 w1 + w2 + ... + wn i =1 ∑ w j i =1 i= j n • fi é a ponderação relativa do individuo i Quais as propriedades da média aritmética ponderada? São idênticas às da média aritmética simples Um exercício para fazer em casa 3 19 20 Média aritmética calculada com dados agrupados em classes Média geométrica simples Tenho dados agrupados numa tabela de frequências Em vez de somar, podemos multiplicar Alturas [100;125] ]125;150] ]150;175] ]175;200] Fequência 0,00% 5,45% 69,34% 25,21% Tem interesse com taxas Meio 112,5 137,5 162,5 187,5 xG = (x1 ⋅ x2 ⋅ x3 ... xn )n = n 1 h = 112,5 ⋅ 0,00% + 137,5 ⋅ 5,45% + 162,5 ⋅ 69,34% + 187,5 ⋅ 25,21% = 167,44 cm n ∏x i i =1 21 22 Média geométrica simples Média geométrica simples Sendo que xi é uma taxa de crescimento, a sua média geométrica será: Sendo que xt é pequeno, então Ln(1 + xt ) ≈ xt ________ 1 1 + x = ((1 + x1 ) × ... × (1 + xn ) )n = n ________ 1 1 + x = ((1 + x1 ) × ... × (1 + xn ) )n ________ 1 Ln 1 + x = (Ln(1 + x1 ) + ... + Ln(1 + xn ) ) n n ∏ (1 + x ) i i =1 n = n ∑ Ln(1 + x ) ∑ x i i =1 n ≈ i =1 i n 23 Média geométrica simples - Exemplo Mês TAXA Infl 1+tx 24 Média geométrica simples - Exemplo 1995 3,3% 103,3% 1996 2,2% 102,2% 1997 2,6% 102,6% 1998 2,2% 102,2% 1999 2,7% 102,7% 2000 4,2% 104,2% 2001 3,5% 103,5% 2002 3,2% 103,2% 2003 2,7% 102,7% 2004 2,5% 102,5% Mês TAXA Infl 1+tx 2,910% 2,908% 1974 20,4% 120,4% 1975 18,3% 118,3% 1976 27,1% 127,1% 1977 22,7% 122,7% 1978 23,6% 123,6% 1979 16,6% 116,6% 1980 20,0% 120,0% 2002 22,7% 122,7% 2003 25,1% 125,1% 2004 29,3% 129,3% 22,580% 22,524% 4 25 Resumindo quanto à média z z z 26 E as variáveis ordinais? A média agrega as diversas medidas num “individuo médio”. “O português médio tem 43,2 anos, 1,65 m de altura, 4,6 anos de escolaridade” z Apenas pode ser calculada com variáveis cardinais z z Será que posso condensar uma variável ordinal num número? A média não serve porque não é igual a distancia entre as classes. Será que a média de dois “maus” e um “muito bom” é “suficiente”? 27 Devemos utilizar a MEDIANA z A mediana é o valor/classe que divide a amostra a meio z Pelo menos 50% das observações são iguais ou piores que a mediana Classe Frequência F. Cumulante Número par de elementos z Pelo menos 50% das observações são piores ou iguais a “Suficiente” z Menos de 50% das observações são piores ou iguais a “Mau” Numa amostra de 10 indivíduos, os pesos são 67,4; 63,2; 71,1; 69,5; 65,4; 73,9; 72,7; 74,3; 65,9; 68,6 z Muito Mau Mau Muito Bom Suficiente Bom 7,32% 21,97% 8,12% 37,71% 24,88% 7,32% 29,29% 100,00% 67,00% 91,88% z 28 Primeiro, ordenamos as observações 63,2; 65,4; 65,9; 67,4; 68,6; 69,5; 71,1; 72,7; 73,9; 74,3 • A mediana é um valor entre 68,6 e 69,5: (68,6 + 69,5)/2 = 69,05 kg 29 Propriedades da mediana 30 Propriedades da mediana Med (a ⋅ x) = Med (a + x) = n ímpar (a ⋅ x)( n +1) / 2 = a ⋅ x( n +1) / 2 , = (a ⋅ x)( n / 2) + (a ⋅ x)( n / 2 +1) = x( n / 2 ) + x( n / 2 +1) = a , n par 2 2 = a ⋅ Med ( x) n ímpar (a + x)( n +1) / 2 = a + x( n +1) / 2 , = (a + x)( n / 2 ) + (a + x)( n / 2 +1) = x( n / 2 ) + x( n / 2 +1) =a+ , n par 2 2 = a + Med ( x ) 5