Estatística Descritiva Introdução • População ou universo estatístico – Conjunto elementar que possui pelo menos uma característica comum sobre os quais e sobre a qual vai incidir a análise estatística • Amostra – Subconjunto da população que vai ser objecto da análise estatística quando é difícil estudar toda a população. • Unidade estatística – Cada elemento da população ou do universo estatístico. Pode ter várias características (peso, idade, p.ex.) que têm uma representação matemática sob a forma de variáveis (contínuas ou descontínuas). • Estatística descritiva – É uma estatística empírica que tem por objecto a classificação dos objectos, a redução dos resultados e a listagem dos mesmos (calcula parâmetros, constata apenas as evidências). • Estatística indutiva – Formula hipóteses, formula leis. Elementos de estatística descritiva Rol de observações de uma determinada população Peso de um conjunto de indivíduos: 65, 71, 69, 72, 73, 47, 52, 60, 53, 69, 71, 72 Elementos de estatística descritiva Tabela de frequências: xi 47 52 53 60 65 69 71 72 73 Total Fi – frequências absolutas fi – frequências relativas N – número de observações Fa – frequência acumulada absoluta fa – frequência acumulada relativa Fi 1 1 1 1 1 2 2 2 1 12 fi 1/12 1/12 1/12 1/12 1/12 1/6 1/6 1/6 1/12 1 Fa 1 2 3 4 5 7 9 11 12 fa 1/12 2/12 3/12 4/12 5/12 7/12 9/12 11/12 12/12 å Fi = N å fi = 1 Fi fi = N Redução dos dados Quando as observações são em número muito grande, agrupam-se os dados em classes. Ex.: 40 observações Devemos criar classes. Quantas classes? 1) 2) 3) 5 < x < 15 x = nº de classes N x = 1 + 3,3 log10N No nosso caso: 2) N = 40 =6,3 3) x = 1 + 3,3 log1040 = 1 + 3,3 1,6 = 6,3 Tabela de frequências xi [..;..[ [..;..[ [..;..[ … Amplitude total Fi … … … … AT = xM - xm Amplitude de cada classe AT ac = = x x M - xm x Representação Histograma e polígono de frequências Freq 20 15 10 5 0 23 24 25 26 27 Idade Representação Gráfico de barras Freq 20 15 10 5 0 23 24 25 26 27 Idade Representação Gráfico sectorial Frequência de idades 23 27 26 24 25 Parâmetros de tendência central x= Média arit. para dados agrupados åx i N x= åF .x i i N Moda – O valor mais frequente. Mediana – O valor central do conjunto de resultados, ou a média dos dois valores centrais. Média geométrica Média hipergeométrica G = n x .x ...xn 1 2 H= N 1 å x i Parâmetros de dispersão di = xi - x Desvio de um valor – Diferença entre esse valor e a média Desvio médio absoluto – Média dos valores absolutos de cada desvio. å x -x i N Variância – Média dos quadrados dos desvios V = 2 = Desvio padrão – Raiz quadrada da variância å x i - x N 2 å xi - x = N 2 Percentis Quartis – 3 valores dividem o número de casos em 4 intervalos iguais. Decis – 9 valores dividem o número de casos em 10 intervalos iguais. Centis – 99 valores dividem o número de casos em 100 intervalos iguais. Exemplo Lista de alturas de uma determinada população: 172 164 155 163 154 172 156 184 185 180 167 180 168 165 176 180 166 169 174 174 176 165 170 172 168 177 179 182 169 171 183 168 174 150 167 192 176 155 179 189 169 173 166 166 167 155 167 178 180 165 178 173 160 156 173 164 174 165 178 160 162 163 180 172 175 163 168 180 162 169 172 164 191 181 181 186 Exemplo Tabela de frequências: xi 150 154 155 156 160 162 163 164 165 166 167 168 169 170 171 172 173 Fi 1 1 3 2 2 2 3 3 4 3 4 4 4 1 1 5 3 xi 174 175 176 177 178 179 180 181 182 183 184 185 186 189 191 192 Fi 4 1 3 1 3 2 6 2 1 1 1 1 1 1 1 1 Exemplo N = å Fi = 76 x= åF x i i = 150 154 155 3 156 2 ... 186 189 191 192 = 171,08 171 N 76 2 å Fi xi - x = = N 150 - 1712 154 -1712 ...192 -1712 76 = 9,07 Exemplo Criação de classes: Número de classes: Amplitude total: AT = 192 – 150 = 42 Amplitude de cada classe: x = 1 + 3,3 log1076 = 7,2 7 AT 42 ac = = =6 x 7 Exemplo Dados agrupados: ci xi Fi [150;156[ 153 5 [156;162[ 159 4 [162;168[ 165 19 [168;174[ 171 18 [174;180[ 177 14 [180;186[ 183 12 [186;192[ 189 4 Exemplo Dados agrupados: x= åF .x i i = 153 5 159 4 165 19 17118 177 14 183 12 189 4 N 76 =171,63 2 å Fi xi - x 5 153 - 171,632 ... 4 189 - 171,632 = = = 9,16 N 76