NOÇÕES DE ESTATÍSTICA ESTATÍSTICA • Conjunto de técnicas e métodos de pesquisa que, entre outros tópicos, envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento e análise das informações. • Por meio das análises feitas a partir de dados organizados podemos, em muitos casos, fazer previsões, determinar tendências, auxiliar na tomada de decisões e, portanto, elaborar um planejamento com mais precisão. Definições básicas • Universo estatístico – Conjunto formado por todos os elementos que passam a oferecer dados relativos ao assunto em questão. Ex: As pessoas numa pesquisa eleitoral para presidente da república, os alunos da turma num levantamento sobre as médias em matemática, etc. • Elemento estatístico – cada elemento do grupo a ser estudado. Ex: Cada pessoa consultada na pesquisa eleitoral. • Característica qualitativa: raça, área de estudos, meio de transporte, etc. • Característica quantitativa: altura, peso, preço de produtos, etc. AMOSTRA • Amostra – Subconjunto do universo estudado. • Amplitude de uma amostra (A) – Diferença entre o maior e o menor extremo de uma classe. Ex: As alturas de 6 jogadores de futsal são 1,75m, 1,68m, 1,82m, 1,70m 1,62m e 1,80m. amplitude da amostra A = 1,82 – 1,62 = 0,20 Variável estatística • Variável estatística é uma característica quantitativa, que pode ser discreta - número de sócios de um clube - ou contínua – altura dos alunos de uma determinada turma. Frequências de classe D30ISCIPLINA: MATEMÁTICA – TURMA 3º ANO ENS. MÉDIO N 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 º 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 n 5 4 6 8 3 5 7 6 8 4 6 9 7 5 7 5 6 8 7 9 4 6 6 8 7 O 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 T A Classe(Xi) Frequência absoluta (Fi) Freq. absoluta acumulada (Fia) Frequência relativa (Fr(%)) Freq. Relativa acumulada Fra(%) X1 = 30 F1 = 1 1 1/25 = 4% 4% X2 = 40 F2 = 3 4 3/25 = 12% 16% X3 = 50 F3 = 4 8 4/25 = 16% 32% X4 = 60 F4 = 6 14 6/25 = 24% 56% X5 = 70 F5 = 5 19 5/25 = 20% 76% X6 = 80 F6 = 4 23 4/25 = 16% 92% X7 = 90 F7 = 2 25 2/25 = 8% 100% Definições • Xi – Unidade estatística de uma classe. • Fi – Frequência absoluta do valor Xi é o número de vezes que a variável estatística assume o valor Xi. Ex.: a frequência absoluta da nota 50 é 4. • Fia – Frequência absoluta acumulada é a adição a cada frequência absoluta dos valores das frequências anteriores. • Fr – Frequência relativa é o quociente entre a frequência absoluta (Fi) e o número de elementos N da amostra, ou seja: Fra – Frequência relativa acumulada. Frequência Absoluta Frequência relativa Distribuição de frequências com dados agrupados • Um radar, instalado num trecho de uma rodovia, registrou as velocidades de 50 veículos em km/h. Qtos por cento dos veículos foram multados se o limite era 100 km/h. 62 123 95 123 81 123 60 72 86 108 109 84 121 60 128 77 91 51 100 63 104 107 63 117 116 69 116 82 95 72 94 84 123 52 90 100 79 101 98 110 79 92 73 83 74 125 56 86 98 76 Classe Vel.(km/h) Fi Fia Fr(%) Fra(%) 1 [50, 60[ 3 3 6 6 2 [60, 70[ 6 9 12 18 3 [70, 80[ 8 17 16 34 4 [80, 90[ 7 24 14 48 5 [90, 100[ 8 32 16 64 6 [100, 110[ 7 39 14 78 7 [110, 120[ 4 43 8 86 8 [120, 130[ 7 50 14 100 Histograma – conjunto de colunas retangulares MEDIDAS DE TENDÊNCIA CENTRAL • MEDIDAS DE CENTRALIZAÇÃO 1) MÉDIA ARITMÉTICA 2) MÉDIA PONDERADA 3) MEDIANA 4) MODA Média aritmética • No ano 2000, o número de nascimentos, por mês, em uma maternidade foi: Mês Jan Fev Mar ab Mai Jun Jul Ag Set Out Nov dez Nas 38 25 42 30 29 47 18 36 38 43 49 37 • a) calcule a média mensal de nascimentos • b) em que meses o número de nascimentos foi acima da média? Resolução • A) 38 25 42 30 29 47 18 36 38 43 49 37 Ma 36 12 • B) jan., mar., jun., set.,out., nov., dez Média aritmética ponderada • A tabela a seguir mostra a distribuição dos salários de uma empresa. Qual a média salarial dessa empresa? Salário (em reais) Número de funcionários 600,00 12 900,00 7 1200,00 5 1800,00 6 4500,00 8 Total 38 Resolução X 600 ,00.12 900 ,00.7 1200 ,00.5 1800 ,00.6 4500 ,00.8 12 7 5 6 8 X 7200 ,00 6300 ,00 6000 ,00 10800 ,00 36000 ,00 38 X 1744,73 • Ou seja R$ 1.744,73 MEDIANA • As nove classes de 3º ano do ensino médio de uma escola têm, respectivamente: 37, 28, 40, 41, 45, 37, 37, 41 e 44 alunos. • Colocando esses dados em ordem crescente • 28, 37, 37, 37 40, 41, 41, 44, 45 MEDIANA • Mediana - valor que ocupa a posição central de um conjunto de valores, colocados em ordem crescente ou decrescente de grandeza. Ou seja, a mediana é 40, no exemplo anterior. Moda • Feita uma pesquisa para saber o número de irmãos que cada um dos 30 alunos de uma classe possui, obteve-se o seguinte quadro: • 0, 2, 3, 2, 1, 2, 2, 1, 1, 2, 1, 2, 0, 1, 2, 0, 2, 2, 3, 4, 2, 2, 3, 1, 3, 2, 5, 2, 4, 4. • Fazendo a contagem obtemos a tabela Número de irmãos Frequência absoluta 0 3 1 6 2 13 3 4 4 3 5 1 VEJA O EXEMPLO • O quadro de frequências, a seguir, refere-se às idades dos jogadores de basquete de um clube. Idade Nº de jogadores Xi Fi 13 6 14 12 15 15 20 24 23 9 Moda • Moda de um conjunto de valores é o valor que aparece um maior número de vezes, ou seja, é o valor de maior frequência absoluta. Ou seja, a moda no exemplo anterior é 20. • Determine a média das idades, a moda e a mediana dos dados neste caso. • Resolução da questão: • Média: 13.6 14.12 15.15 20.24 23.9 M • Moda: 20 6 12 15 24 9 17,54 • Mediana: vamos calcular inicialmente o número de dados 6+12+15+24+9 = 66. • Temos portanto um número par de dados. • Vamos, então, determinar as ordens dos dois termos centrais: • 1º, 2º … 33º, 34º, …, 65º, 66º • 33º = 15 e 34º = 20 logo a mediana será 17,5 MEDIDAS DE DISPERÇÃO • Para caracterizar um conjunto de dados, em estatística, nem sempre são suficientes a média, a moda e a mediana. Em alguns casos, temos que recorrer a outros parâmetros, que são chamados de medidas de disperção. MEDIDAS DE DISPERÇÃO • Sejam X 1 , X 2 , X 3 , ...,X n X 1 X 2 ... X n X n DEFINIÇÕES • DESVIO RELATIVO Dr X i X • DESVIO ABSOLUTO Da X i X • DESVIO MÉDIO ABSOLUTO n Dma X i 1 i n n X ou Dma F .X i 1 i X i n F i 1 i VARIÂNCIA E DESVIO PADRÃO • Variância X n Va i 1 i X n F .X n 2 ou Va i 1 i Va X n F i 1 • Desvio padrão i i 2 Veja a tabela dos jogadores de basquete Idade Nº de jogadores Xi Fi 13 6 14 12 15 15 20 24 23 9 Veja a tabela dos jogadores de basquete • Média X • • • • • • 13.6 14.12 15.15 20.24 23.9 17,54 6 12 15 24 9 Desvio relativo 13 - 17,54 = - 4,54 14 - 17,54 = - 3,54 15 - 17,54 = - 2,54 20 - 17,54 = 2,46 23 - 17,54 = 5,46 Dr X i X • • • • • • Desvio absoluto 4,54 3,54 2,54 2,46 5,46 Da X i X Desvio médio absoluto • Fórmula 5 Dma F .X i 1 i 5 i Fi X F1 X 1 X F2 X 2 X ... F5 X 5 X F1 F2 ... F5 i 1 • Cálculo: Dma 6.4,54 12.3,54 15.2,54 24.2,46 9.5,46 3,2727 ... 6 12 15 24 9 Variância • Fórmula 5 Va Fi . X i X i 1 5 F i 1 2 F1 ( X 1 X ) 2 F2 ( X 2 X ) 2 ... F5 ( X 5 X ) 2 F1 F2 ... F5 i • Cálculo 6.(4,54) 2 12.(3,54) 2 15.(2,54) 2 24.(2,46) 2 9.(5,46) 2 Va 11,8843... 6 12 15 24 9 Desvio padrão • Fórmula Va • Cálculo Va 11,88 3,44