ESTATÍSTICA Estatística é a parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. A estatística compreende três ramos: - Estatística descritiva - Teoria da probabilidade - Inferência (ou amostragem) A estatística descritiva compreende a organização, o resumo e, em geral, a simplificação de informações que podem ser muito complexas. Portanto, a coleta, a organização e a descrição dos dados estão a cargo de estatística descritiva. Exemplos: 01. Taxa de desemprego 02. Custo de vida 03. Índice pluviométrico 04. As medias dos estudantes A teoria da probabilidade é útil para analisar situações que envolvem o acoso. Como por exemplo: Jogos de dados e cartas,ou lançamento de uma moeda. A inferência (ou amostragem) diz respeito a análise e interpretação de dados amostrais. A amostragem é um exemplo vivo do adágio, não é preciso comer um bolo inteiro para saber se o bolo é gostoso, A ideia básica da amostragem é efetuar determinada mensuração sobre uma parcela pequena, mas típica, de determinada população e utilizar essa informação para fazer inferência sobre a população toda. Exemplos: 01. Mergulhar a ponta do pé na água para avaliar a temperatura da piscina, 02. Folhear um livro. A palavra estatística numa conceituação genérica pode ser considerada como a ciência que se preocupa com a coleta, organização, descrição, análise e interpretação de dados experimentais. O objetivo de reunir dados é o de fornecer informações sobre as características de grupos de pessoas ou coisas. As informações têm por objetivo conhecer o problema e, desta forma, servir de base para a escolha dos procedimentos mais adequados para resolvê-lo. Quando um cardiologista, por exemplo, solicita do seu paciente informações referentes ao seu histórico familiar sobre doenças cardiovasculares, DCV, está levantando um dado que já mostrou, a partir de dados referentes a outros pacientes, apresentar uma possível relação com o seu prognóstico cardiológico. Essa e outras informações, como tipo de alimentação irão auxiliar a compor um quadro dos fatores que podem contribuir para melhorar ou prejudicar a saúde do paciente. Essas informações são de natureza estatística, aplicadas, neste caso, à medicina. Evidentemente, trata-se de fornecer a informação da forma mais legível e completa possível. Desta forma, são utilizados rotinas e meios que permitam um bom entendimento das informações, organizando os dados. A organização de vários grupos de dados dá origem aos bancos de dados. Definem-se como primeiro(porém não mais importante) objetivo da estatística tornar a informação clara e precisa ao receptor, valendo-se do ferramental disponível. Atualmente, os recursos automáticos e gráficos da computação são ferramentas indispensáveis para o tratamento da informação e, por extensão, para a estatística. Nem sempre a estatística é bem vista. Essa má fama deve-se ao fato de ser, muitas vezes, mal aplicada, pela não compreensão do significado correto de termos. A estatística geralmente é dividida em duas partes: Descritiva: encarrega-se de levantamento, organização, classificação e descrição dos dados em tabelas, gráficos ou outros recursos visuais, além do cálculo de parâmetros representativos desses dados. Analítica: trabalha com os dados de forma a estabelecer hipóteses em funções desses dados, procede a sua comprovação e, posteriormente, elabora conclusões cientificas. DADOS ESTATÍSTICOS Os dados estatísticos se obtêm mediante um processo que envolve a observação ou outra mensuração de itens tais como renda anual numa comunidade, escores de testes, quantidade de café por xícara servida por uma máquina automática, percentual de açúcar em cereais, etc. Tais itens chamam-se variáveis, porque originam valores que tendem a exibir certo grau de variabilidade quando se fazem mensurações sucessivas. VARIÁVEL Quando você vai comprar, por exemplo, um aparelho de televisão, você antes de comprar faz, em princípio, algumas perguntas, tais como: Por quero comprar um aparelho de televisão? Que marca devo comprar? Qual o tempo de utilização desse aparelho sem que ele vá ao reparo? De quantas polegadas eu quero a televisão? Devo comprar à vista ou a prazo? E assim por diante. Quando você faz isto ou algo parecido, você está levantando dados para tomar uma decisão. Mas, antes de você tomar a decisão, você sempre faz uma analise das informações obtidas durante o teu processo de solução do problema central: comprar uma televisão. Assim sendo, aqui temos um problema, as variáveis, alguns dados que poderão ser obtidos, uma vez que esses dados são buscados nas amostras que estou a consultar. Ou seja, compreendo estas apurações de dados como um problema de estatística. Assim, podemos compreender o trabalho estatístico como sendo um processo de pesquisa estatística, que envolve amostras, levantamento de dados e análise as informações obtidas. Portanto, variável é qualquer tipo de dado que pode apresentar uma quantidade ou categoria de interesse no estudo estatístico. As variáveis podem ser classificadas em: QUANTITATIVAS: Discretas ou contínuas. Uma variável é discreta quando só pode assumir certos valores, em geral inteiros. Exemplos: 01. Números diários de clientes 02. Números de alunos numa sala de aula 03. Números de defeitos de um carro 04. Números de acidentes 05. Números de praias poluídas As variáveis contínuas são aquelas que podem assumir virtualmente qualquer valor num intervalo de valores. Exemplos: 01. Altura 02. Peso 03. Comprimento 04. Espessura 05. Velocidade QUALITATIVAS (ou categóricas): Nominal ou ordinal. As variáveis nominais envolvem categorias tais como: 01. Sexo 02. Cor dos olhos (azuis, castanhos, verdes) 03. Campo de estudo (medicina, enfermagem, administração) 04. Desempenho (excelente, bom, ruim, sofrível) 05. Grupo de fumantes e não fumantes. As variáveis ordinais consistem de valores relativos atribuídos para denotar ordem: Exemplos: 01. Hipertensão (leve, moderado, grave) 02. Grupo de fumantes ou não fumantes. 03. Classificação em um concurso. POPULAÇÃO E AMOSTRA Normalmente entende-se o termo população como um conjunto de pessoas. Em estatística o sentido da palavra se torna mais amplo. Entende-se por população a totalidade dos elementos ou de um atributo dos elementos referentes a um conjunto determinado. Exemplos: 01. População de Recife. 02. População de pacientes internados no HR. 03. População de ratos machos. 04. População de seringas descartáveis de um posto de saúde. A população pode ser: Finita: quando apresenta um número limitado de indivíduos. Exemplos: 01. A população constituída por todos os parafusos produzidos em uma fábrica em um dia. 02. Nascimento de crianças em um dia em Novo Hamburgo. Infinita: quando o número de observações for infinito. Exemplo. A população constituída de todos os resultados (cara e coroa) em sucessivos lances de uma moeda. A dificuldade de enumerar ou tratar conjuntos completos de dados faz com que se trabalhe com partes do conjunto original, tidas como representantes do conjunto. Convenciona-se denominar essas partes amostra. Deste modo, amostra é o conjunto de elementos retirados da população, suficientemente representativos dessa população. Através da análise dessa amostra estaremos aptos para analisar os resultados da mesma forma que se estudássemos toda a população. A seleção de uma amostra na qual cada membro do conjunto selecionado tenha a mesma chance de incluído é chamada de amostragem. Exemplo: Podemos tirar conclusões sobre as alturas (ou pesos) de 12.000 estudantes adultos (população), observando 100 estudantes (amostra) selecionados na população. Obs. A amostra é sempre finita. Quanto maior for a amostra mais significativa é o estudo. Parâmetro: É uma característica numérica estabelecida para toda uma população. Estimador: É uma característica numérica estabelecida para uma amostra. Dado Estatístico: É sempre um número real. 1) Primitivo ou Bruto: É aquele que não sofreu nenhuma transformação matemática. Número direto. 2) Elaborado ou secundário: É aquele que sofreu transformação matemática. Ex. porcentagem, média, etc. FASES DO TRABALHO ESTATÍSTICO Definição do problema Planejamento: Consiste em determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto de estudo. Que dados deverão ser obtidos? Como se deve obtê-los? Coleta de dados: é normalmente feita através de um questionário ou de observação direta de uma população ou amostra. Organização dos dados: consiste na ordenação e crítica quanto à correção dos valores observados, falhas humanas, omissões, abandono de dados duvidosos. Apresentação dos dados: os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de tabelas e gráficos, que permite uma visualização instantânea de todos os dados. APRESENTAÇÃO DE DADOS ESTATÍSTICOS APRESENTAÇÃO TABULAR A apresentação de dados estatísticos na forma tabular consiste na reunião ou grupamento dos dados em tabelas ou quadros com a finalidade de apresenta-los de modo ordenado, simples e de fácil percepção e com economia de espaço. Componentes Básicos Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos: Exemplo: Principais Elementos de uma Tabela Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela, respondendo às perguntas: O quê? Onde? Quando? Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas. Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas. Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados. SÉRIES ESTATÍSTICAS É toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função de três elementos: Da época; Do local; Da espécie. Esses elementos determinam o surgimento de quatro tipos fundamentais de séries estatísticas: Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o tempo que varia, permanecendo fixos o local e a espécie. Exemplo: Séries Geográficas: são aquelas nas quais os dados são reunidos segundo o local que varia permanecendo fixos o tempo e a espécie. Exemplo: . Séries Específicas: são aquelas nas quais os dados são reunidos segundo o espécie que varia permanecendo fixos o tempo e o local. Exemplo: Séries Composta ou Mista: é a combinação de dois ou mais fundamentais de séries estatísticas. Exemplo: Geográfica – Temporal. * Os dados estão em toneladas. A apresentação tabular de dados estatísticos é normalizada pela resolução nº 886 de 26-101966 do Conselho Nacional de Estatística a fim de uniformizar a apresentação de dados. Exercício 1: De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsito, 27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores. Faça uma tabela para apresentar esses dados. Exercício 2: De acordo com o Ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é, assim distribuído: 320480 km de Rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para apresentar esses dados. Exercício 3: De acordo com Ministério da Educação a quantidade e alunos matriculados no ensino de 1º grau no Brasil nos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para apresentar esses dados. Exercício 4: Estabelecimentos de ensino da região norte do Brasil em 1982. A região norte subdivide-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e 9 estabelecimentos de ensino, respectivamente, segundo o MEC. . Faça uma tabela para apresentar esses dados. TIPOS DE GRÁFICOS Gráfico em linha: é um dos mais importantes gráficos; representa observações feitas ao longo do tempo. Tais conjuntos de dados constituem as chamadas séries históricas ou temporais. Gráfico em setores: É um gráfico construído no círculo, que é dividido em setores correspondentes aos termos da série e proporcionais aos valores numéricos dos termos da série. É mais utilizado para séries específicas ou geográficas com pequeno número de termos e quando se quer salientar a proporção de cada termo em relação ao todo. Exemplo: Gráficos em Barras (ou em colunas). É a representação de uma série por meio de retângulos, dispostos horizontalmente (em barras) ou verticalmente (em colunas). Quando em barras, os retângulos têm a mesma altura e os comprimentos são proporcionais aos respectivos dados. Quando em colunas, os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. Cartograma. É representação sobre uma carta geográfica. Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas. Pictograma. Constitui um dos processos gráficos que melhor fala ao público, pela sua forma ao mesmo tempo atraente e sugestiva. A representação gráfica consta de figuras. Ex.: População Urbana do Brasil em 1980 (x 10) Fonte: Anuário Estatístico (1984) TABELA PRIMITIVA – ROL 1) Foram coletados os pesos(kg) de 20 homens entre 20 e 40 anos 80 55 60 65 60 70 75 70 70 90 55 80 70 100 60 70 80 65 55 90 a) Vamos agrupar os dados em ordem crescente b) Vamos organizar os dados na tabela a seguir PESOS (kg) FREQUÊNCIA FREQUÊNCIA RELATIVA (%) 55 60 65 70 75 80 90 100 SOMA 20 100% 2) Foi feito uma coleta de dados relativos às estaturas de quarenta alunos de um colégio. Estatura dos 40 alunos em centímetro 166 162 155 161 160 161 152 154 161 168 163 156 150 163 160 172 162 156 155 153 160 173 169 157 165 160 151 156 167 155 170 158 164 164 164 158 160 168 155 161 A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva. Organização dos dados: ordem crescente ou decrescente Agora podemos saber, com relativa facilidade, qual a menor (150cm) e qual a maior(173 cm) estatura; que a amplitude da variação foi de 173 – 150 = 23 cm; e, ainda, a ordem que um valor particular da variável ocupa no conjunto. Analisando um pouco mais, veremos que há uma concentração maior nas estaturas entre 160 cm e 165 cm e, mais ainda, que há poucos valores abaixo de 155 cm e acima de 170 cm. DISTRIBUIÇÃO DE FRENQUÊNCIA Denomina-se frequência o número de alunos que fica relacionado a um determinado valor da variável. Obtemos, assim, uma tabela que recebe o nome de distribuição de frequência. DADOS AGRUPADOS Estatura (cm) 150 151 Frequência absoluta Frequência relativa Estatura (cm) 158 Frequência relativa 160 152 161 153 154 162 163 155 164 156 165 157 166 Estatura (cm) 167 168 169 170 172 173 Frequência absoluta Frequência absoluta Frequência relativa Veja que este processo pode ser bem demorado, mesmo que os valores da variável (n) seja de tamanho razoável. Podemos dar uma solução mais aceitável e mais rápida, que consiste em agruparmos os valores em intervalos de classe ou tabulagem. A tabulagem dos dados é feita dividindo-se a amplitude total (diferença entre o maior valor e o menor valor observado) da distribuição pelo número k de classes, previamente fixado. Geralmente o número de classes varia entre 8 e 12. Entretanto existe uma formula empírica para se determinar k(número de classes) K = , onde n é o tamanho da amostra. Voltando ao exemplo anterior (das alturas dos 40 alunos) veja que aplicando a formula para obtermos o número de classes teremos: K= , ou seja teremos 6 classes. Tomando a amplitude total da distribuição 173 – 150 = 23. O quociente da amplitude total pelo número de classes constitui no intervalo de classes (h) . Devemos aproximar o intervalo para um número inteiro. Vamos aproximar para h =4. DADOS AGRUPADOS EM INTERVALOS DE CLASSE ESTATURA (cm) 150 PONTO MÉDIO DAS CLASSSES (Xi) FREQUÊNCIA DAS CLASSES (fi) FREQUÊNCIA RELATIVA (fr) 154 154 158 158 162 162 166 166 170 170 174 ELEMENTOS DA DISTRIBUIÇÃO EM INTERVALOS DE CLASSE 1) Classe: é cada um dos intervalos em que os dados são agrupados. 2) Limites de classes: são os valores extremos de cada classe. li = limite inferior de uma classe; Li = limite superior de uma classe. 3) Amplitude: é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode ser referida ao total de dados ou a uma das classes em particular. Amplitude Total (At) – é calculada pela seguinte expressão: At = Max. (rol) – Min.(rol). Amplitude das classes (h) – é a relação entre a amplitude total e o número de classes, conforme mostra a expressão a seguir: h Máx(rol) Mín.(rol) , onde n é o número de intervalos de classe. n 4) Ponto médio de classe (xi): é calculado pela seguinte expressão: xi Li li 2 5) Frequência absoluta (fi): frequência absoluta de uma classe de ordem i, é o número de dados que pertencem a essa classe. 6) Frequência relativa (fri): frequência relativa de uma classe de ordem i, é o quociente da frequência absoluta dessa classe (fi), pelo total, ou seja, fri fi Total EXEMPLOS: 01. Admitamos que uma empresa que possui um número muito grande de empregados (20.000 por exemplo) está interessada em mandar confeccionar uniformes (macacões) para seus empregados. O fornecedor fabrica 8 tamanhos diferentes (números de 1 a 8). A empresa deseja fazer uma encomenda de 40.000 uniformes. Quantos uniformes deverão ser feitos de cada tamanho? Abaixo segue uma lista com as alturas de 50 empregados dessa empresa. 168 173 198 176 171 167 170 173 168 173 175 159 174 161 164 166 191 184 162 169 158 172 173 161 171 172 187 185 166 180 176 165 173 181 188 160 162 177 163 178 175 167 178 168 183 187 179 181 177 172 02. Considere os seguintes dados relativos ao número de acidentes diário num grande estacionamento, durante um período de 50 dias. 6 5 3 4 5 9 4 8 7 1 2 4 8 5 2 7 4 4 3 3 0 4 4 7 6 8 2 4 1 0 2 5 7 3 5 5 6 7 8 6 4 3 6 0 6 2 7 5 6 3 Vamos montar uma tabela para k = 5 CLASSES (Xi) (fi) (fr) 0 03. Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40 alunos da Turma A: 4 2 1 0 3 1 2 0 2 1 0 2 1 1 0 4 3 2 3 5 8 0 1 6 5 3 2 1 6 4 3 4 3 2 1 0 2 1 0 3 Organize os dados em uma tabela adequada. Qual o percentual de alunos que adquiriram menos do que 3 livros? R: 60% Qual o percentual de alunos que adquiriram pelo menos 4 livros? R: 22,5% A partir do item (b), quantos livros foram adquiridos pelos 40 alunos? R: 92 04. Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da CORSAN: 32 6 22 11 34 40 16 26 23 31 27 10 38 17 13 45 25 50 18 23 35 22 30 14 18 20 13 24 35 29 33 48 20 12 31 39 17 58 19 16 12 21 15 12 20 51 12 19 15 41 29 25 13 23 32 14 27 43 37 21 28 37 26 44 11 53 38 46 17 36 28 49 56 19 11 Organize os dados numa distribuição de frequência com 9 classes de amplitudes iguais. 05. A altura de 60 alunos da FACE-PUC foi registrada abaixo, em cm: 174 170 156 168 176 178 162 182 172 168 166 156 169 168 162 160 163 168 162 172 168 167 170 153 171 166 168 156 160 172 173 163 170 175 176 182 158 176 161 175 173 163 172 167 170 179 179 170 151 175 152 151 172 173 170 174 167 167 158 174 a) Construa uma distribuição de frequência com 8 classes de amplitudes iguais, adotando como limite inferior da distribuição 150 cm. b) Qual o percentual de alunos com altura mínima de 166 cm? R: 70% c) Quantos alunos têm menos de 162 cm? R: 12 d) Qual o percentual de alunos com altura média de 164 cm? Qual a soma total aproximada das alturas dos 60 alunos? R: 10%, 10.108 cm MEDIDADAS DE TENDÊNCIA CENTRAL Há diversas medidas que possibilitam condensar as informações dentro da fase analítica da estatística descritiva. As medidas de tendência central são usadas para indicar um valor que tende a caracterizar, ou a representar melhor, um conjunto de números. As três medidas mais usadas são: A média, a moda e a mediana. Dados agrupados MEDIAS O número destinado a resumir uma série de dados diz – se média, designação que significa que a síntese deve ser um valor intermediário aos valores dados. Tipos de médias - Média aritmética simples e ponderada - Média geométrica - Média harmônica Media aritmética simples: média de um conjunto de valores numéricos é calculada somandose todos estes valores e dividindo-se o resultado pelo número de elementos somados Considere uma sequência numérica Exemplo: Considere os números 2, 5, 7, 9 e 12, a média aritmética simples desses valores é: Média aritmética ponderada: A média ponderada é calculada através do somatório das multiplicações entre valores e pesos atribuídos a cada valor divididos pelo somatório dos pesos. Exemplo: Na escola de Gabriel, a média anual de cada matéria é calculada de acordo com os princípios da média ponderada. Considerando que o peso das notas esteja relacionado ao bimestre em questão, determine a média anual de Gabriel sabendo que as notas em Matemática foram iguais a: 1º Bimestre: 7,0 (peso 1) 2º Bimestre: 6,0 (peso 2) 3º Bimestre: 8,0 (peso 3) 4º Bimestre: 7,5 (peso 4) Média geométrica Dados a média geométrica é igual a EXEMPLOS: 01. Determine a média geométrica de 4, 16 e 8 02. Determine a média geométrica de 2 5 7 10 12 Média harmônica A média harmônica de n valores de uma variável é o inverso da media aritmética dos inversos dos valores dados. Dados , a média harmônica é: EXEMPLOS: Calcule a média harmônica nos casos abaixo: 01. 2 e 6 02. 3, 6, 9 e 12 MODA , A moda de uma distribuição simples é o valor que ocorre com mais frequência. Exemplo: Considere os números abaixo. 20 20 10 10 10 50 50 20 60 40 40 50 80 60 60 40 50 50 50 20 Observe que o número que aparece com mais frequência é o 50, logo a moda dessa amostra é 50. OBSERVAÇÕES: 01. Existem distribuições que não possuem moda. Exemplo: 2 3 5 6 9 1 0 12 15 02. Existem distribuições que possuem várias modas (multimodais) Exemplo: 3 3 3 5 7 7 7 8 10 12 (duas modas:3 e 7) BIMODAL 4 5 5 5 6 7 7 7 9 10 10 10 15 (três modas: 5, 8 e 10) TRIMODAL MEDIANA A mediana é outra medida de posição definida como o número que se encontra no centro de uma série de números organizados em ordem crescente ou decrescente. Exemplo: 01. Considere a distribuição 10 12 15 16 20 35 40, veja que o termo central é 16, logo a mediana vale 16. 02. Agora considere essa distribuição 10 12 15 16 20 35 40 80, veja que agora temos dois termos centrais, 16 e 20, então a mediana será a média aritmética dos dois centrais. EXERCICIOS 1) Considere a distribuição N° de meninos fi 0 2 1 6 2 10 3 12 4 4 34 Determine a média, a moda e a mediana da distribuição. 2) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo: Salário Frequência $400,00 5 $600,00 2 $1.000,00 2 $5.000,00 1 10 Determine o salário médio, o salário mediano e o salário modal. MÈDIA ARITMÉTICA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES Onde: é o ponto médio de cada classe e é a frequência de cada classe Exemplo: 01. Determine a média aritmética das alturas dos estudantes de uma classe de ensino médio apresentada na tabela abaixo. Estaturas(cm) 150 155 155 160 160 165 165 170 170 175 175 180 xi fi 6 9 16 5 3 1 40 Xi fi 6465 02. Calcule a média aritmética dos dados abaixo Salários (R$) 500 xi 900 1100 1300 1300 1500 1700 1900 fi 18 31 15 3 1 1 1 70 Xi fi 59000 03. Calcule a média aritmética dos dados abaixo. Custos (R$) 450 650 0 0 0 950 1050 0 xi fi 8 10 11 16 13 5 1 64 Xi fi 48300 MEDIANA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES Neste caso, o problema consiste em determinar o ponto do intervalo em que está compreendida a mediana. Para tanto temos que inicialmente determinar a classe na qual se acha a mediana. Tal classe será aquela correspondente à frequência acumulada imediatamente superior a . A fórmula abaixo mostra como calcular a mediana de uma distribuição em intervalos d classes. é o limite inferior da classe da mediana é a frequência acumulada da classe anterior à classe mediana é a frequência simples da classe mediana h é a amplitude do intervalo da classe mediana Exemplos: 01. Calcule a mediana da distribuição abaixo. Estaturas (cm) fi fa 150 154 154 158 158 162 4 9 11 4 13 24 162 166 8 32 166 170 170 174 5 3 40 37 40 02. Calcule a mediana da distribuição Custos (R$) fi 8 450 10 11 650 0 16 0 13 0 5 950 1050 1 0 64 03. Calcule a mediana da distribuição. NOTAS fi 0 2 4 5 8 14 6 8 10 7 44 fa fa MODA – DADOS AGRUPADOS EM INTERVALOS DE CLASSES A moda é a media aritmética do limite inferior( modal(classe que tem maior frequência) com o limite superior da classe Exemplos: 01. Vamos calcular a moda da distribuição. Estaturas (cm) fi 150 154 154 158 158 162 4 9 11 162 166 8 166 170 170 174 5 3 40 02 Vamos calcular a moda da distribuição. Salários (R$) 500 900 1100 1300 1300 1500 1700 1900 fi 18 31 15 3 1 1 1 70 MEDIDAS DE DISPERSÃO As medidas de dispersão de uma distribuição são valores que indicam o grau de afastamento dos valores da variável em relação à média. Para qualificar os valores de uma dada variável, ressaltando a maior ou a menor dispersão ou a variabilidade entre esses valores e a sua medida de posição, a estatística recorre às medidas de dispersão ou coeficiente de variação. As principais medidas de dispersão são: Intervalo (amplitude total) Desvio médio absoluto Variância Desvio padrão Coeficiente de variação INTERVALO (AMPLITUDE TOTAL) O intervalo de um grupo de números é de um modo geral, a medida mais simples de calcular e entender. Focalizar o maior e o menor valor no conjunto (valores extremos). O intervalo pode ser obtido de duas maneiras: 01. A diferença entre o maior e o menor valor (amplitude total). 02. O maior e o menor valor no grupo. Exemplo: Considere os valores 1, 10, 15, 25. A diferença entre o maior valor e o menor valor é 25 – 1 = 24, que é a amplitude total. Tambem podemos dizer que o intervalo vai de 1 até 25. DESVIO MÈDIO ABSOLUTO O desvio médio absoluto (Dm) de uma distribuição é a média aritmética dos módulos dos desvios (diferença entre o valor da variável e a média). Dada a distribuição médio é: , os desvios são e o desvio ou OBS.: Para o cálculo do desvio médio são tomados os módulos dos desvios, pois a soma dos desvios é zero. EXEMPLOS: 01. Calcule o desvio médio da distribuição 7 10 12 15 Solução Primeiramente vamos calcular a média aritmética dos dados: Ma = Agora vamos calcular o desvio médio. 16 18 20 02. Determine o desvio médio de 2 4 6 8 10 03. Determine o desvio médio para o conjunto de valores 1 2 3 4 5. VARIÂNCIA A variância de uma distribuição é a média aritmética dos quadrados dos desvios. A variância de uma amostra é representada por S² e constitui uma estimativa da variância da população. A variância é uma medida que dá o grau de dispersão (ou concentração) de probabilidade em torno da média. Assim, se , é uma amostra de n elementos da variável x, então EXEMPLOS: 01. Determine a variância dos números 7 10 12 15 16 18 20 Solução Vamos achar a média. Agora a variância 02. Determine a variância da população 2 4 6 8 10 03. Determine a variância da amostra 1 3 4 3 4 2 4 1 2 2 1 0 VARIÂNCIA PARA DADOS AGRUPADOS SEM INTERVALO DE CLASSE EXEMPLOS: 01. Seja a distribuição 0 1 2 6 2 3 4 12 7 3 30 Vamos calcular a variância 02. Calcule a variância da distribuição 1 2 2 3 4 5 8 6 5 3 6 1 25 03. Calcule a variância da distribuição 2 1 3 4 5 6 7 8 3 5 8 5 4 2 VARÂNCIA PARA DADOS AGRUPADOS COM INTERVALO DE CLASSES Onde é a média da classe EXEMPLOS Calcular a variância das seguintes distribuições 01. Estaturas (cm) fi 150 154 154 158 158 162 4 9 11 162 166 8 166 170 170 174 5 3 40 Solução Para o calculo da variância, devemos abrir colunas para as expressões: e Estaturas (cm) 150 154 154 158 158 162 152 156 160 4 9 11 -9 -5 -1 81 25 1 324 225 11 162 166 164 8 3 9 72 166 170 170 174 168 172 =161 5 3 40 7 11 49 121 245 363 1240 Logo, temos: 02. Classes 155,5 160,5 3 160,5 165,5 7 165,5 170,5 175,5 180,5 170,5 175,5 180,5 185,5 9 13 8 5 185,5 190,5 190,5 195,5 3 2 50 DESVIO PADRÃO É a raiz quadrada da variância. Representamos o desvio padrão de uma amostra por S. Desse modo se padrão é: é uma amostra de n elementos da variável x, então o desvio Exemplos: 01. Determine o desvio padrão dos valores abaixo 5 10 15 20 25 Solução Vamos calcula a media Agora a variância Agora o desvio padrão, que é a raiz quadrada da variância. 02. Determine o desvio padrão dos números abaixo 1 2 4 8 03. Em uma escola, a direção decidiu observar a quantidade de alunos que apresentam todas as notas acima da média em todas as disciplinas. Para analisar melhor, a diretora Ana resolveu montar uma tabela com a quantidade de notas “azuis” em uma amostra de quatro turmas ao longo de um ano. Observe a seguir a tabela organizada pela diretora: Vamos calcular o desvio padrão de cada turma. 04. O dono de uma microempresa pretende saber, em média, quantos produtos são produzidos por cada funcionário em um dia. O chefe tem conhecimento que nem todos conseguem fazer a mesma quantidade de peças, mas pede que seus funcionários façam um registro de sua produção em uma semana de trabalho. Ao fim desse período, chegou-se à seguinte tabela: Vamos determinar o desvio padrão de cada funcionário COEFICIENTE DE VARIAÇÃO É a relação entre o desvio padrão e a média. Geralmente é expresso em porcentagem, o que facilita a comparação da variabilidade entre variáveis com valores em medidas diferentes. Os coeficientes de variação podem ser considerados BAIXOS, quando são inferiores a 10%, MÉDIOS quando de 10 a 20%, ALTOS, quando de 20 a 30% e MUITO ALTOS quando superiores a 30%. O coeficiente de variação é dado pela formula: Exemplos: 01. Determine o coeficiente de variação dos valores abaixo 5 10 15 20 25 02. Determine o coeficiente de variação dos números 7 10 12 15 16 18 20 EXERCÍCIOS 1) (ENEM) Na tabela, são apresentados dados da cotação mensal do ovo extra branco vendido no atacado, em Brasília, em reais, por caixa de 30 dúzias de ovos, em alguns meses dos anos 2007 e 2008. De acordo com esses dados, o valor da mediana das cotações mensais do ovo extra branco nesse período era igual a: A) R$ 73,10. B) R$ 81,50. C) R$ 82,00. D) R$ 83,00. E) R$ 85,30. 2) (ENEM) O quadro seguinte mostra o desempenho de um time de futebol no último campeonato. A coluna da esquerda mostra o número de gols marcados e a coluna da direita informa em quantos jogos o time marcou aquele número de gols. Se X, Y e Z são, respectivamente, a média, a mediana e a moda desta distribuição, então a) X = Y < Z. b) Z < X = Y. c) Y < Z < X. d) Z < X < Y. e) Z < Y < X. 3) Uma equipe de especialistas do centro metrológico de uma cidade mediu a temperatura do ambiente, sempre no mesmo horário, durante 15 dias intercalados, a partir do primeiro dia de um mês. Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de referencia para estudos e verificações de tendências climáticas ao longo dos meses e anos. As medições ocorridas nesse período estão indicadas no quadro: Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais a a) 17 °C, 17 °C e 13,5 °C. B 17 °C, 18 °C e 13,5 °C. C 17 °C, 13,5 °C e 18 °C. D 17 °C, 18 °C e 21,5 °C. E 17 °C, 13,5 °C e 21,5 °C. 4) (ENEM) Depois de jogar um dado em forma de cubo e de faces numeradas de 1 a 6, por 10 vezes consecutivas, e anotar o número obtido em cada jogada, construiu-se a seguinte tabela de distribuição de frequências. A média, mediana e moda dessa distribuição de frequências são, respectivamente a) 3, 2 e 1 b) 3, 3 e 1 c) 3, 4 e 2 d) 5, 4 e 2 e) 6, 2 e 4 5) (UPE SSA 3) Ao término do ano letivo, um professor de química aplicou um simulado com 50 questões, cada uma valendo um ponto, para avaliar estatisticamente o rendimento dos estudantes de uma turma da escola onde trabalha. Os resultados de cada estudante nessa avaliação estão descritos a seguir: Com base nesses resultados, analise as sentenças seguintes: Está CORRETO o que se afirma, apenas, em a) I b) II c) III d) I e II e) II e III 6) (UPE SSA 3) Para controlar o desperdício de alimentos, o gerente do Restaurante Kilobom anotou o peso dos pratos de 50 clientes no almoço da quarta-feira e obteve uma amostra com os seguintes resultados aproximados, em gramas: O valor da amplitude da amostra obtida é de A) 720 B) 600 C) 420 D) 380 E) 120 7) (UPE SSA 2) Depois dos Estados Unidos, o Brasil é o país com maior número de pessoas na rede social Facebook, com 49 milhões de usuários. O quadro a seguir mostra, em milhões, o número de usuários do Facebook, de alguns países. De acordo com esses dados, a moda, a média e a mediana de usuários do Facebook em milhões, nesses países, são, respectivamente, A) 49, 26 e 31 B) 35, 49 e 26 C) 35, 31 e 26 D) 26, 35 e 31 E) 26, 31 e 35 7) (UPE SSA 1) O quadro a seguir mostra o número de gols feitos na fase de classificação por cada um dos times que participaram da Copa das Confederações no Brasil. Considerando o número total de gols de cada país nessa fase, qual o valor da diferença entre a mediana e a média aritmética do total de gols? a) 0,15 b) 0,25 c) 0,35 d) 0,50 e) 0,75 8) Os salários dos funcionários de uma empresa estão distribuídos na tabela abaixo: Salário Freqüência $400,00 5 $600,00 2 $1.000,00 2 $5.000,00 1 Determine o salário médio, o salário mediano e o salário modal. 9) A tabela adiante apresenta o levantamento das quantidades de peças defeituosas para cada lote de 100 unidades fabricadas em uma linha de produção de autopeças, durante um período de 30 dias úteis. Considerando S a série numérica de distribuição de freqüências de peças defeituosas por lote de 100 unidades, julgue os itens abaixo. (1) A moda da série S é 5. ( ) (2) Durante o período de levantamento desses dados, o percentual de peças defeituosas ficou, em média, abaixo de 3,7%. ( ) (3) Os dados obtidos nos 10 primeiros dias do levantamento geram uma série numérica de distribuição de freqüências com a mesma mediana da série S. ( ) 10) Encontre a média para o salário destes funcionários. Salários semanais para 100 operários não especializados Salários semanais fi xi xi.fi 140 |-- 160 7 160 |-- 180 20 180 |-- 200 33 200 |-- 220 25 220 |-- 240 11 240 |-- 260 4 100 11) Salários semanais para 100 operários não especializados Salários semanais fi xi (xi- x )2 (xi- x )2fi 140 |-- 160 160 |-- 180 180 |-- 200 200 |-- 220 220 |-- 240 240 |-- 260 7 20 33 25 11 4 100 Encontre o desvio padrão para o salário destes funcionários. 12) Em conjunto com uma auditoria anual, uma firma de contabilidade pública anota o tempo necessário para realizar a auditoria de 50 balanços contábeis. Tempo necessário para a auditoria de balanços contábeis. Tempo de auditoria. Nº de balanços. (min.) (fi) 10 |-- 20 3 20 |-- 30 5 30 |-- 40 10 40 |-- 50 12 50 |-- 60 20 Total 50 Calcular a) a média, b) o desvio padrão, para o tempo de auditoria necessário para esta amostra de registro. R: a) 43,2; b)12,28. 13) Os salários semanais de 50 funcionários de um hospital, em reais, foram os seguintes: 100 104 116 120 122 126 128 128 130 134 138 140 140 146 150 150 152 156 156 156 160 160 162 162 164 170 170 176 176 176 178 180 180 184 186 186 188 190 190 192 192 194 196 196 200 216 200 218 200 210 a) Construa uma distribuição de frequências, com h = 20 e limite inferior para a primeira classe igual a 100. b) Quantos funcionários tem um salário semanal situado entre R$ 120,00 (inclusive) e R$ 160,00 (exclusive)? 17 funcionários c) Que porcentagem de funcionários tem um salário semanal situado entre R$ 180,00 (inclusive) e R$ 200,00 (exclusive)?26% d) Qual o salário médio semanal destes funcionários utilizando o item a)?166,4 e) Determine o desvio padrão e o coeficiente de variação da distribuição. 28,76; 17,28% 14) Os 20 alunos de uma turma especial de Estatística obtiveram as notas abaixo. 84 88 78 80 89 94 95 83 87 91 83 92 90 92 Determine: a) a amplitude total das notas; R. 22 b) o desvio padrão das notas; R. 6,13677 c) a variância absoluta das notas; R. 37,66 d) o coeficiente de variação; R. 0.0707 e) a proporção de alunos com notas maiores que 90; R. 0,3 77 77 81 86 90 99 15) Os dados abaixo foram colhidos de uma amostra de aves de certa espécie, onde estudouse o tempo, em dias, que os filhotes levavam para abandonar o ninho: TEMPO 5 10 10 15 15 20 20 25 25 30 Nº DE FILHOTES 14 16 18 15 7 Determine e interprete: a) o tempo médio; R: 16,43 b) o tempo mediano; R: 16,39 c) o tempo modal. R: 17,5 16) A poluição causada por óleo em mares e oceanos estimula o crescimento de certos tipos de bactérias. Uma contagem de micro-organismos presentes no petróleo (número de bactérias por 100 mililitros), em 10 porções de água do mar, indicou as seguintes medidas: 49 70 54 67 59 40 71 67 67 52 a) Determine e interprete a média, mediana e moda. R: 59,6; 63; 67 b) Calcule o desvio padrão. R: 10,48