Unidade III ESTATÍSTICA Prof. Fernando Rodrigues Medidas de dispersão Estudamos na unidade anterior as medidas de tendência central, que fornecem importantes informações sobre uma sequência numérica. Entretanto, essas medidas sozinhas não são suficientes para caracterizar totalmente a série de dados. Duas ou mais sequências numéricas podem, por exemplo ter um mesmo valor de média aritmética, e no entanto, serem bastante diferentes entre si. Medidas de dispersão Vejamos, por exemplo, as duas séries abaixo, que são diferentes entre si: X: 3; 3; 3; 3; 3; 3; 3; 3; 3; 3 Y: 1; 1; 2; 2; 3; 3; 4; 4; 5; 5 Entretanto, se calcularmos as médias Entretanto aritméticas das duas séries teremos: X = (3+3+3+3+3+3+3+3+3+3)/10 = 3 Y = (1+1+2+2+3+3+4+4+5+5)/10 = 3 Medidas de dispersão Torna-se necessário, então, para caracterizar melhor a sequência numérica, a utilização de outras medidas. Estas medidas mostrarão se os valores da série estão mais agrupados em torno da média ou mais dispersos em relação a essa média. Estas medidas são chamadas de Medidas de Variação ou Medidas de Dispersão. Medidas de dispersão A primeira, e mais simples medida de variação é a Amplitude Total ou Intervalo. O Intervalo é a distância entre o maior e o menor valor da série de dados. Para calcular a Amplitude Total ou o tamanho do Intervalo de uma série de valores, basta subtrairmos o menor valor da série do maior. Vejamos alguns exemplos: Medidas de dispersão Cálculo da Amplitude de uma sequência: a) Se tivermos uma sequência de dados brutos, ou ordenados (rol), basta identificar o maior e o menor valor e calcular sua diferença. Ex: A Amplitude da série: X: 2; 3; 3; 4; 7; 8; 10; 10; 12; 15; 15; 18 é igual a 18-2 = 16. Medidas de dispersão b) Se os dados estiverem apresentados sob a forma de uma distribuição de frequências – variável discreta, a Amplitude, ou o tamanho do Intervalo da série será a diferença entre o primeiro e o último elemento (Xi) da série. série Ex: A Amplitude da série abaixo é: xi 2 3 4 5 6 fi 12 10 14 8 5 At = 6 – 2 = 4 Medidas de dispersão c) Se os dados estiverem apresentados sob a forma de uma distribuição de frequências – variável contínua, a Amplitude da série será calculada de uma forma aproximada, uma vez que não conhecemos o maior e o menor valor da série. Utiliza-se, neste caso, o ponto médio da primeira classe como sendo o menor valor da série. Da mesma maneira, utiliza-se o ponto médio da última classe como sendo o maior valor da série. Medidas de dispersão Exemplo: Calcule a Amplitude total da seguinte série: Classe 1 2 3 4 Int. de Classe 2 I----------- 4 4 I----------- 6 6 I----------- 8 8 I----------- 10 fi 10 15 25 12 O ponto médio da primeira classe é 3. O ponto médio da última classe é 9. A Amplitude total será: 9 – 3 = 6. 6 Medidas de dispersão A Amplitude ou Intervalo de uma série é uma medida de dispersão muito simples e fácil de ser calculada. Entretanto, ela depende apenas de dois valores da série (o maior e o menor). Assim, é possível modificar completamente a dispersão dos valores sem alterar a Amplitude da série, o que torna esta medida pouco sensível a estas mudanças. Em muitos casos, portanto, será necessário o uso de medidas de variação mais precisas. Interatividade Qual das afirmações abaixo está correta? a) A média aritmética é uma medida suficiente para caracterizar uma sequência numérica. b) As medidas de tendência central fornecem todas as informações relevantes sobre uma série de dados. c) Duas sequências numéricas diferentes sempre terão médias aritméticas diferentes. d) As medidas de variação podem substituir as medidas de tendência central no estudo de uma série de dados. e) As medidas de variação mostram se os valores estão agrupados ou dispersos em relação à média. Medidas de dispersão Variância e desvio padrão. As medidas de variação ou dispersão mais utilizadas na prática são a variância e o desvio padrão. A variância é2simbolizada por S2 ou pela letra grega σ . Calcula-se a variância através da fórmula: Σ( xi − x ) 2 s = n −1 2 Medidas de dispersão O desvio padrão, por sua vez, é simbolizado por S ou pela letra grega σ. O desvio padrão é a raiz quadrada positiva da variância. Portanto o desvio padrão será: Portanto, s = Σ ( xi − x ) 2 n −1 Medidas de dispersão Cálculo Cál l da d variância iâ i e do d desvio d i padrão: dã Exemplo 1: Calcule a variância e o desvio padrão da série X: 4; 5; 6; 5. Inicialmente calculamos a média aritmética da série: x= 4 + 5 + 6 + 5 20 = =5 4 4 Medidas de dispersão Calculamos, então, os quadrados das diferenças ( xi − x ) 2 (4 - 5)2 = 1 (5 – 5)2 = 0 (6 – 5)2 = 1 Σ ( xi − x ) 2 s = n −1 2 (5 – 5)2 = 0 A variância será: S2 = 1+0+1+0 = 2/3 = 0,667 3 O desvio padrão será = S = 0,816 Medidas de dispersão Exemplo 2 - Tabela de frequências Variável discreta: No caso de os dados estarem agrupados em uma distribuição de frequência – variável discreta, a fórmula de cálculo terá uma pequena modificação. Σ( xi − x ) 2 .fi s = n −1 2 Medidas de dispersão Exemplo 2. Calcule a variância e o desvio padrão da série: xi 2 3 4 5 fi 3 5 8 4 Somando a coluna fi, temos o número de ), que q é igual g a 20. elementos ((n), Medidas de dispersão Calculando a média aritmética pela fórmula: x= Σxi.fi n xi 2 3 4 5 fi 3 5 8 4 x i . fi 6 15 32 20 73 A média será = 73/20 = 3,65. Medidas de dispersão Desenvolvendo os cálculos teremos: xi 2 3 4 5 fi 3 5 8 4 A somatória de ( xi − x ) 2 .fi 8,17 2,11 0 98 0,98 7,29 ( xi − x ) 2 .fi = 18,52 Medidas de dispersão O valor da variância, então será: Σ( xi − x ) 2 .fi s = n −1 2 S2 = 18,52 = 0,975 19 O valor do desvio padrão é: S = 0,987 Medidas de dispersão Variável contínua: No caso de termos os dados agrupados em uma distribuição de frequências na forma de variável contínua, os cálculos serão bastante parecidos. A diferença entre este caso e o anterior é que, como agora, não temos todos os valores relacionados, mas classes de valores, utiliza-se o ponto médio de cada classe para efetuar os cálculos. Interatividade A variância da série X: 1; 2; 3 é: a) 1 b) 2 c) 3 d) 4 e) 5 Probabilidades Noções gerais de probabilidade: Utilizamos o conceito intuitivo de probabilidade em diversas situações de nossas vidas, diariamente. Antes de sair de casa, analisamos, por exemplo, a probabilidade de chover para decidir se levamos ou não o guardachuva. Utilizamos neste exemplo o conceito intuitivo de p probabilidade para p tomar nossa decisão. Probabilidades As probabilidades dizem respeito a situações em que existe aleatoriedade. Ou seja, em que o resultado a ser obtido depende de fatores imponderáveis do acaso. Em estatística, quando falamos em um resultado, ele se expressa no valor de uma variável. Se o valor depende do acaso, a variável que expressa esse valor é chamada de variável aleatória. Probabilidades Podemos chamar de variável aleatória, por exemplo, o resultado de um jogo de par ou ímpar, sendo que a variável “resultado” poderia assumir os valores “par” ou “ímpar”. Cada resultado de uma variável aleatória terá uma chance, maior ou menor, de ser observado. Estabelecer a magnitude dessas chances é o que se busca no cálculo de probabilidades. Probabilidades Para determinar a probabilidade de que ocorra um determinado evento E como resultado de uma variável aleatória, precisamos analisar quantos são os resultados possíveis em geral e quantos são ã aqueles l ffavoráveis á i ao evento t E E. A probabilidade de o evento E ocorrer, que será denotada por P(E), será a razão entre o número específico de eventos que são favoráveis a E, ao qual chamaremos nE, pelo l número ú total t t l de d eventos t possíveis, ao qual chamaremos ntot. Probabilidades O conjunto de todos os eventos possíveis também é chamado de “espaço amostral”. A fórmula para este cálculo será, então: O valor da probabilidade P será sempre um número entre 0 e 1. Vejamos porque: Probabilidades A maior probabilidade possível está relacionada ao maior número possível de eventos favoráveis a E. O número de eventos favoráveis a E será, no máximo, igual ao número total de eventos possíveis. Dessa forma, nE será igual a ntot e a divisão de um pelo outro será igual a 1. Probabilidades A menor probabilidade possível está relacionada ao menor número possível de eventos favoráveis a E. O número de eventos favoráveis a E será, no mínimo, zero, visto que uma contagem de eventos não pode ser negativa. Assim sendo, a menor probabilidade possível é zero. Probabilidades É bastante comum falar de porcentagens utilizando a notação percentual. Por exemplo, uma probabilidade 0,6 seria descrita como uma probabilidade de 60%. Para chegarmos a este número, simplesmente multiplicamos o valor encontrado no cálculo da probabilidade por 100. Trata-se simplesmente de duas maneiras de escrever o mesmo valor. Probabilidades Vejamos então como se calcula a probabilidade de ocorrência de um determinado evento: Exemplo: Numa festa de escola são realizados alguns sorteios de brindes entre os alunos, cujas idades estão apresentadas na tabela abaixo: Probabilidades Um aluno será sorteado para ganhar o primeiro brinde. Qual é a probabilidade de ser um aluno de 8 anos? Resolução: Ntot= 85 Número de eventos favoráveis: n8 = 17 Teremos, então: Probabilidades Efetuando-se esta divisão, chegamos ao resultado de 0,2 ou seja: P(8) = 0,2 ou 20% A probabilidade de o sorteado ser um aluno de 8 anos, anos neste exemplo exemplo, é de 20%. Interatividade No lançamento de um dado, qual é a probabilidade de ser sorteada uma face de número par? a) 10% b) 20% c) 40% d) 50% e) 70% Probabilidades Alguns cuidados na interpretação de uma probabilidade. O estudo das probabilidades é uma importante ferramenta matemática para tomarmos decisões em relação ç a eventos futuros, tomando por base o conhecimento adquirido em experiências passadas. Existem, entretanto, alguns cuidados que precisam ser tomados na interpretação p p ç de resultados de probabilidade para não se chegar a conclusões equivocadas. Probabilidades Lembrar que a portabilidade dos resultados para as probabilidades calculadas a partir de certo conjunto de dados só vale se a situação descrita for similar àquela em questão. É comum que se utilizem estudos gerados em um país para analisar a economia de outro, ou produtos com diferentes especificações etc. Há vezes em q que a utilização ç é válida, mas em outras não. Assim, busque ter um olhar crítico. Probabilidades Quando a probabilidade de um evento é zero, isso não quer dizer obrigatoriamente que ele não ocorrerá. Quer dizer somente que entre os dados disponíveis não havia nenhum que correspondesse d ao evento t em questão. tã Temos, como exemplos de casos assim, todos os eventos historicamente novos ou aqueles que são extremamente raros. No entanto, tudo aquilo q que q é impossível p terá, necessariamente, probabilidade nula. Probabilidades Do mesmo modo que a probabilidade nula (zero) não quer dizer que algo seja totalmente impossível, também a probabilidade de valor 1 (ou 100%) não significa certeza absoluta de que algo acontecerá. t á Entram nessa categoria os eventos cuja não ocorrência é extremamente rara ou são aqueles que acabam não ocorrendo por causa de um evento imponderável e i imprevisível. i í l Do mesmo modo, algo que seja certeza terá probabilidade igual a um. Probabilidades Origem dos dados: Quando estudamos probabilidades, podemos analisar situações em que os valores conhecidos das variáveis são empíricos p ou analíticos. Na sequência q definiremos cada um deles. Os dados analíticos e os empíricos são tratados de maneira diferente. Vamos verificar essa distinção, mostrando como utilizar os dados de ambos os tipos. Probabilidades Dados empíricos: São aqueles cujos valores são observados na prática. Fazem parte dessa classificação todos os dados oriundos de pesquisas de campo campo, como a idade das pessoas de certo grupo, os valores de preços de mercado etc. Para efeitos didáticos, os dados do tipo empírico utilizados não foram retirados da realidade, mas simulam valores que poderiam ter sido encontrados dessa maneira. Probabilidades Dados analíticos: Os dados analíticos têm um caráter diferente, eles não precisam ser medidos diretamente, visto que a análise das características do sistema estudado já j nos dá os valores possíveis da variável aleatória, bem como a proporção em que eles se encontram. Como exemplo dessa classe de dados temos os jjogos g de azar, como o jogo j g de uma moeda, o jogo de dados ou o sorteio de cartas, por exemplo. Probabilidades Dados analíticos: Por exemplo, quando jogamos uma moeda, sabemos que haverá somente dois resultados possíveis: face cara ou face coroa. Em princípio, podemos assumir que a moeda é equilibrada e que a ocorrência de uma ou outra face dependerá somente do acaso e com igual proporção. Probabilidades Dados analíticos: Assim, a própria análise do lançamento de uma moeda já nos dá a informação necessária para calcularmos as probabilidades de ocorrência de um evento p relacionado: P (cara) = 1/2 = 0,5 = 50% P (coroa) =1/2 = 0,5 = 50% Interatividade No lançamento simultâneo de 2 moedas, qual é a probabilidade de obtermos 2 caras? a) 1/4 b) 2/4 c)) 3/4 d) 4/4 e) 0 ATÉ A PRÓXIMA!