Unidade III
ESTATÍSTICA
Prof. Fernando Rodrigues
Medidas de dispersão
ƒ Estudamos na unidade anterior as
medidas de tendência central, que
fornecem importantes informações sobre
uma sequência numérica.
ƒ Entretanto, essas medidas sozinhas não
são suficientes para caracterizar
totalmente a série de dados.
ƒ Duas ou mais sequências numéricas
podem, por exemplo ter um mesmo valor
de média aritmética, e no entanto, serem
bastante diferentes entre si.
Medidas de dispersão
Vejamos, por exemplo, as duas séries
abaixo, que são diferentes entre si:
ƒ X: 3; 3; 3; 3; 3; 3; 3; 3; 3; 3
ƒ Y: 1; 1; 2; 2; 3; 3; 4; 4; 5; 5
Entretanto, se calcularmos as médias
Entretanto
aritméticas das duas séries teremos:
ƒ X = (3+3+3+3+3+3+3+3+3+3)/10 = 3
ƒ Y = (1+1+2+2+3+3+4+4+5+5)/10 = 3
Medidas de dispersão
ƒ Torna-se necessário, então, para
caracterizar melhor a sequência
numérica, a utilização de outras medidas.
ƒ Estas medidas mostrarão se os valores
da série estão mais agrupados em torno
da média ou mais dispersos em relação a
essa média.
ƒ Estas medidas são chamadas de Medidas
de Variação ou Medidas de Dispersão.
Medidas de dispersão
ƒ A primeira, e mais simples medida de
variação é a Amplitude Total ou Intervalo.
ƒ O Intervalo é a distância entre o maior e o
menor valor da série de dados.
ƒ Para calcular a Amplitude Total ou o
tamanho do Intervalo de uma série de
valores, basta subtrairmos o menor valor
da série do maior.
Vejamos alguns exemplos:
Medidas de dispersão
Cálculo da Amplitude de uma sequência:
a) Se tivermos uma sequência de dados
brutos, ou ordenados (rol), basta
identificar o maior e o menor valor e
calcular sua diferença.
Ex: A Amplitude da série:
ƒ X: 2; 3; 3; 4; 7; 8; 10; 10; 12; 15; 15; 18
é igual a 18-2 = 16.
Medidas de dispersão
b) Se os dados estiverem apresentados sob
a forma de uma distribuição de
frequências – variável discreta, a
Amplitude, ou o tamanho do Intervalo da
série será a diferença entre o primeiro e o
último elemento (Xi) da série.
série
Ex: A Amplitude da série abaixo é:
xi
2
3
4
5
6
fi
12
10
14
8
5
ƒ At = 6 – 2 = 4
Medidas de dispersão
c) Se os dados estiverem apresentados sob
a forma de uma distribuição de
frequências – variável contínua, a
Amplitude da série será calculada de uma
forma aproximada, uma vez que não
conhecemos o maior e o menor valor da
série.
ƒ Utiliza-se, neste caso, o ponto médio da
primeira classe como sendo o menor
valor da série.
ƒ Da mesma maneira, utiliza-se o ponto
médio da última classe como sendo o
maior valor da série.
Medidas de dispersão
Exemplo: Calcule a Amplitude total da
seguinte série:
Classe
1
2
3
4
Int. de Classe
2 I----------- 4
4 I----------- 6
6 I----------- 8
8 I----------- 10
fi
10
15
25
12
ƒ O ponto médio da primeira classe é 3.
ƒ O ponto médio da última classe é 9.
ƒ A Amplitude total será: 9 – 3 = 6.
6
Medidas de dispersão
ƒ A Amplitude ou Intervalo de uma série é
uma medida de dispersão muito simples
e fácil de ser calculada.
ƒ Entretanto, ela depende apenas de dois
valores da série (o maior e o menor).
ƒ Assim, é possível modificar
completamente a dispersão dos valores
sem alterar a Amplitude da série, o que
torna esta medida pouco sensível a estas
mudanças.
ƒ Em muitos casos, portanto, será
necessário o uso de medidas de variação
mais precisas.
Interatividade
Qual das afirmações abaixo está correta?
a) A média aritmética é uma medida suficiente
para caracterizar uma sequência numérica.
b) As medidas de tendência central fornecem
todas as informações relevantes sobre uma
série de dados.
c) Duas sequências numéricas diferentes
sempre terão médias aritméticas diferentes.
d) As medidas de variação podem substituir
as medidas de tendência central no estudo
de uma série de dados.
e) As medidas de variação mostram se os
valores estão agrupados ou dispersos em
relação à média.
Medidas de dispersão
Variância e desvio padrão.
ƒ As medidas de variação ou dispersão
mais utilizadas na prática são a variância
e o desvio padrão.
ƒ A variância é2simbolizada por S2 ou pela
letra grega σ .
Calcula-se a variância através da fórmula:
Σ( xi − x ) 2
s =
n −1
2
Medidas de dispersão
ƒ O desvio padrão, por sua vez, é
simbolizado por S ou pela letra grega σ.
ƒ O desvio padrão é a raiz quadrada
positiva da variância.
Portanto o desvio padrão será:
Portanto,
s =
Σ ( xi − x ) 2
n −1
Medidas de dispersão
Cálculo
Cál
l da
d variância
iâ i e do
d desvio
d
i padrão:
dã
ƒ Exemplo 1:
Calcule a variância e o desvio padrão da
série X: 4; 5; 6; 5.
Inicialmente calculamos a média aritmética
da série:
x=
4 + 5 + 6 + 5 20
=
=5
4
4
Medidas de dispersão
ƒ Calculamos, então, os quadrados das
diferenças ( xi − x ) 2
(4 - 5)2 = 1
(5 – 5)2 = 0
(6 – 5)2 = 1
Σ ( xi − x ) 2
s =
n −1
2
(5 – 5)2 = 0
A variância será:
ƒ S2 = 1+0+1+0 = 2/3 = 0,667
3
ƒ O desvio padrão será = S = 0,816
Medidas de dispersão
ƒ Exemplo 2 - Tabela de frequências Variável discreta:
No caso de os dados estarem agrupados em
uma distribuição de frequência – variável
discreta, a fórmula de cálculo terá uma
pequena modificação.
Σ( xi − x ) 2 .fi
s =
n −1
2
Medidas de dispersão
ƒ Exemplo 2.
Calcule a variância e o desvio padrão da
série:
xi
2
3
4
5
fi
3
5
8
4
ƒ Somando a coluna fi, temos o número de
), que
q é igual
g
a 20.
elementos ((n),
Medidas de dispersão
Calculando a média aritmética pela fórmula:
x=
Σxi.fi
n
xi
2
3
4
5
fi
3
5
8
4
x i . fi
6
15
32
20
73
ƒ A média será = 73/20 = 3,65.
Medidas de dispersão
Desenvolvendo os cálculos teremos:
xi
2
3
4
5
fi
3
5
8
4
ƒ A somatória de
( xi − x ) 2 .fi
8,17
2,11
0 98
0,98
7,29
( xi − x ) 2 .fi
= 18,52
Medidas de dispersão
O valor da variância, então será:
Σ( xi − x ) 2 .fi
s =
n −1
2
ƒ S2 = 18,52 = 0,975
19
O valor do desvio padrão é:
ƒ S = 0,987
Medidas de dispersão
Variável contínua:
ƒ No caso de termos os dados agrupados
em uma distribuição de frequências na
forma de variável contínua, os cálculos
serão bastante parecidos.
ƒ A diferença entre este caso e o anterior é
que, como agora, não temos todos os
valores relacionados, mas classes de
valores, utiliza-se o ponto médio de cada
classe para efetuar os cálculos.
Interatividade
A variância da série X: 1; 2; 3 é:
a) 1
b) 2
c) 3
d) 4
e) 5
Probabilidades
Noções gerais de probabilidade:
ƒ Utilizamos o conceito intuitivo de
probabilidade em diversas situações de
nossas vidas, diariamente.
ƒ Antes de sair de casa, analisamos, por
exemplo, a probabilidade de chover para
decidir se levamos ou não o guardachuva.
ƒ Utilizamos neste exemplo o conceito
intuitivo de p
probabilidade para
p
tomar
nossa decisão.
Probabilidades
ƒ As probabilidades dizem respeito a
situações em que existe aleatoriedade.
Ou seja, em que o resultado a ser obtido
depende de fatores imponderáveis do
acaso.
ƒ Em estatística, quando falamos em um
resultado, ele se expressa no valor de
uma variável. Se o valor depende do
acaso, a variável que expressa esse valor
é chamada de variável aleatória.
Probabilidades
ƒ Podemos chamar de variável aleatória,
por exemplo, o resultado de um jogo de
par ou ímpar, sendo que a variável
“resultado” poderia assumir os valores
“par” ou “ímpar”.
ƒ Cada resultado de uma variável aleatória
terá uma chance, maior ou menor, de ser
observado.
ƒ Estabelecer a magnitude dessas chances
é o que se busca no cálculo de
probabilidades.
Probabilidades
ƒ Para determinar a probabilidade de que
ocorra um determinado evento E como
resultado de uma variável aleatória,
precisamos analisar quantos são os
resultados possíveis em geral e quantos
são
ã aqueles
l ffavoráveis
á i ao evento
t E
E.
ƒ A probabilidade de o evento E ocorrer,
que será denotada por P(E), será a razão
entre o número específico de eventos que
são favoráveis a E, ao qual chamaremos
nE, pelo
l número
ú
total
t t l de
d eventos
t
possíveis, ao qual chamaremos ntot.
Probabilidades
ƒ O conjunto de todos os eventos
possíveis também é chamado de “espaço
amostral”.
A fórmula para este cálculo será, então:
ƒ O valor da probabilidade P será sempre
um número entre 0 e 1.
Vejamos porque:
Probabilidades
ƒ A maior probabilidade possível está
relacionada ao maior número possível de
eventos favoráveis a E.
ƒ O número de eventos favoráveis a E será,
no máximo, igual ao número total de
eventos possíveis.
ƒ Dessa forma, nE será igual a ntot e a
divisão de um pelo outro será igual a 1.
Probabilidades
ƒ A menor probabilidade possível está
relacionada ao menor número possível
de eventos favoráveis a E.
ƒ O número de eventos favoráveis a E será,
no mínimo, zero, visto que uma contagem
de eventos não pode ser negativa.
ƒ Assim sendo, a menor probabilidade
possível é zero.
Probabilidades
ƒ É bastante comum falar de porcentagens
utilizando a notação percentual.
ƒ Por exemplo, uma probabilidade 0,6 seria
descrita como uma probabilidade de 60%.
ƒ Para chegarmos a este número,
simplesmente multiplicamos o valor
encontrado no cálculo da probabilidade
por 100.
ƒ Trata-se simplesmente de duas maneiras
de escrever o mesmo valor.
Probabilidades
Vejamos então como se calcula a
probabilidade de ocorrência de um
determinado evento:
Exemplo:
Numa festa de escola são realizados alguns
sorteios de brindes entre os alunos, cujas
idades estão apresentadas na tabela abaixo:
Probabilidades
ƒ Um aluno será sorteado para ganhar o
primeiro brinde. Qual é a probabilidade de
ser um aluno de 8 anos?
Resolução:
ƒ Ntot= 85
ƒ Número de eventos favoráveis: n8 = 17
Teremos, então:
Probabilidades
Efetuando-se esta divisão, chegamos ao
resultado de 0,2 ou seja:
ƒ P(8) = 0,2 ou 20%
ƒ A probabilidade de o sorteado ser um
aluno de 8 anos,
anos neste exemplo
exemplo, é de
20%.
Interatividade
No lançamento de um dado, qual é a
probabilidade de ser sorteada uma face de
número par?
a) 10%
b) 20%
c) 40%
d) 50%
e) 70%
Probabilidades
ƒ Alguns cuidados na interpretação de uma
probabilidade.
ƒ O estudo das probabilidades é uma
importante ferramenta matemática para
tomarmos decisões em relação
ç a eventos
futuros, tomando por base o
conhecimento adquirido em experiências
passadas.
ƒ Existem, entretanto, alguns cuidados que
precisam ser tomados na interpretação
p
p
ç
de resultados de probabilidade para não
se chegar a conclusões equivocadas.
Probabilidades
ƒ Lembrar que a portabilidade dos
resultados para as probabilidades
calculadas a partir de certo conjunto de
dados só vale se a situação descrita for
similar àquela em questão.
ƒ É comum que se utilizem estudos
gerados em um país para analisar a
economia de outro, ou produtos com
diferentes especificações etc.
ƒ Há vezes em q
que a utilização
ç é válida,
mas em outras não. Assim, busque ter
um olhar crítico.
Probabilidades
ƒ Quando a probabilidade de um evento é
zero, isso não quer dizer
obrigatoriamente que ele não ocorrerá.
Quer dizer somente que entre os dados
disponíveis não havia nenhum que
correspondesse
d
ao evento
t em questão.
tã
ƒ Temos, como exemplos de casos assim,
todos os eventos historicamente novos
ou aqueles que são extremamente raros.
ƒ No entanto, tudo aquilo
q
que
q é impossível
p
terá, necessariamente, probabilidade
nula.
Probabilidades
ƒ Do mesmo modo que a probabilidade
nula (zero) não quer dizer que algo seja
totalmente impossível, também a
probabilidade de valor 1 (ou 100%) não
significa certeza absoluta de que algo
acontecerá.
t
á
ƒ Entram nessa categoria os eventos cuja
não ocorrência é extremamente rara ou
são aqueles que acabam não ocorrendo
por causa de um evento imponderável e
i
imprevisível.
i í l
ƒ Do mesmo modo, algo que seja certeza
terá probabilidade igual a um.
Probabilidades
Origem dos dados:
ƒ Quando estudamos probabilidades,
podemos analisar situações em que os
valores conhecidos das variáveis são
empíricos
p
ou analíticos. Na sequência
q
definiremos cada um deles.
ƒ Os dados analíticos e os empíricos são
tratados de maneira diferente.
ƒ Vamos verificar essa distinção,
mostrando como utilizar os dados de
ambos os tipos.
Probabilidades
Dados empíricos:
ƒ São aqueles cujos valores são
observados na prática.
ƒ Fazem parte dessa classificação todos os
dados oriundos de pesquisas de campo
campo,
como a idade das pessoas de certo
grupo, os valores de preços de mercado
etc.
ƒ Para efeitos didáticos, os dados do tipo
empírico utilizados não foram retirados
da realidade, mas simulam valores que
poderiam ter sido encontrados dessa
maneira.
Probabilidades
Dados analíticos:
ƒ Os dados analíticos têm um caráter
diferente, eles não precisam ser medidos
diretamente, visto que a análise das
características do sistema estudado já
j
nos dá os valores possíveis da variável
aleatória, bem como a proporção em que
eles se encontram.
ƒ Como exemplo dessa classe de dados
temos os jjogos
g de azar, como o jogo
j g de
uma moeda, o jogo de dados ou o sorteio
de cartas, por exemplo.
Probabilidades
Dados analíticos:
ƒ Por exemplo, quando jogamos uma
moeda, sabemos que haverá somente
dois resultados possíveis: face cara ou
face coroa.
ƒ Em princípio, podemos assumir que a
moeda é equilibrada e que a ocorrência
de uma ou outra face dependerá somente
do acaso e com igual proporção.
Probabilidades
Dados analíticos:
Assim, a própria análise do lançamento de
uma moeda já nos dá a informação
necessária para calcularmos as
probabilidades de ocorrência de um evento
p
relacionado:
ƒ P (cara) = 1/2 = 0,5 = 50%
ƒ P (coroa) =1/2 = 0,5 = 50%
Interatividade
No lançamento simultâneo de 2 moedas,
qual é a probabilidade de obtermos 2 caras?
a) 1/4
b) 2/4
c)) 3/4
d) 4/4
e) 0
ATÉ A PRÓXIMA!
Download

37349