1
2
Extracção aleatória
Sumário (3ª aula)
1. Conceitos básicos de estatística descritiva
• É escolher o indivíduo sem olhar às suas características
1.3. Noção de extracção aleatória e de probabilidade
• Exemplo do Totoloto
1.4 Medidas de tendência central
1.4.1 Média aritmética simples
1.4.2 Média aritmética ponderada
1.4.3 Média aritmética calculada com dados
agrupados em classes
1.4.4 Média geométrica simples
1.4.5 Mediana
• Cada bola é escolhida sem olhar o número
• Se se tirasse uma bola e se tornasse a colocar
• Se se repetisse a extracção 10 milhões de vezes
• Qual a frequência relativa do nº 1?
3
Probabilidade
4
Probabilidade
• Se atirarmos muitas vezes uma moeda ao ar, sairá
cara em 50% das vezes.
• A priori, a frequência seria de 1/49
• Probabilidade de ocorrência: é a frequência que se
observaria do “indivíduo” se se repetisse a extracção
aleatória com reposição um número muito grande de
vezes.
• Numa moeda que se atire ao ar, a probabilidade de
sair cara é 50%.
5
6
Probabilidade
Probabilidade
• Retirando, sem ver, uma carta do baralho de 40
cartas, qual a probabilidade de sair um ás?
• Coloquei numa saca 15% de bolas pretas, 50% de
brancas e 35% de bolas azuis.
• E de sair uma figura?
• Qual a probabilidade de sair uma azul?
• E de sair um trunfo?
• Qual a probabilidade de sair uma branca?
1
7
Probabilidade
8
Condensar a informação num número
• Aprenderão em estatística problemas compostos
z
• Sair cara 3 vezes seguidas?
• Fazer 21 com duas cartas?
z
• Tendo 18, a banca rebentar?
• Furar dois pneu numa viagem de 1000 km?
Tenho uma amostra com várias medidas e quero
condensar a informação
z Mostrei como condensar a informação numa tabela de
frequências relativas
E se pretender apenas um número?
z No furacão, medi o vento em 100 locais e saiu a noticia
de que “a velocidade do vento é de 200km/h”?
9
Média aritmética simples
Média aritmética simples
• Serão os Alemães maiores que os portugueses?
•
10
•
Medi a altura de 1753 Alemães e 247 Portugueses
• Será Lisboa mais quente que o Porto?
Podemos calcular o “alemão médio” e compara com
“o português médio”
• Podemos comparar as “temperaturas médias” de
• Medi em 5 zonas das cidades a temperatura
durante um ano, hora a hora (5x365x24 medidas)
Lisboa e do Porto
• Numas medidas são maiores e noutras menores
11
Propriedades da média aritmética simples
Média aritmética simples
Somam-se o valor medido da variável estatística em
todos os indivíduos e divide-se pelo número de
indivíduos:
n
x + x + ... + xn
=
x= 1 2
n
12
∑x
i =1
n
i
a) Se todos os indivíduos forem idênticos (uma
constante) a média é igual a essa constante:
n
__
a=
∑a
i =1
n
=
a + a + ... + a n ⋅ a
=
=a
n
n
2
13
14
Propriedades da média aritmética simples
Propriedades da média aritmética simples
b) Multiplicando uma constante a por todos os valores
x, a média naritmética vem multiplicada por a:
c) Somando uma constante a a todos os valores x, a
média aritmética vem somada por a:
_____
a⋅x =
∑a⋅x
i
i =1
n
n
a ⋅ x1 + a ⋅ x2 + ... + a ⋅ xn
=
n
________
a+x =
n
=
a ⋅ ∑ xi
i =1
n
∑ (a + x )
i
i =1
n
=
a + x1 + a + x2 + ... + a + xn
n
n
___
=
= a⋅ x
na + ∑ xi
i =1
n
___
=a+ x
15
16
Média aritmética ponderada
Média aritmética ponderada
•A média é calculada com uma amostra
• Sendo que 8 milhões dos portugueses vivem em
cidades e 2 milhões no campo
• Cada pessoa da “cidade” representa 80 mil pessoas
• Cada pessoa da “aldeia” representa 20 mil pessoas
(83x80+3x20)/(10 000x100)
(0,83x0,80+0,03x0,20) = 0,664+0,06 = 0,67
•Alguns indivíduos são mais representativos
Perguntei a pessoas se têm ligação aos esgotos
83 / 100 pessoas que vivem numa cidade têm
3/ 100 pessoas que vivem numa aldeia rural
Qual será a percentagem de ligação em Portugal?
Serão 86/200 = 43%?
• 67% das pessoas tem ligação aos esgotos
17
Média aritmética ponderada
18
Média aritmética ponderada
• Sendo que cada individuo tem wi como importância



 n
w x + w2 x2 + ... + wn xn
w
= ∑  n i xi  = ∑ ( f i ⋅ xi )
x= 1 1
w1 + w2 + ... + wn
i =1
 ∑ w j  i =1
 i= j

n
• fi é a ponderação relativa do individuo i
Quais as propriedades da média aritmética ponderada?
São idênticas às da média aritmética simples
Um exercício para fazer em casa
3
19
20
Média aritmética calculada com dados agrupados em classes
Média geométrica simples
Tenho dados agrupados numa tabela de frequências
Em vez de somar, podemos multiplicar
Alturas
[100;125]
]125;150]
]150;175]
]175;200]
Fequência
0,00%
5,45%
69,34%
25,21%
Tem interesse com taxas
Meio
112,5
137,5
162,5
187,5
xG = (x1 ⋅ x2 ⋅ x3 ... xn )n = n
1
h = 112,5 ⋅ 0,00% + 137,5 ⋅ 5,45% + 162,5 ⋅ 69,34% + 187,5 ⋅ 25,21%
= 167,44 cm
n
∏x
i
i =1
21
22
Média geométrica simples
Média geométrica simples
Sendo que xi é uma taxa de crescimento, a sua média
geométrica será:
Sendo que xt é pequeno, então Ln(1 + xt ) ≈ xt
________
1
1 + x = ((1 + x1 ) × ... × (1 + xn ) )n = n
________
1
1 + x = ((1 + x1 ) × ... × (1 + xn ) )n
 ________  1
Ln 1 + x  = (Ln(1 + x1 ) + ... + Ln(1 + xn ) )
 n

n
∏ (1 + x )
i
i =1
n
=
n
∑ Ln(1 + x ) ∑ x
i
i =1
n
≈
i =1
i
n
23
Média geométrica simples - Exemplo
Mês
TAXA Infl
1+tx
24
Média geométrica simples - Exemplo
1995
3,3%
103,3%
1996
2,2%
102,2%
1997
2,6%
102,6%
1998
2,2%
102,2%
1999
2,7%
102,7%
2000
4,2%
104,2%
2001
3,5%
103,5%
2002
3,2%
103,2%
2003
2,7%
102,7%
2004
2,5%
102,5%
Mês
TAXA Infl
1+tx
2,910%
2,908%
1974
20,4%
120,4%
1975
18,3%
118,3%
1976
27,1%
127,1%
1977
22,7%
122,7%
1978
23,6%
123,6%
1979
16,6%
116,6%
1980
20,0%
120,0%
2002
22,7%
122,7%
2003
25,1%
125,1%
2004
29,3%
129,3%
22,580%
22,524%
4
25
Resumindo quanto à média
z
z
z
26
E as variáveis ordinais?
A média agrega as diversas medidas num “individuo
médio”.
“O português médio tem 43,2 anos, 1,65 m de altura,
4,6 anos de escolaridade”
z
Apenas pode ser calculada com variáveis cardinais
z
z
Será que posso condensar uma variável ordinal num
número?
A média não serve porque não é igual a distancia
entre as classes.
Será que a média de dois “maus” e um “muito bom”
é “suficiente”?
27
Devemos utilizar a MEDIANA
z
A mediana é o valor/classe que divide a amostra a meio
z
Pelo menos 50% das observações são iguais ou piores que a
mediana
Classe
Frequência
F. Cumulante
Número par de elementos
z
Pelo menos 50% das observações são piores ou iguais a
“Suficiente”
z
Menos de 50% das observações são piores ou iguais a “Mau”
Numa amostra de 10 indivíduos, os pesos são
67,4; 63,2; 71,1; 69,5; 65,4; 73,9; 72,7; 74,3; 65,9; 68,6
z
Muito Mau Mau
Muito Bom
Suficiente Bom
7,32% 21,97%
8,12%
37,71% 24,88%
7,32% 29,29%
100,00%
67,00% 91,88%
z
28
Primeiro, ordenamos as observações
63,2; 65,4; 65,9; 67,4; 68,6; 69,5; 71,1; 72,7; 73,9; 74,3
ƒ
•
A mediana é um valor entre 68,6 e 69,5:
(68,6 + 69,5)/2 = 69,05 kg
29
Propriedades da mediana
30
Propriedades da mediana
Med (a ⋅ x) =
Med (a + x) =
n ímpar 
(a ⋅ x)( n +1) / 2 = a ⋅ x( n +1) / 2 ,


=  (a ⋅ x)( n / 2) + (a ⋅ x)( n / 2 +1)
=
x( n / 2 ) + x( n / 2 +1)
=
a
,
n
par


2
2


= a ⋅ Med ( x)
n ímpar 
(a + x)( n +1) / 2 = a + x( n +1) / 2 ,


=  (a + x)( n / 2 ) + (a + x)( n / 2 +1)
=
x( n / 2 ) + x( n / 2 +1)
=a+
, n par 

2
2


= a + Med ( x )
5
Download

média aritmética