Estatística II
Sociologia e Sociologia e Planeamento
ISCTE
SOCIOLOGIA E SOCIOLOGIA E PLANEAMENTO
Ano Lectivo 2003/2004 (2º Semestre)
ESTATÍSTICA II
(Textos de Apoio das Aulas)
Distribuições – a Normal
Métodos de Amostragem
Carlos Lourenço, Dep.º Métodos Quantitativos
([email protected])
Carlos Lourenço
ISCTE, 2004
1
Estatística II
Sociologia e Sociologia e Planeamento
Conceitos Básicos de Estatística
População (ou Universo) e Amostra
A população é um conjunto finito ou infinito (numerável ou não) dos elementos cujas
características são objecto de um estudo. A amostra é um subconjunto finito da população.
Escalas de Medida das Variáveis Estatísticas (por grau decrescente de restrição)1
1. Nominais: As variáveis são medidas em classes discretas e, à partida, não é possível
estabelecer nenhuma ordenação entre elas. (Exs.: Estado Civil, Sexo)
2. Ordinais: As variáveis são medidas em classes discretas e é possível estabelecer uma
ordenação entre elas, segundo uma relação descritível mas não quantificável. (Exs.: escalas
de Likert, as habilitações)
3. De Intervalo: As variáveis assumem valores quantitativos. No entanto, não possuem um
zero absoluto, isto é, não possuem uma medida de ausência de atributo. (Ex.: A
temperatura)
4. De Rácio: As variáveis assumem valores quantitativos cuja relação exacta é possível definir
por terem um zero absoluto.2 (Exs.: a idade, o peso, a altura, o rendimento em euros, etc.)
Dados Discretos
Podem tomar um número finito ou infinito numerável de valores (normalmente tomam apenas
valores inteiros). Posteriormente, podem ou não ser agregados em classes.
Dados Contínuos
Podem tomar um número infinito não-numerável de valores. Se podem tomar dois valores
possíveis, a e b, teoricamente podem tomar também quaisquer valores entre a e b.
Posteriormente, podem ou não ser agregados em classes.
Parâmetros
Características da população. Geralmente desconhecidos. Exemplos de Parâmetros: média ( µ ),
variância ( σ 2 ), e desvio-padrão ( σ ).
Estatísticas
Características da amostra. Variam entre as várias amostras que se podem retirar de uma mesma
população. Exemplos de Estatísticas: média amostral ( X ), variância amostral ( S 2 ), e desviopadrão amostral ( s )
Inferência Estatística (ou Estatística Indutiva)
Obter generalizações aplicáveis a indivíduos (não observados) pertencentes a um grupo – uma
população – a partir dos dados recolhidos de uma amostra.
Estimadores
São estatísticas (características amostrais) que permitem inferir sobre as características da
população (parâmetros). Todos os estimadores são estatísticas mas o inverso não se verifica.
A inferência estatística permite assim inferir sobre os parâmetros da população através de
estimadores, com um determinado grau de probabilidade. O conceito de probabilidade é, pois,
uma das ferramentas fundamentais em Estatística.
1
“Any numerical operation can be performed on any set of numbers; whether the resulting numbers are meaningful, however,
depends on the particular level of measurement being used.” Ref.: Weinberg, Sharon, and Goldberg Kenneth (1990). Statistics for
the Behavioral Sciences. Cambridge University Press.
2
Nota: o SPSS não distingue as variáveis medidas em escala de intervalo ou em escala de rácio. Classifica ambas como “SCALE”.
Carlos Lourenço
ISCTE, 2004
2
Estatística II
Sociologia e Sociologia e Planeamento
Distribuições Teóricas Mais Importantes – “A Normal”
1. Introdução
Em que ponto estamos?
−
Vimos o cálculo de probabilidades dos acontecimentos através dos conceitos de
probabilidade, de função de probabilidade e dos seus axiomas e teoremas (com a ajuda
preciosa dos Diagramas de Venn…)
−
Com o exemplo muito simples do desempenho de um aluno na cadeira de Estatística, vimos
o cálculo de probabilidades através de variáveis aleatórias, usando os conceitos de função de
probabilidade (simples) e de função de distribuição (acumulada);
Mas qual é (mais uma vez…) o nosso objectivo?
O nosso objectivo é modelizar as experiências aleatórias de modo a que esses modelos
consigam devolver/determinar as probabilidades dos acontecimentos.
Ora, em Estatística Descritiva falávamos de distribuições (empíricas) de frequências (simples ou
acumuladas) de variáveis (observadas) discretas ou contínuas. Então, as distribuições teóricas
não são mais que a representação dos modelos matemáticos probabilísticos daquelas
distribuições empíricas, cujas formulações assentam na teoria apresentada anteriormente;
Muitos dos fenómenos aleatórios que ocorrem no quotidiano podem ser modelizados/explicados
por aqueles modelos probabilísticos/distribuições teóricas. Embora existam várias distribuições
teóricas de variáveis discretas e de variáveis contínuas, será apenas apresentada a Distribuição
Normal (além do mais, as outras principais distribuições podem aproximar-se à distribuição
normal).
2. A Distribuição Normal
2.1. Qual a expressão da sua função densidade de probabilidade (f.d.p.)?
Diz-se que a v. a. contínua X segue uma distribuição normal com parâmetros “miú” e
“sigma”, ou, o que é a mesma coisa, com média “miú” e desvio-padrão “sigma”,
3
X ~ N (µ ,σ ) , se a sua f.d.p. é dada por:
f ( x) = f ( x; µ ,σ ) =
1
σ 2π
⋅e
⎡ 1 ⎛ x − µ ⎞2 ⎤
⎢− ⎜
⎟ ⎥
⎢⎣ 2 ⎝ σ ⎠ ⎥⎦
2.2. Quais os parâmetros que caracterizam esta distribuição?
E [X ] = µ
Desvio - Padrão = σ (porque Var [X ] = σ 2 )
3
Esta expressão matemática, tal como muitas outras definições teóricas apresentadas nestes textos de
apoio às aulas, servem apenas para cumprir algum rigor científico e poderem servir de consulta na
eventualidade de um interesse teórico. Contudo, que fique claro que a postura da cadeira é fazer com que
a Estatística se possa constituir como um instrumento de apoio para a Sociologia.
Carlos Lourenço
ISCTE, 2004
3
Estatística II
Sociologia e Sociologia e Planeamento
2.3. Em que configuração se traduz a sua f.d.p., isto é, qual o seu aspecto gráfico?
f ( x) =
1
2π
µ −σ
µ +σ
x=µ
x
•
A sua f.d.p. define uma linha curva simétrica em relação ao eixo x = µ , a “Curva Normal”:
•
quando x = µ ⇒ f ( x) =
•
os pontos de inflexão da curva correspondem aos pontos em que x = µ ± σ .
1
σ 2π
, (corresponde ao máximo da função);
2.4. O aspecto da curva depende da média
•
µ e do desvio padrão σ
para uma mesma média, o valor do desvio padrão, σ , altera o achatamento da curva
( σ 1 < σ 2 < σ 3 ):
σ1
σ2
σ3
x=µ
Carlos Lourenço
ISCTE, 2004
x
4
Estatística II
Sociologia e Sociologia e Planeamento
•
para um mesmo desvio padrão, o valor da média, µ , move lateralmente a curva ao longo
do eixo dos valores de x ( µ1 < µ 2 < µ 3 ):
µ1
µ2
x
µ3
3. A Distribuição Normal Estandartizada (ou normal-padrão)
Em que ponto estamos? (revisited…)
−
Vimos o cálculo de probabilidades dos acontecimentos através dos conceitos de
probabilidade, de função de probabilidade e dos seus axiomas e teoremas (com a ajuda
preciosa dos Diagramas de Venn…)
−
Com o exemplo muito simples do desempenho de um aluno na cadeira de Estatística, vimos
o cálculo de probabilidades através de variáveis aleatórias, usando os conceitos de função de
probabilidade (simples) e de função de distribuição (acumulada);
−
Mas já temos um modelo probabilístico (distribuição normal)! Então só nos falta saber como
calculamos agora as probabilidades para finalmente cumprirmos o nosso primeiro
objectivo!...
Como vimos anteriormente, se tivermos definida a função densidade de probabilidade, é
possível determinar a probabilidade de a v.a. contínua X assumir um valor pertencente a um
intervalo ]a; b[ , isto é, P[a < X < b ] . Esta probabilidade é dada por uma ÁREA ABAIXO DA
CURVA DEFINIDA PELA f.d.p.4 No entanto, dado que a média e o desvio-padrão podem
tomar uma infinidade não-numerável de valores, também existirá uma infinidade não-numerável
de diferentes distribuições normais.
Ou seja, imaginemos que sabíamos que o tempo de execução de uma tarefa seguia uma
distribuição normal com média igual a 10 minutos e desvio-padrão igual a 5 minutos. Pois bem,
se por exemplo quiséssemos calcular a probabilidade de um operário demorar no máximo 7
minutos, bastaria pegar na expressão teórica da Função de Distribuição e calcular o seu valor
para um x=7. Mas e se agora quiséssemos calcular a probabilidade de um operário demorar no
máximo 8 minutos? Faríamos o mesmo. E se estivéssemos a trabalhar com a idade de
indivíduos e esta seguisse uma distribuição normal, mas desta feita com média igual a 45 anos e
com um desvio-padrão de 7 anos? Seriam outros cálculos completamente diferentes – um
trabalho imenso, portanto…
4
Sugestão: reveja o primeiro conjunto de textos de apoio das aulas para uma melhor compreensão deste
conceito.
Carlos Lourenço
ISCTE, 2004
5
Estatística II
Sociologia e Sociologia e Planeamento
3.1. A Solução Para o Cálculo das Probabilidades
Como aquele processo seria quase impraticável e bastante moroso, o que se faz é trabalhar com
uma distribuição normal-padrão, e através da sua Função de Distribuição determinar os
valores das probabilidades (acumuladas) com a simples consulta de uma tabela estatística.
•
Seja X ~ N (µ ,σ ) com parâmetros E [X ] = µ e Var[X ] = σ 2 ;
•
ao procedermos a uma mudança de origem (subtrair a média) e de escala (divisão pelo
desvio-padrão) de uma qualquer variável X, obtemos a variável estandartizada
X −µ
que tem parâmetros E [Z ] = 0 e Var[Z ] = 1 ;
Z=
σ
•
então Z =
•
⎢−
facilmente se verifica que a sua f.d.p., é dada por: ϕ ( z ) = 1 ⋅ e ⎣
2π
X −µ
σ
~ N (0,1) ;
⎡
•
1 2⎤
(z ) ⎥
2
⎦
;
e a respectiva função de distribuição, Φ (z ) , permite calcular probabilidades em
determinados intervalos: Φ ( z ) = P[Z ≤ z ] . É esta função de distribuição da normalpadrão, Φ (z ) , que está tabelada!
3.2. Consulta da Tabela da Distribuição Normal-Estandartizada
1. Tomamos a 1ª coluna da tabela (à esquerda) e identificamos a linha das unidades e das
décimas do valor de z – fixamos a linha;
2. Se o valor de z não tiver centésimas fixamos de imediato a 2ª coluna;
3. Se o valor de z tiver centésimas, identificamo-las na 1ª linha da tabela (topo) – fixamos
a coluna;
4. O valor da intersecção entre a linha e a coluna identificadas (em 1 e em 2 ou em 3)
corresponde à probabilidade pretendida.
Exemplo:
Se quisermos saber a probabilidade acumulada de z=2,17, ou seja, P[Z ≤ 2,17] = Φ (2,17) :
1. Tomando a 1ª coluna, fixamos a linha onde está 2,1;
2. Tomando o topo da tabela, fixamos a 9ª coluna (onde está 0,07);
3. O valor da probabilidade pretendido é 0,9850.
4. Áreas sob a Curva da Normal
4.1. Um Exemplo (corresponde ao exercício 16)
Os operários de uma fábrica levam, em média, 72 minutos a realizar uma tarefa, no entanto,
existem operários que demoram mais tempo e outros que demoram menos. O desvio médio do
tempo que os operários levam a realizar a referida tarefa em relação à média, é de 12 minutos.
Sabe-se que o tempo de realização desta tarefa é uma variável aleatória que segue uma
distribuição normal. Seja X – “tempo de realização da tarefa”, então X ~ N (72,12) .
Carlos Lourenço
ISCTE, 2004
6
Estatística II
Sociologia e Sociologia e Planeamento
- Qual a percentagem de operários que não leva mais de 80 minutos a realizar a tarefa?
P[X ≤ x ] = P[X ≤ 80] =
80 − µ ⎤
80 − 72 ⎤
8⎤
⎡ X − µ 80 − µ ⎤
⎡
⎡
⎡
= P⎢
≤
⎥ = P ⎢ Z ≤ σ ⎥ = P ⎢ Z ≤ 12 ⎥ = P ⎢ Z ≤ 12 ⎥ = P[Z ≤ 0,67] =
σ
σ
⎣
⎦
⎣
⎦
⎣
⎦
⎣
⎦
= Φ (0,67) = 0,7486(× 100 ) = 74,86%
Graficamente:
A área a cheio
representa os
74,86% de operários
- Qual a probabilidade dos operários levarem mais de 93 minutos a concluir a tarefa?
P [X > x ] = 1 − P [X ≤ x ]
93 − 72 ⎤
⎡
P [ X > 93 ] = 1 − P [ X ≤ 93 ] = 1 − P ⎢ Z ≤
= 1 − P [Z ≤ 1, 75 ] = 1 − Φ (1,75 ) = 1 − 0 ,9599 = 0 ,0401
12 ⎥⎦
⎣
Graficamente:
Carlos Lourenço
ISCTE, 2004
7
Estatística II
Sociologia e Sociologia e Planeamento
- Qual a probabilidade de os operários levarem entre 63 e 78 minutos a concluir a tarefa?
P [63 < X < 78 ] = P [− 0 , 75 ≤ Z ≤ 0 ,5 ] = Φ ( 0 ,5 ) − Φ ( − 0 , 75 ) = Φ ( 0 ,5 ) − [1 − Φ ( 0 , 75 ) ] =
= 0 , 6915 − [1 − 0 , 7734 ] = 0 , 4649
Graficamente:
4.2 Casos Particulares
68% das observações encontram-se numa amplitude definida pela média +/- 1 desvio-padrão
95% das observações encontram-se numa amplitude definida pela média +/- 2 desvios-padrão
Carlos Lourenço
ISCTE, 2004
8
Estatística II
Sociologia e Sociologia e Planeamento
99% das observações encontram-se numa amplitude definida pela média +/- 3 desvios-padrão
Carlos Lourenço
ISCTE, 2004
9
Estatística II
Sociologia e Sociologia e Planeamento
Métodos de Amostragem
1. Introdução
População
A população é um conjunto finito ou infinito (numerável ou não) dos elementos cujas
características são objecto de um estudo.
Exemplos:
- o conjunto de todos os portugueses;
- o conjunto de todos os alunos do ISCTE;
- o conjunto de todos os anos do século XX;
- o conjunto de todos os alunos inscritos em Sociologia e Sociologia e Planeamento
Amostra
A amostra é um subconjunto finito da população.
Sondagem
Estudos que envolvam um processo amostral. É escolhida uma amostra e através dela são
recolhidos e analisados dados que permitirão extrapolar as conclusões para a população em estudo.
Recenseamento
Estudos em que toda a população é inquirida.
Antes do processo de amostragem propriamente dito…
Definir os objectivos: características da população que se pretende estudar; e pesar custos
(orçamento e tempo). Os objectivos condicionam a escolha da população, os métodos de
amostragem e a dimensão da amostra.
2. Fases do Processo de Amostragem
1. Identificação da População Alvo
É crucial definir a população alvo, isto é, qual o conjunto de elementos sobre os quais se
pretende obter informação. A população alvo pode ser constituída por pessoas, famílias,
empresas, instituições, objectos, etc. Nesta altura, torna-se também importante definir qual a
unidade amostral e qual a unidade elementar.
Por exemplo, podemos querer saber qual a opinião dos habitantes do concelho de Lisboa com
18 ou mais anos – população alvo – em relação aos custos de estacionamento na cidade. Para
tal, podemos definir como unidade amostral, os agregados familiares em Lisboa, e como
unidade elementar “o mais recente aniversariante com 18 ou mais anos” no seio do agregado
familiar, o qual nos concederá a informação pretendida. O conjunto das unidades elementares é
também denominado de população a inquirir.
Mas como seleccionamos a amostra? É inevitável deter uma base de sondagem. A base de
sondagem é uma listagem de (virtualmente) todos os elementos da população e através da qual
serão seleccionados os elementos da amostra. Para o exemplo anterior, a base de sondagem seria
a lista de todos os habitantes do concelho de Lisboa com 18 ou mais anos.
2. O Método de Selecção da Amostra
3. A Dimensão da Amostra
Carlos Lourenço
ISCTE, 2004
10
Estatística II
Sociologia e Sociologia e Planeamento
2.1. O Método de Selecção da Amostra
A escolha do método de selecção da amostra assenta essencialmente na discussão entre a
representatividade e a aleatoriedade dessa mesma amostra. Neste contexto, bastará afirmar que o
ideal seria obter sempre amostras aleatórias e representativas. Desejamos obter amostras aleatórias
por exigências na aplicação da Estatística, enquanto que as amostras representativas são,
naturalmente, aquelas que espelham as características mais importantes da população em estudo.
No entanto, devido às restrições de custos, de tempo e até da impossibilidade de deter bases de
sondagem completas e livres de erros, devemos, tanto quanto possível, constituir uma amostra
representativa, mesmo que esta não seja verdadeiramente aleatória.
2.1.1. Amostra aleatória ou probabilística
•
•
•
•
•
•
todo e qualquer elemento tem probabilidade de ser escolhido para a amostra (e é possível
calcular essa probabilidade);
aleatória, mas não “ao acaso” (exemplo dos entrevistadores no Rossio);
imprescindível dispor de uma base de sondagem;
matematicamente, pode-se calcular a dimensão que a amostra deverá ter para uma
determinada precisão e grau de confiança pretendidos;
dificuldade em dispor de uma base de sondagem “perfeita”: dispersão geográfica,
dificuldade de contacto com os respondentes, custos, etc.
principais tipos de amostras aleatórias:
•
•
•
•
•
•
SIMPLES
SISTEMÁTICA
ESTRATIFICADA
POR CLUSTERS
MULTI-ETAPAS
MULTI-FASES
2.1.1.1. Amostra Aleatória Simples
•
•
•
•
todos os elementos têm a mesma probabilidade de serem seleccionados;
numerar os elementos da população de 1 a N;
escolher n elementos através de um procedimento aleatório (lotaria, consulta de tabelas de
números aleatórios, geração informática de números aleatórios);
empresas cotadas em Bolsa vs. residentes em Faro maiores de 18 anos (custos diferentes…)
2.1.1.2. Amostra Aleatória Estratificada
•
•
•
•
5
6
definição de estratos da população de modo a que a variabildade entre5 os estratos seja
máxima e a variabilidade dentro6 de cada estrato seja mínima; o que se pretende é agrupar
os elementos mais homogéneos entre si segundo determinadas características;
a definição de L estratos da população (L “populações”) pode ser feita através de estudos
anteriores, de opiniões de especialistas, etc. Podem ser baseados na idade, sexo, categoria
socio-económica, regiões, etc.
para que seja aleatória, são necessárias tantas bases de sondagem quantos os estratos;
a selecção dos elementos pode fazer-se por um processo aleatório simples ou sistemático;
para uma familiarização com os termos, do inglês “between”
do inglês “within”
Carlos Lourenço
ISCTE, 2004
11
Estatística II
Sociologia e Sociologia e Planeamento
Um exemplo simples:
Se a população “alunos do ISCTE” for constituída por 50% de alunos de Ciências Sociais, 35%
de alunos de Ciências Empresariais, 10% de alunos de Ciências da Computação e 5% de alunos
de Arquitectura, a selecção de alunos por um processo aleatório só por mero acaso reflectirá esta
estrutura.
Se for importante que a amostra espelhe aquela estrutura, dever-se-ia recolher uma amostra
estratificada. O mais fácil seria pedir na Secretaria as 4 listagens completas daqueles 4 grupos, e
depois, aí sim, seleccionar aleatoriamente os elementos para a amostra de modo a atingir as
percentagens desejadas.
Estratificação proporcional: proporção de elementos da amostra que possui determinadas
características é igual à proporção de elementos da população que possui essas mesmas
características.
Estratificação não-proporcional (ou de Neyman): quanto maior for a variabilidade num estrato
da população, ou em estratos de dimensão reduzida, mais importante se torna que a amostra
represente essa situação. (“ a importância de representar os extremos”)
No exemplo anterior, consoante os objectivos do estudo, talvez fosse aconselhável incluir mais
alguns estudantes de Arquitectura, ou mais estudantes das Ciências Sociais dada a diversidade
de cursos que se incluem nesse agrupamento.
2.1.1.3. Amostra Aleatória Por Clusters
Ex.: Escolha aleatória dos clusters ou unidades amostrais primárias (turmas; centros de
saúde) e inclusão na amostra de todos os elementos pertencentes aos clusters ou unidades
elementares (alunos; utentes) para conhecer a opinião (educação sexual; tempo de espera)
2.1.2. Amostra não-aleatória ou não-probabilística
•
•
•
•
•
a probabilidade de cada elemento da população pertencer à amostra não é determinável; há
unidades do universo que não têm a possibilidade de ser escolhidas
critérios subjectivos
impossível avaliar a representatividade e a credibilidade dos resultados
não se sabe com que grau de confiança as conclusões são generalizáveis à população;
principais tipos de amostras não-aleatórias:
•
•
•
•
•
INTENCIONAL (“o investigador é que escolhe”)
SNOWBALL (“o investigador pede sucessivamente nomes para inquirir”)
CONVENIÊNCIA (“pode ser útil no pré-teste”; “para captar ideias gerais”)
QUOTAS
RANDOM ROUTE (“itinerários aleatórios: seleccção dos respondentes no porta-aporta”)
Carlos Lourenço
ISCTE, 2004
12
Estatística II
Sociologia e Sociologia e Planeamento
2.1.2.1. Amostra Não-aleatória Por Quotas
•
É, grosso modo, uma amostra estratificada não-aleatória
•
pressupõe que as variáveis de controlo que definem as quotas justificam a variação
sistemática na população em relação à característica em estudo
•
a proporção de elementos da amostra que possui determinada característica é
APROXIMADAMENTE igual à proporção de elementos da população que possui essa
mesma característica.
•
ex.: na população 250 indivíduos em 1000, são homens (25%). Então, para uma amostra de
100, deveremos seleccionar 25 homens (25%).
•
Processo:
a. definir as quotas das variáveis (sexo; idade e sexo; idade, sexo e região; etc)
b. seleccionar os elementos (os elementos a incluir na amostra não são
previamente determinados como nas amostras aleatórias; os entrevistadores têm
apenas de respeitar as quotas);
Quotas independentes: não asseguram a representatividade (ex: 19 indivíduos dos 15-24 anos
podiam ser todos do mesmo sexo);
Quotas inter-relacionadas (exemplo):
Idade
15-24
25-34
35-44
45-64
15-24
25-34
35-44
45-64
TOTAL
Classe
Social AB
2
3
5
3
3
3
4
3
26
Classe
Social C
3
3
6
3
3
3
6
3
30
Classe
Social D
4
5
7
4
4
5
9
6
44
TOTAL
Sexo
9
11
18
10
10
11
19
12
100
Homens
(48)
Mulheres
(52)
100
Algumas Vantagens e Desvantagens da Amostra Por Quotas
•
Não há necessidade de contactar mais que uma vez o potencial inquirido; se não estiver
disponível, ele é substituído;
•
Rapidez, economia, fácil aplicação;
•
Grande erro por parte dos entrevistadores;
•
Variáveis e quotas podem ter sido mal escolhidas;
Carlos Lourenço
ISCTE, 2004
13
Estatística II
Sociologia e Sociologia e Planeamento
Métodos de Amostragem Aleatórios
Simples
Necessidade de uma
base de sondagem
completa
Possibilidade de
calcular o erro
amostral
Nível de eficiência
estatística
Custo
Frequência de
utilização
Sistemática
Estratificada
Por Clusters
Para seleccionar os
clusters
Sim
Sim
Variável
Moderadamente
Baixa
Elevado
Moderado
Elevada se as
variáveis de
estratificação
funcionarem bem
Elevado
Baixa
Moderada
Moderada
Baixa
Moderado/Elevado
Elevada
Métodos de Amostragem Não-Aleatórios
Conveniência
Necessidade de uma
base de sondagem
completa
Possibilidade de
calcular o erro
amostral
Nível de eficiência
estatística
Custo
Frequência de
utilização
Intencional
Snowball
Não
Por Quotas
Sim
Sim
Sem possibilidade de se medir
Muito Baixo
Baixo
Baixo
Moderado
Muito Elevada
Moderada
Moderada
Muito Elevada
2.2. A Dimensão da Amostra
•
Pesar dois efeitos opostos:
o Precisão (diferença entre o valor da estimativa e o valor do parâmetro) – aumenta
com o aumento da dimensão da amostra;
o Nível de confiança (grau de incerteza/risco em que se incorre ao definir a precisão)
•
Variância da característica em estudo (se todos fossem iguais bastava inquirir um!...); em geral,
quanto maior a variabilidade, maior deve ser a dimensão;
•
A determinação matemática da dimensão da amostra, n, depende do limite de erro amostral
pretendido, isto é, da precisão (e do seu nível de confiança associado);
Nota: não é possível eliminar o erro amostral, mas apenas controlá-lo;
Carlos Lourenço
ISCTE, 2004
14
Estatística II
Sociologia e Sociologia e Planeamento
3. Amostras Independentes e Amostras Emparelhadas
Duas (ou mais) amostras dizem-se independentes se os indivíduos das várias amostras são
seleccionados de forma independente, ou seja, se estes não estão (propositadamente ou não)
relacionados entre si.
Duas (ou mais) amostras dizem-se emparelhadas se os indivíduos das várias amostras estão de
alguma forma relacionados entre si. Os exemplos mais comuns são as investigações com grupos
experimentais: comportamento dos doentes depressivos antes e depois de sujeitos ao tratamento
com um novo anti-depressivo; trajectórias de integração de reclusos, em que se constitui uma
amostra com reclusos toxicodependentes e uma amostra com reclusos que não consomem
drogas; avaliação de agregados familiares em momentos temporais distintos; etc.
Carlos Lourenço
ISCTE, 2004
15
Download

Distribuição Normal e Teoria da Amostragem