ESTATÍSTICA
Professora : Adriane Guarienti
Introdução
Por causa da enxurrada de dados
coletados, referentes a todas as
particularidades de negócios, o uso de
técnicas estatísticas tornou-se uma
ferramenta indispensável, hoje em dia.
“Uma amostragem representativa conseguirá a
melhor descrição possível de uma população,
apesar de se pesquisar apenas parte dela.
Contudo, ela depende da possibilidade de um
referencial de amostragem, de uma lista ou
combinação de listas dos membros de uma
população, ou do conhecimento de distribuição
de características essenciais na população.
Sem listas ou distribuições conhecidas, o
trabalho não pode ser executado.” (BAUER e
AARTS, 2002, p. 42)
Utilizamos estatísticas para levantar tais informações e
em cada uma dessas situações você precisa analisar dados
quantitativos à luz dos objetivos e tomar decisões com base
nesses dados. Daí a necessidade de se entender estatística e
a capacidade de empregar as suas várias ferramentas com
eficiência para competir em um mercado que depende muito
do uso adequado destas ferramentas.
A luz do nosso objetivo, definimos a ESTATÍSTICA como o
estudo da coleta, do processamento e análise de dados para
facilitar a tomada de decisões em uma área de incerteza.
A Estatística é um método científico de obter as informações
relativas a uma variável, apurar os seus resultados, apresentálos de maneira clara e inteligente, interpretar tais resultados
para conhecê-los em sua intimidade, tirar conclusões e definir
as suas tendências.
Estatística Descritiva: Esta fase se fundamenta
na organização, descrição, análise e
interpretação dos dados, sem aquela
preocupação de fazer generalizações ou tirar
conclusões para o conjunto de onde foram
retirados tais dados.
Estatística Inferencial: Esta é a fase dos estudos
amostrais que visam avaliar o comportamento
de uma população por meio de suas amostras.
Pode-se prever o comportamento de um
fenômeno com base nos resultados de uma
amostra.
Por onde começar, quando se tem um
problema estatístico?
Essa é uma pergunta um tanto capciosa,
porque você não tem um problema de
estatística – o que você tem é um problema
comercial, um problema de negócios onde o
lucro ou prejuízo estão latentes e dependem da
sua decisão. E para minimizar as incertezas,
seja realista, o quê fazer? Você provavelmente
jamais vai eliminar a incerteza, mas você pode
minimizar o risco de tomar uma decisão errada,
que pode custar-lhe caro, se tiver informações
sobre os fatos.
População ou Universo
A população ou universo é o conjunto de
objetos, pessoas, coisas ou itens que
apresentam certa característica não se
limitando, apenas às pessoas, mas a
todas variáveis, com características próprias.
População Finita: é aquela que se consegue enumerar
todos os elementos que a formam. Refere-se a um universo
limitado em uma dada unidade de tempo. Exemplificando podese dizer que a quantidade de automóveis produzidos por uma
fábrica em um mês, a população de uma cidade e o número de
alunos de uma sala de aula são exemplos de uma população
finita.
População Infinita: é aquela cujos elementos não podem
ser contados. Refere-se a um universo não delimitado. Os
resultados (cara ou coroa) obtidos em sucessivos lances de uma
moeda, o conjunto dos números inteiros, reais ou naturais são
exemplos de populações infinitas.
RAMOS DA ESTATÍSTICA
A estatística dedutiva (também conhecida
como Estatística Descritiva) se encarrega de
descrever o conjunto de dado desde a
elaboração da pesquisa até o cálculo de
determinada medida.
A estatística indutiva (ou Estatística Inferencial)
está relacionada a incerteza. Inicia-se no cálculo
das Probabilidades e se desenvolve por todo a
área da inferência.
Inferência Estatística
Através da parte fazer inferência
sobre o todo!!
Subconjunto
Inferência estatística é o processo pelo qual estatísticos tiram
conclusões acerca da população usando informação de uma
amostra.
ESTATÍSTICA DESCRITIVA
- Variáveis
- População e Amostra
- Técnicas de Amostragem
- Séries Estatísticas
- Gráficos Estatísticos
- Distribuição de Freqüências
Variáveis Aleatórias
Pode-se dizer que uma variável aleatória é o
conjunto de todos os resultados possíveis
de um fenômeno aleatório. Variável aleatória
é uma variável que depende do resultado de
um fenômeno aleatório. A medição dos
atributos quantitativos e qualitativos gera
valores que são chamados de variáveis.
Estas variáveis assumem como o próprio
nome indica uma gama de valores.
As variáveis podem ser, quanto à natureza,
qualitativas e quantitativas.
Variáveis Aleatórias
As variáveis qualitativas se classificam em nominal
e ordinal. As variáveis nominais são sexo, raça,
religião, estado civil, etc. As variáveis ordinais
representam uma certa ordem natural entre as
categorias: nível salarial, classe social, grau de
instrução, o professor é regular, bom ou ótimo, o
curso é regular, bom ou ótimo, qualquer hierarquia
social etc. As variáveis quantitativas se classificam
em discretas ou contínuas e quanto às causas e
efeitos dependentes e independentes.
As variáveis dependentes são aquelas cujos efeitos
são esperados de acordo com as causas. Elas se
situam, habitualmente, no fim do processo causal e
as variáveis independentes são aquelas cujos
efeitos queremos medir.
Variável Aleatória Discreta
É aquela que pode assumir apenas um conjunto
limitado de valores em qualquer escala de medida e,
em geral inteiros, sendo obtida mediante alguma
forma de contagem. É uma variável cujos valores
podem ser todos relacionados. Uma variável é
discreta quando assume alguns valores dentro de
certo intervalo. O número de funcionários de uma
empresa, o número de filhos de um casal, o
resultado de um sorteio, o número de habitantes de
uma cidade, o número de alunos de uma sala são
exemplos de variável discreta.
Variável Aleatória Contínua
É aquela que pode assumir qualquer valor numa escala
de valores e resulta freqüentemente de uma medição,
sendo usada em geral, em alguma forma de medida, e se
trata geralmente de valor aproximado. As medidas de
comprimento, peso, altura, volume, etc., são exemplos
típicos de variável contínua.
Pode-se dizer, ainda que a variável aleatória contínua
possa tomar qualquer valor real em um dado intervalo, sendo
caracterizada por uma função de densidade tal que a área
sob a curva e limitada pelo eixo dos x e entre dois números
representa a probabilidade de a variável aleatória estar entre
eles. Por outro lado, todas as vezes que construirmos uma
distribuição de freqüências e os gráficos que a representam,
teoricamente, identificam-se como uma variável contínua.
MÉTODO ESTATÍSTICO
MÉTODO: conjunto de meios dispostos convenientemente para
se chegar a um fim que se deseja.
1.MÉTODO EXPERIMENTAL: consiste em manter constantes
todas as causas (fatores), menos uma, e variar esta causa de
modo que o pesquisador possa descobrir seus efeitos, caso
existam.
2.MÉTODO ESTATÍSTICO: diante da impossibilidade de manter
as causas constantes, admite todas essas causas presentes
variando-as, registrando essas variações e procurando
determinar, no resultado final, que influências cabem a cada
uma delas.
ESTATÍSTICA
Def.: é a parte da matemática aplicada
que fornece métodos para a coleta,
organização,
descrição,
análise
e
interpretação de dados e para a utilização
dos mesmos na tomada de decisões.
FASES DO MÉTODO ESTATÍSTICO
Coleta de dados: pode ser direta ou indireta.
a) Direta: quando feita sobre elementos informativos de
registro obrigatório ou coletados pelo próprio pesquisador.
Essa coleta pode ser contínua, periódica ou ocasional.
b) Indireta: quando é feita com base em elementos já
pesquisados (revista, jornal, livros, etc.)
2- Crítica dos dados: nesta fase os dados são
contados e recontados, em busca de
possíveis falhas (omissões, repetições, etc),
sendo:
a) Externa: informante
b) Interna: pesquisador
3- Apuração dos dados: é a soma e o
processamento dos dados obtidos. Pode ser
manual, eletromecânica ou eletrônica.
4 – Apresentação dos dados: os dados
devem ser apresentados sob a forma de
tabelas e gráficos.
5 – Análise dos resultados: o objetivo último
da Estatística é tirar conclusões sobre o
todo a partir de informações fornecidas por
uma parte deste representativa, através de
técnicas apropriadas
11111111111111111111111 11111111111111111111111111111111111111111111111111111111111111
1111111111111111111111
11111111111111111111111 11111111111111111111111111111111111111111111111111111111111111
1111111111111111111111
11111111111111111111111 11111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
1111111111111111111111
11111111111111111111111
11111111111111111111
11111111111111111111111
11111111111111111111111
1
1111111111111111111111111111111111111111111111111111111111111111
VARIÁVEL: é, convencionalmente, o conjunto
de resultados possíveis de um fenômeno.
1.Qualitativa:
1.1 – Nominal: quando seus valores são expressos
por atributos. Ex.: cor dos olhos, da pele, do cabelo,
religião, sexo, tipo de condução, curso de graduação,
nacionalidade, naturalidade, etc.
1.2 – Ordinal: quando, apesar de não poder ser
medida, a variável segue uma ordem. Ex.:
escolaridade, patente militar, cargos dentro de uma
empresa, hierarquia no serviço público civil, etc.
2.Quantitativa: quando as variáveis são
expressas em números, e podem ser:
2.1 –Discretas: resultam de um conjunto
enumerável de valores (aceita apenas números
inteiros).
Ex.:
quantidade
de
carros
no
estacionamento, número de filhos de um casal,
quantidade de cursos de uma faculdade, etc.
2.2 – Contínuas: quando uma variável pode assumir
qualquer valor entre dois limites (valores inteiros e
decimais). Ex.: faixa etária, horas, faixa salarial,
comprimento, temperatura, peso, altura, etc.
POPULAÇÃO, AMOSTRA e AMOSTRAGEM
• POPULAÇÃO: É um conjunto de indivíduos ou objetos
que apresentam pelo menos uma característica em
comum.
• AMOSTRA: Considerando a impossibilidade, na maioria
das vezes do tratamento de todos os elementos da
população, necessitaremos de uma parte representativa
da mesma. A esta porção da população chamaremos de
amostra.
• Chamaremos de um subconjunto de indivíduos extraídos
de uma população.
• AMOSTRAGEM: é uma técnica especial para recolher
amostras que garante, tanto quanto possível, o acaso na
escolha, de modo a garantir à amostra o caráter de
representatividade.
Amostragem x Amostra
Amostragem é uma ferramenta que permite a você
analisar um subconjunto de uma população, objetivando
levantar informações sobre os fatos relativos a esse
subconjunto, com a intenção de inferir o comportamento da
população.
A amostra é um número limitado de informações tirado
de um conjunto da mesma natureza, denominado
população. Amostra é uma parte de uma população e
deverá reunir as suas características básicas.
A importância de uma amostra está na avaliação de
grandezas desconhecidas desta população e a qualidade
desta avaliação depende basicamente da
representatividade desta amostra de alcançar a
capacidade de reproduzir as características básicas da sua
população.
Amostra
Uma amostra é considerada parte representativa da
população se ela tiver a propriedade de absorver todas as
características da população e se as características da população
estiverem nela contidas, as conclusões a respeito desta amostra
podem ser consideradas como conclusões da respectiva
população.
A medida que o tamanho de uma amostra for crescendo, as
informações relativas à amostra vão se tornando cada vez mais
verdadeiras. Diversos fatores justificam os trabalhos com
amostras, no lugar de estudar a respectiva população, entre os
quais, destacam-se:
• Custo: as despesas com a operacionalização estatística da
população são geralmente bem maiores que com a averiguação
de uma amostra.
• Velocidade: as pesquisas realizadas com amostras são mais
rápidas, em virtude de conter um menor número de unidades.
• Praticabilidade: conforme o próprio conceito, às vezes, a
dimensão da população torna as pesquisas impraticáveis.
Método Estatístico
O método estatístico reúne as técnicas básicas de
observação dos fenômenos coletivos, bem como a
quantificação e a qualificação de suas características.
Estas técnicas ensinam-nos como colher dados
numéricos, sintetizá-los e exprimi-los de maneira
simples e descrever e interpretar os acontecimentos,
fazendo previsões e conclusões.
As técnicas a seguir são fundamentais para um
trabalho de alto nível, pois o talento só virá com o
conhecimento, com a dedicação, com a persistência e
com muita luta e o sucesso baterá em sua porta se você
for o melhor entre os melhores. E para que este êxito
chegue o mais rápido possível, use em cada projeto,
trabalho, pesquisa, os conhecimentos que sintetizamos
a seguir.
Quem determina a
amostra a ser estudada?
Projeto de Pesquisa:
amostra
• Qual a relação entre a pergunta
da pesquisa e a amostra?
• Quem determina a amostra a ser
estudada?
• Quais são os componentes necessários
para determinar a amostra?
• Quais são as técnicas de amostragem?
• Por que é importante a amostragem na
aplicabilidade do estudo?
Divisões do Projeto
1.
Informações
Gerais
2.
Projeto de
Pesquisa
3.
Documentação
Complementar
1- Estudo do fenômeno
Planejamento
O planejamento operacional da pesquisa consiste em prever as ações
que deverão ser efetuadas para aplicar a estratégia da pesquisa
escolhida. Estas ações dizem respeito à seleção da população a ser
estudada, à definição das variáveis e à coleta de dados, assim como à
análise dos dados recolhidos.
O planejamento é o processo de estabelecer os objetivos e as linhas de
ação adequadas para alcançá-los. Os objetivos são importantes por
que proporcionam senso de direção, focalizam os esforços, guiam os
planos e as decisões e ajudam a avaliar o progresso de sua pesquisa:
O que queremos? Formulação de objetivos.
O que fazer? Linhas de ação adequadas para alcançar os nossos
objetivos.
Como fazer? Os meios necessários para atingir os objetivos.
Quais as características do fenômeno que interessam à pesquisa?
Visão sistêmica do fenômeno. Análise ambiental. Fase do diagnóstico.
O que somos capazes de fazer? Fase da identificação das
variáveis da pesquisa.
O que fazer para obter o que queremos?
2- Coleta de dados
A coleta de dados é a busca das informações
necessárias à pesquisa. É a fase operacional da
pesquisa. Momento de levantar as informações
necessárias para a pesquisa. A qualidade de um
instrumento de medida se aprecia pela sua
fidelidade ou confiabilidade e pela sua validade. A
confiabilidade é a capacidade de um instrumento
medir fielmente um fenômeno.
A validade é capacidade de um instrumento medir
com precisão o fenômeno a ser estudado e a
confiabilidade de um instrumento de pesquisa é sua
capacidade de reproduzir um resultado de forma
consistente no tempo e no espaço. Existem três
fontes de coleta de dados: utilização de
documentos, a observação pelo pesquisador e a
informação fornecida pelas pessoas.
2.9. Responsabilidades
do pesquisador, da instituição
2.8. Propriedades da informação do promotor e
do patrocinador
e divulgação da pesquisa
3.
Documentação
Complementar
2.7. Análise dos riscos e dos benefícios
2.6. Monitorização da pesquisa
2.5. Orçamento
2.4. Relação de materiais
2.3. Etapas da pesquisa
e Cronograma
2.2. Plano de trabalho e métodos
2.1. Razões e Objetivos
da Pesquisa
2.
Projeto de
Pesquisa
2.3. Etapas da Pesquisa e
Cronograma
2.2.6. Método estatístico
2.2.5. Variáveis
2.2.4. Procedimentos
2.2.3. Amostra
III.
Documentação
Complementar
2.2.2. Local
2.2.1. Tipo de Estudo
- Comitê de Ética em
Pesquisa
A. Razões e Objetivos
1.
Informações
Gerais
2.2
Plano de
Trabalho
e Métodos
3- Sumarização do fenômeno
É a fase da organização das informações
coletadas e a da apresentação do fenômeno
em estudo, por meio de tabelas e gráficos.
As tabelas organizam as informações
coletadas e apresentam de maneira sintética
o fato estudado e os gráficos nos dão uma
visão do problema e suas tendências. É a
parte síntese e bela do trabalho estatístico. A
sumarização é a apresentação tabular e
gráfica do problema levantado, com suas
variáveis, pontos críticos, tendências e
flutuações. É a visão clara dos fatos.
3.6. Curriculum vitae
Lattes dos pesquisadores
envolvidos
3.5. Modelo da tabela de
dados individuais
3.4. Cópia do documento de
aprovação pelo comitê de
hética e pesquisa
3.3. Modelo dos
formulários de coleta
dedo
dados
3.2. Modelo
termo de
consentimento livre e
esclarecido
3.1. Referências
2.
Projeto de
Pesquisa
3.
Documentação
Complementar
Qual a relação entre pergunta
da pesquisa e a amostra?
4- Descrição numérica do fenômeno
É a fase da realização de cálculos
que darão o suporte necessário para a
interpretação dos dados. Uma análise
coerente e uma conclusão
sedimentada, em primeiro momento,
com base em dados concretos e em
segundo, com base nas flutuações e
perspectivas do mercado definem as
metas a serem alcançadas, no próximo
passo.
5- Análise e Previsão
Obtida a descrição numérica do fato
observado, do fenômeno em estudo, do
problema em análise, inicia-se a última etapa
do processo, visando definir o perfil do
problema estudado, suas variações e
tendências. Nesta última etapa, o relatório
final, a análise descritiva e inferencial,
indicando os pontos críticos e as flutuações
da variável e as conclusões fundamentadas
nas tendências de mercado e nas
perspectivas da economia serão fatores para
uma tomada de decisão com inteligência e
cautela.
Diferenças entre os indivíduos
incluídos e os estudados
Doentes estudados
Potencial
Benefício
Doentes que não participam
Não foi convidado a participar
Centros/Médicos que não participam
Inelegíveis
Intervenção A
Intervenção B
McKee M, Britton A, Black N, McPherson K, Sanderson C, Bain C. Methods in health services
research. Interpreting the evidence: choosing between randomised and non-randomised studies.
BMJ. 1999 Jul 31;319(7205):312-5.
Quais são os itens necessários
para determinar a amostra?
•
•
•
•
Critério de inclusão
Critério de exclusão
Amostragem
Consentimento livre e esclarecido
Amostra
Critério de inclusão
Critério de exclusão 1
Critério de exclusão 2
Critério de exclusão 3
Critério de exclusão 4
Amostra
População
n = 1000
Elegíveis
n = 600
Incluídos
n = 400
Final
n = 380
Quem excluir?
(Critérios de exclusão)
Amostra por conveniência
Amostra sistemática
Probabilística
Amostra por cotas
Amostra por conglomerado
Amostra Estratificada
Amostra Sistemática
Amostra Casual Simples
Amostragem
Amostra
Não-probabilística
Por que é importante a amostragem na
aplicabilidade do estudo?
População
Amostragem
randomizada
Alocação
randomizada
Amostra
1,000,000
1,000
500
R
N
D
500
Extrapolação
Todos os sujeitos têm probabilidade igual na seleção.
Lavado EL, Castro AA. Projeto de pesquisa (parte V – amostra)
Tratamento
População estudada
n = 50.000
Randomização:
Distribuir os indivíduos
aleatoriamente.
Amostragem
Randômica Seleção de
um grupo aleatório.
Amostra
n = 2.000
Critério de exclusão 1
n = 50
Critério de exclusão 2
n = 100
Critério de exclusão 3
n = 250
Não deu o consentimento
n = 200
Randomizados
n = 1.400
Amostra
n = 700
Exclusões
n = 15
Final do estudo
n = 675
Amostra
n = 700
Perdas
n = 10
Perdas
n = 20
Exclusões
n = 30
Final do estudo
n = 650
O aluno bem sucedido:
Entender qual a relação entre a pergunta
clínica e a amostra;
Saber quem determina a amostra a ser
estudada;
Entender quais são os componentes
necessários para determinar a amostra;
Conhecer quais são as técnicas de
amostragem;
Entender porque é importante a
amostragem na aplicabilidade do estudo.
Seleção de Amostras
Amostras Probabilísticas servirão como base
para a correta estimação dos parâmetros da
população a qual se referem.
Tipos de Amostras Probabilísticas
• Amostra Aleatória Simples
• Amostra Aleatória Sistemática
• Amostra Aleatória Estratificada
Seleção de Amostras
Tipos de Amostras Probabilísticas
Amostra Aleatória Simples
Cada elemento da População é selecionado de
maneira aleatória.
Exemplo:
Pesquisa em uma empresa com 5000
empregados, deseja-se selecionar uma amostra
de 100 pessoas
Casual ou Aleatória Simples: equivalente a um
sorteio, é utilizada quando a população encontra-se
desordenada, sendo que por essa técnica, qualquer
elemento tem a mesma chance de ser sorteado.
-Quando a população é relativamente pequena (até
30, por exemplo), pode-se numerar os elementos e
em seguida, realizar o sorteio.
- Tratando-se de uma quantidade grande, o processo
de numeração torna-se trabalhoso. Para tanto, utilizase a TABELA DE NÚMEROS ALEÁTORIOS (TNA).
-A leitura dessa tabela é feita, após escolhido o ponto
de início, da esquerda para a direita e vice-versa, de
cima para baixo e vice versa, na diagonal, etc. A
opção deve ser feita antes de iniciado o processo.
111111111111111111111111111111111111111111111111111111111111111111111
11111111111111111
1111111111111111111111111111111111111111111111111111100
11111111111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111111111111111
11111111111
11111
11111111111
111
Ex.: Suponhamos que uma amostra deverá ter 12
elementos de uma população total de 90 indivíduos,
e que se tenha escolhido começar na primeira linha
da Tabela de Números Aleatórios (TNA), partindo da
esquerda para a direita. O primeiro número escolhido
seria 67, o segundo 72, e a seqüência seria:
67 - 72 - 00 - 39 - 84 - 84 - 41 - 79 - 67 - 71 - 40 - 21 – 13
Destes números sorteados seriam utilizados os 12 primeiros:
57 - 72 - 39 - 84 - 41 - 79 - 67 - 71 - 40 - 21 - 13 – 56
Se o procedimento escolhido fosse da direita para esquerda, os
elementos utilizados:
83 - 54 - 74 - 68 - 29 - 08 - 86 - 49 - 56 - 13 - 21 - 40
2. SISTEMÁTICA - novamente é feito o sorteio,
sendo que nessa amostragem os elementos da
população já se encontram ordenados e, nesses
casos, não é necessário se construir um sistema
de referência (TNA).
Exemplos de populações ordenadas: fichas
individuais de empregados (alfabética), casas de
uma rua (número), notas fiscais (data), etc.
Ex.: Suponhamos que uma empresa tenha 720
colaboradores em determinado setor, dentre os
quais deseja-se uma amostra formada por 30
destes empregados
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111
11
111111111111111111111111111111111111111111111111111
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111
Seleção de Amostras
Tipos de Amostras Probabilísticas
Amostra Aleatória Sistemática
O primeiro elemento da População é selecionado de
maneira aleatória os demais de acordo com alguma
lei de formação.
Exemplo:
Empresa com 5000 empregados, deseja-se selecionar
uma amostra de 100 pessoas. Ordena-se
os empregados, o primeiro é selecionado e os outros
serão escolhidos somando 15 a ordenação.
Seleção de Amostras
Tipos de Amostras Probabilísticas
A população é dividida em estratos com
mesmas características.São selecionados os
elementos da amostra de maneira aleatória e os
parâmetros resultantes serão agregados de
forma proporcional
Amostra Aleatória Estratificada
Exemplo:
• Pesquisa Eleitoral
Experimento Aleatório
Os experimentos aleatórios são aqueles cujos
resultados não são sempre os mesmos, apesar de
se repetirem, várias vezes, em condições
semelhantes. Estes experimentos são aqueles que
apresentam resultados imprevisíveis. O
lançamento de moedas e dados, bem como
sorteios e extrações lotéricas são fenômenos
aleatórios. Alguns experimentos aleatórios
poderão ser repetidos sob as mesmas condições
indefinidamente.
Amostragem Aleatória
É uma técnica que visa selecionar os integrantes
de uma amostra de tal forma que cada elemento de
uma população tem a mesma probabilidade de ser
incluído na amostra.
Existem dois tipos de amostras, as
probabilísticas, baseadas nas leis de
probabilidades, e as amostras não probabilísticas,
que tentam reproduzir o mais fielmente possível a
população alvo. Entretanto, somente as amostras
probabilísticas podem, por definição, originar uma
generalização estatística, apoiada no cálculo de
probabilidades e permitir a utilização da potente
ferramenta que é a inferência estatística.
ESTRATIFICADA PROPORCIONAL: utilizada quando a
população encontra-se dividida em estratos (ou
camadas, faixas, intervalos, etc).
Exemplos de populações divididas em estratos:
-sexo (homem e mulher);
- idade (criança, adolescente, adulto e idoso);
-setores de uma empresa (administração, vendas,
tesouraria, serviços gerais, etc).
-Cursos
de
uma
faculdade
(C.
Contábeis,
administração, Direito, Enfermagem, etc);
-Faixa salarial (até 1 SM, de 1 a 2 SM, de 2 a 4 SM,
acima de 4 salários-mínimos).
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111
11
111111111111111111111111111111111111111111111111111
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
11
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111
Estimação
“Procedimento estatístico que permitirá a
determinação de características
populacionais com base em dados coletados
em amostras.”
Exemplo:
• 1. Pesquisas eleitorais
• 2. Procedimentos de Controle de Qualidade
• 3. Pesquisas do IBGE.
Estimação
Estimador e Estimativa
• Estimador: Função matemática que terá a
finalidade de avaliar determinada característica
populacional
Exemplo: média, desvio-padrão etc.
• Estimativa: Valor que essa função poderá
assumir.
Seleção de Amostras
O primeiro passo para fazer inferências
corretas utilizando amostragem, é fazer
o levantamento dessas amostras de
maneira adequada.
Seleção de Amostras
Tipos de Amostras
• Amostras Probabilísticas
Cada item da amostra tem a mesma chance de ser
selecionado que os demais.
• Amostras Não – Probabilísticas
Cada item selecionado não possui a mesma chance de
ser selecionado que os demais.
Não há dúvida de que uma amostra não
representa perfeitamente uma população.
Ou seja, a utilização de uma amostra implica
na aceitação de uma margem de erro que
denominaremos ERRO AMOSTRAL.
Erro Amostral é a diferença entre um resultado
amostral e o verdadeiro resultado populacional; tais
erros resultam de flutuações amostrais aleatórias
Ocorrem erros não-amostrais quando:
· Os dados amostrais são coletados,
registrados ou analisados incorretamente.
· Há uma utilização de um instrumento
defeituoso
durante
a
realização
de
mensurações.
· Um questionário ou formulário possui
questões formuladas de modo tendencioso
[Triola, 1999].
Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém
podemos limitar seu valor através da escolha de uma amostra
de tamanho adequado.
Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA
seguem sentidos contrários (Figura 1). Quanto maior o tamanho
da amostra, menor o erro cometido e vice-versa.
TAMANHO DA AMOSTRA
+
ERRO AMOSTRAL
Figura 1 – Relação intuitiva entre o tamanho da amostra e o erro amostral.
DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA
COM BASE NA ESTIMATIVA DA MÉDIA
POPULACIONAL
Suponha, por exemplo, que queiramos estimar
a renda média de pessoas que concluíram um
curso superior, no primeiro ano após a
formatura. QUANTAS rendas devemos incluir
em nossa amostra? A determinação do
tamanho de uma amostra é problema de grande
importância, porque:
·amostras
desnecessariamente
grandes
acarretam desperdício de tempo e de dinheiro;
·e amostras excessivamente pequenas podem
levar a resultados não confiáveis.
Em muitos casos é possível determinar o
tamanho mínimo de uma amostra para
estimar um parâmetro estatístico, como por
exemplo, a MÉDIA POPULACIONAL (m).
A fórmula para cálculo do tamanho da
amostra para uma estimativa confiável da
MÉDIA POPULACIONAL (m) é dada por:
CONTINUAÇÃO
Exemplo:
DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA
COM BASE NA ESTIMATIVA DA PROPORÇÃO
POPULACIONAL
Outro parâmetro estatístico cuja determinação afeta o
tamanho da amostra é a proporção populacional.
n
Z
2
.0,25
2
E
 /2
Equação 3
n = Número de indivíduos na amostra
Z / 2
= Valor crítico que corresponde ao grau de confiança desejado
E = Margem de erro ou ERRO MÁXIMO DE ESTIMATIVA. Identifica a diferença máxima
entre a PROPORÇÃO AMOSTRAL e a verdadeira PROPORÇÃO POPULACIONAL (p).
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
111
11
DETERMINAÇÃO DO TAMANHO DA
AMOSTRA PARA POPULAÇÕES
FINITAS
As fórmulas para determinação do tamanho da amostra
que vimos até agoratrabalhavam com a idéia de que a
população de onde se retirava a amostra era tão grande,
que poderíamos considerá-la infinita. Entretanto, a maior
parte das populações não é tão grande em comparação
com as amostras. Caso a amostra tenha um tamanho
(n) maior ou igual a 5% do tamanho da população (N),
considera-se que a população seja FINITA. Neste caso,
aplica-se um fator de correção às fórmulas vistas
anteriormente e teremos as seguintes fórmulas
corrigidas:
NORMAS PARA CONSTRUÇÃO DE
TABELAS ESTATÍSTICAS
Um dos objetivos da estatística é sintetizar os valores
que uma ou mais variáveis podem assumir, para que
tenhamos uma visão global da variação das mesmas.
Tabela é uma maneira de apresentar de forma resumida
um conjunto de dados.
Estas normas visam fornecer
elementos que assegurem a
padronização e racionalização da
apresentação de dados numéricos em
tabelas e em gráficos. Tais normas
fixam conceitos e procedimentos
aplicáveis à elaboração de tabelas e
gráficos, visando garantir a clareza das
informações apresentadas.
A tabela é uma forma de apresentar informações entre as quais o dado
numérico se destaca como a informação central.
Os espaços de uma tabela são:
Topo: é o espaço superior de uma tabela destinado ao seu número e
ao seu título.
11111111111111111111111111111111111111111111111111111111111111111111111111111111111
11111111111111111111111111111111111111111111111111111111111111111111111111111
TÍTULO DA TABELA
Conjunto de informações, as mais
completas possíveis, respondendo
às perguntas: O que?, Quando? E
Onde?, localizado no topo da tabela,
além de conter a palavra “TABELA”
e sua respectiva numeração.
CORPO DA TABELA: é o conjunto de Linhas e Colunas
que contém informações sobre a variável em estudo.
a) Cabeçalho da Coluna – Parte superior da tabela que
especifica o conteúdo das colunas;
b) Coluna Indicadora – Parte da tabela que especifica o
conteúdo das linhas;
c) Linhas – retas imaginárias que facilitam a leitura, no
sentido horizontal, de dados que se inscrevem nos seus
cruzamentos com as linhas;
d) Casa ou Célula – espaço destinado a um só número;
e) Total – deve ser SEMPRE destacado de alguma
forma;
f) Laterais da tabela – não devem ser fechadas. Caso as
feche, passa a ser chamada de “QUADRO”.
g) Número – preferencialmente utilizar separador de
1000 (por exemplo: 1.854.985 ao invés de 1854985).
Há ainda a considerar os elementos complementares
da tabela, que são a fonte, as notas, e as chamadas,
localizadas, de preferência, no rodapé.
a)
Fonte – identifica o responsável (pessoa física ou
jurídica) ou responsável pelos dados numéricos;
b) Notas – é o texto que irá esclarecer o conteúdo
estudado, que poderá ser de caráter geral ou
específico de uma tabela;
c) Chamadas – símbolo remissivo atribuído a algum
elemento de uma tabela que necessita de uma nota
específica.
Séries/Tabelas Estatísticas
As séries se classificam em função de 3
caracteres básicos:
• Época: variável temporal, histórica ou
cronológica a que se refere o fenômeno;
• Local: variável espacial ou geográfica,
onde o fenômeno ocorreu ou ocorre;
• Espécie: variável espécie do fato ou fato
específico que descreve o fenômeno.
Séries Simples
• A Série Temporal, cronológica, histórica, evolutiva ou em
marcha será identificada por meio de uma variável temporal, o
quando aconteceu o fato e pelos fatores fixos: geográfico e
específico.
• A Série Geográfica, territorial, espacial ou de localização.
Apresenta como elemento variável o espaço, a localização, o
local, onde o fato aconteceu e pelos fatores fixos o tempo e a
espécie.
• A Série Específica, categórica ou especificativa apresenta
como variável a espécie do fenômeno, as divisões do fato
estudado, o quê estudado, permanecendo fixos os fatores
temporal e geográfico.
• Séries Compostas. Uma série é composta quando o
fenômeno apresenta mais de uma variável. As séries poderão
ser combinadas 2 a 2 ou 3 a 3, resultando daí uma série de
dupla entrada.
Gráficos Tradicionais
O gráfico é uma forma de apresentação dos dados pesquisados
com o objetivo de levar ao público uma visão rápida do fenômeno
estudado. O gráfico é a forma mais simples de comunicação dos
fenômenos estatísticos. O gráfico , usado para espelhar um fenômeno,
deve ser construído com simplicidade, clareza e veracidade, devendo
atrair a atenção do observador; exprimindo com rapidez e com
simplicidade uma mensagem; sendo prontamente explicativo,
inteligível, inspirando a confiança e um cuidadoso acabamento.
Gráfico Estereograma
O estereograma é a representação gráfica dos
fenômenos através de figuras de volume
Gráfico Setores
Algumas referências:
•
•
•
•
•
•
•
•
•
•
•
•
•
Altman, 1980a.
Altman DG. Statistics and ethics in medical research: misuse of statistics is
unethical. Br Med J 1980 Nov 1;281(6249):1182-4.
Altman, 1980b.
Altman DG. Statistics and ethics in medical research: III How large a
sample? Br Med J. 1980 Nov 15;281(6251):1336-8.
Altman, 1980c.
Altman DG. Statistics and ethics in medical research: V--Analysing data. Br
Med J. 1980 Nov 29;281(6253):1473-5.
Altman, 1983.
Altman DG, Gore SM, Gardner MJ, Pocock SJ. Statistical guidelines for
contributors to medical journals. Br Med J (Clin Res Ed). 1983 May
7;286(6376):1489-93. Bland, 1998.
Bland JM, Altman DG. Survival probabilities (the Kaplan-Meier method).
BMJ 1998 Dec 5;317(7172):1572. Borenstein, 1994.
Borenstein M. Planning for precision in survival studies. J Clin Epidemiol
1994;47:1277-85. Campbell, 1995.
Campbell MJ, Julious SA, Altman DG. Estimating sample sizes for binary,
ordered categorical, and continuous outcomes in
two group comparisons. BMJ 1995 Oct 28;311(7013):1145-8. Disponível
em URL:
http://www.bmj.com/cgi/content/full/311/7013/1145
Obrigada !!!
Download

amostra - Unifra