C
iências
ontábeis
ADMINISTRAÇÃO
Caderno de Estatística I
Dom Alberto
Prof: Rosane de Fátima Worm
C122
WORM, Rosane de Fátima
Caderno de Estatística I Dom Alberto / Rosane de Fátima Worm. –
Santa Cruz do Sul: Faculdade Dom Alberto, 2010.
Inclui bibliografia.
1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística I
– Teoria I. WORM, Rosane de Fátima II. Faculdade Dom Alberto III.
Coordenação de Administração IV. Coordenação de Ciências Contábeis
V. Título
CDU 658:657(072)
Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10
Página 2
Apresentação
O Curso de Administração da Faculdade Dom Alberto iniciou sua
trajetória acadêmica em 2004, após a construção de um projeto pautado na
importância de possibilitar acesso ao ensino superior de qualidade que,
combinado à seriedade na execução de projeto pedagógico, propiciasse uma
formação sólida e relacionada às demandas regionais.
Considerando esses valores, atividades e ações voltadas ao
ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem
como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo
MEC do Curso de Administração em 2008.
Passados seis anos, o curso mostra crescimento quantitativo e
qualitativo, fortalecimento de sua proposta e de consolidação de resultados
positivos, como a publicação deste Caderno Dom Alberto, que é o produto do
trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores
durante esse período. Este material servirá de guia e de apoio para o estudo
atento e sério, para a organização da pesquisa e para o contato inicial de
qualidade com as disciplinas que estruturam o curso.
A todos os professores que com competência fomentaram o
Caderno Dom Alberto, veículo de publicação oficial da produção didáticopedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento
especial.
Lucas Jost
Diretor Geral
Página 3
PREFÁCIO
A arte de ensinar e aprender pressupõe um diálogo entre aqueles que
interagem no processo, como alunos e professores. A eles cabe a tarefa de
formação, de construção de valores, habilidades, competências necessárias à
superação dos desafios. Entre estes se encontra a necessidade de uma
formação profissional sólida, capaz de suprir as demandas de mercado, de
estabelecer elos entre diversas áreas do saber, de atender às exigências legais
de cada área de atuação, etc.
Nesse contexto, um dos fatores mais importantes na formação de um
profissional
é
saber
discutir
diversos
temas
aos
quais
se
aplicam
conhecimentos específicos de cada área, dispondo-se de uma variedade ampla
e desafiadora de questões e problemas proporcionada pelas atuais
conjunturas. Para que isso se torne possível, além da dedicação daqueles
envolvidos no processo de ensino-aprendizagem, é preciso haver suporte
pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que
supere a tradicional metodologia expositiva e atenda aos objetivos expressos
na proposta pedagógica do curso.
Considerando esses pressupostos, a produção desse Caderno Dom
Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto.
Com este veículo, elaborado por docentes da instituição, a faculdade busca
apresentar um instrumento de pesquisa, consulta e aprendizagem teóricoprática, reunindo materiais cuja diversidade de abordagens é atualizada e
necessária para a formação profissional qualificada dos alunos do curso.
Ser um canal de divulgação do material didático produzido por
professores da instituição é motivação para continuar investindo da formação
qualificada e na produção e disseminação do que se discute, apresenta, reflete,
propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o
Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em
elaborar esta coletânea.
Elvis Martins
Diretor Acadêmico de Ensino
Página 4
Sumário
Apresentação
3
Prefácio
4
Plano de Ensino
6
Aula 1
Introdução a Estatística
10
Aula 2
Atividades
84
Aula 3
Distribuição de Freqüência
90
Aula 4
Representação Gráfica
96
Aula 5
Medidas de tendência central
108
Aula 6
A Mediana
113
Aula 7
Continuação Aula 6
116
Aula 8
Medidas de dispersão
118
Aula 9
Continuação Aula 8
124
Aula 10
Medidas de Posição
125
Aula 11
Coeficiente de Variação
129
Aula 12
Eventos Complementares
138
Página 5
Centro de Ensino Superior Dom Alberto
Plano de Ensino
Curso: Administração/Ciências Contábeis
Carga Horária (horas): 60
Identificação
Disciplina: Estatística I
Créditos: 4
Semestre: 2º
Ementa
População e Amostra. Séries Estatísticas. Gráficos Estatísticos. Distribuição de Freqüência. Tipos de
Médias. Medidas de Variabilidade. Medidas de Dispersão. Probabilidade.
Objetivos
Geral: Desenvolver processos cognitivos e a aquisição de atitudes possibilitando o aluno a criar hábito de
investigação e confiança para enfrentar situações novas e formar uma visão ampla e científica da realidade.
Específicos: Compreender os conceitos de população, amostra e variável. Construir, ler, analisar e
interpretar vários tipos de gráficos. Resolver problemas que envolvam os conceitos de estatística.
Determinar a probabilidade de um evento num espaço amostra finito, independente da experimentação.
Compreender e aplicar o conceito de distribuição binomial no cálculo de probabilidades.
Inter-relação da Disciplina
Horizontal: As aplicações da disciplina são processadas de forma a adaptar o conhecimento teórico a uma
situação prática e interdisciplinar ajustada a realidade dos negócios na economia brasileira.
Vertical: Despertar o interesse do aluno na interpretação de dados com vista na utilização de instrumentos
capazes de fornecer um conhecimento científico, no que se refere ao pleno entendimento e leitura de
dados.
Competências Gerais
Reconhecer e definir problemas, equacionar soluções, pensar estrategicamente, introduzir modificações no
processo produtivo, atuar preventivamente, transferir e generalizar conhecimentos e exercer, em diferentes
graus de complexidade, o processo da tomada de decisão;
Desenvolver raciocínio lógico, crítico e analítico para operar com valores e formulações matemáticas
presentes nas relações formais e causais entre fenômenos produtivos, administrativos e de controle, bem
assim expressando-se de modo crítico e criativo diante dos diferentes contextos organizacionais e sociais;
Competências Específicas
Identificar problemas específicos, da estatística descritiva, ler, compreender e interpretar dados.
Coletar e organizar dados.
Habilidades Gerais
Reconhecer e definir problemas, organizar, compreender e interpretar gráficos e demais dados estatísticos
referentes a estatística descritiva.
Habilidades Específicas
Conhecer métodos estatísticos para descrever, analisar e interpretar os dados referentes a estatística
descritiva.
Conteúdo Programático
PROGRAMA
1. Introdução a Estatística;
2. Natureza dos dados: variáveis quantitativas e qualitativas; variáveis discretas e contínuas;
3. População e Amostra;
4. Amostragem: conceitos e tipos;
Página 6
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
5.
6.
7.
8.
9.
10.
Dados absolutos e relativos;
Tabelas: conceitos; ROL; elementos essenciais; construção;
Séries estatísticas;
Gráficos: principais tipos; análise; histogramas;
Distribuição de freqüências: intervalos de classes; freqüências: absolutas, relativas e acumuladas;
Medidas de tendência central:
- Médias: aritmética, geométrica, ponderada e móvel
- Mediana
- Moda
- Ponto médio.
11. Medidas de posição:
- Escore z
- Quartis, decis e percentis.
12. Medidas de variação:
- Amplitude
- Desvio-padrão
- Variância.
13. Medidas de Assimetria e Curtose..
14. Probabilidade:
- Experimentos
- Espaço amostral
- Eventos
- Arranjos e Combinações.
15. Números índices
Estratégias de Ensino e Aprendizagem (metodologias de sala de aula)
O planejamento do trabalho em sala de aula é à base da construção do processo de ensino e
aprendizagem. Planejando a ação, o professor tem a possibilidade de saber exatamente qual o ponto de
partida e o de chegada para cada tema abordado em seu curso.
Um planejamento não é um esquema de trabalho rígido, inflexível. Pelo contrário, devem-se levar em conta
as situações inesperadas que vão ocorrendo e adaptar ou modificar o que se havia inicialmente previsto, de
acordo com suas observações de classe e necessidades dos alunos.
Há metas que devem ser estabelecidas e alcançadas, sendo necessário que o professor disponha de um fio
condutor para a ação que vai desenvolver e de uma previsão para os resultados dessa ação.
Avaliação do Processo de Ensino e Aprendizagem
A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e
sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à
programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da
metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de
currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc.
A forma de avaliação será da seguinte maneira:
1ª Avaliação
–
Peso 8,0 (oito): Prova;
–
Peso 2,0 (dois): Trabalho referente ao conteúdo ministrado até a 1a avaliação.
2ª Avaliação
Peso 8,0 (oito): Prova;
Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas
provas do SPE)
Observação: As provas do SPE deverão ser realizadas até o dia 30/09/2010 (1ª prova SPE) e até o dia
30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova.
Avaliação Somativa
A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez,
permitindo-se a fração de 5 décimos.
O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele
obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas.
Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no
Página 7
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
bimestre.
O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários,
pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma
nota representativa de cada avaliação bimestral.
Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete
(7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados.
Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral,
no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de
substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como
média final de aprovação igual ou superior a cinco (5,0).
Sistema de Acompanhamento para a Recuperação da Aprendizagem
Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que
são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula.
Recursos Necessários
Humanos
Professor.
Físicos
Laboratórios, visitas técnicas, etc.
Materiais
Recursos Multimídia.
Bibliografia
Básica
CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002.
SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências
contábeis. São Paulo: Atlas, 1999. 1 e 2 v.
MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003.
TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995.
SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Pearson Education, 1994.
Complementar
BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002.
MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005.
BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999.
FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990.
Periódicos
Jornais: Gazeta do Sul, Zero Hora.
Revistas: Veja, Isto é.
Sites para Consulta
http://www.mec.gov.br
http://www.ime.usp.br
http://www.ibge.gov.br
Outras Informações
Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca:
http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por
Página 8
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
Cronograma de Atividades
Aula
Consolidação
Avaliação
1ª
Conteúdo
Procedimentos
Recursos
Apresentação do plano de ensino. Introdução a estatística.
Natureza dos dados: tipos de variáveis; População e Amostra;
AE
QG, AP, DS
2ª
Amostragem: conceitos e tipos; Dados absolutos e relativos;
AE, TI
AP, QG, DS
3ª
Tabelas: conceitos; ROL; elementos essenciais; construção;
Séries estatísticas;
AE
AP, QG, DS
4ª
Gráficos: principais tipos; análise; histogramas;
AE
AP, QG, DS
AE
AP, QG
AE, TI
AP, QG
PA, AE
AP, QG
AE
AP, QG
Distribuição de freqüências:intervalos de classes;
freqüências: absolutas, relativas e acumuladas;
Distribuição de freqüências:intervalos de classes;
freqüências: absolutas, relativas e acumuladas;
Medidas de tendência central: Médias: aritmética, geométrica,
ponderada e móvel
5ª
6ª
7ª
1
Consolidação 1.
1
1ª Avaliação.
8ª
Medidas de tendência central: Mediana; Moda; Ponto médio.
AE
AP, QG
9ª
Medidas de posição: Escore z; Quartis, decis e percentis.
AE
AP, QG
10ª
Medidas de variação: amplitude; desvio-padrão e variância.
AE
AP, QG
11ª
Medidas de Assimetria e Curtose. Números índices.
AE, TG
AP, QG, DS
12ª
Números índices. Probabilidade: Experimentos; Espaço
amostral; Eventos;
AE
AP, QG, DS
13ª
Probabilidade: Arranjos e Combinações.
AE
AP, QG
Consolidação 2.
AE
AP, QG
2
2
2ª avaliação.
3
Avaliação substituta.
Legenda
Código
AE
TG
TI
SE
PA
Descrição
Aula expositiva
Trabalho em grupo
Trabalho individual
Seminário
Palestra
Código
QG
RE
VI
DS
FC
Descrição
Quadro verde e giz
Retroprojetor
Videocassete
Data Show
Flipchart
Código
LB
PS
AP
OU
Descrição
Laboratório de informática
Projetor de slides
Apostila
Outros
Página 9
Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes,
comprometidos com o comportamento ético e visando ao desenvolvimento regional”.
MEDIDAS DE TENDÊNCIA CENTRAL
Depois de se fazer a coleta e a representação dos dados de
uma pesquisa, é comum analisarmos as tendências que
essa pesquisa revela. Assim, se a pesquisa envolve muitos
dados, convém sintetizarmos todas essas informações a um
mínimo de parâmetros que possam caracterizá-la. Esses
parâmetros podem ser:
MEDIDAS DE TENDÊNCIA CENTRAL
Uma medida de tendência central é um valor no
centro ou no meio de um conjunto de dados.
Página 10
As medidas de posição mais importantes são as medidas
de tendência central, que recebem tal denominação pelo
fato de os dados observados tenderem, em geral, a se
agrupar em torno dos valores centrais. Dentre as medidas
de tendência central, destacam-se as seguintes: Média
aritmética, Moda e Mediana. Cada uma com um significado
diferenciado, porém tendo como serventia representar um
conjunto de dados.
A maneira de se obter estas medidas é um pouco
diferenciada dependendo de como os dados são
apresentados. Eles podem vir de forma isolada (não
agrupados) ou ainda ponderada (agrupados em intervalos
ou sem intervalo de classe, por ponto).
Página 11
MEDIDAS DE TENDÊNCIA
CENTRAL
 MODA
 MEDIANA
 MÉDIA
Página 12
Média: ponto de equilíbrio
do conjunto.
Página 13
Média Aritmética ( µ ou x )
É o quociente da divisão da soma dos valores da variável
pelo número deles:
µ = ∑ xi
N
ou
X = ∑ xi
n
Sendo: µ ou x: média aritmética
Xi: valores da variável
n ou N: número de valores
Página 14
Dados não-agrupados
Quando se deseja conhecer a média dos dados
não-agrupados, determinamos à média aritmética
simples.
Exemplo: Sabendo-se que as vendas diárias da
empresa A, durante uma semana, foram de 10, 14,
13, 15, 16, 18 e 12 unidades, tem-se, para
produção média da semana:
10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14
7
7
Página 15
Dados Agrupados – média aritmética
ponderada
Sem intervalos de classe: As freqüências são
números indicadores da intensidade de cada
valor da variável, elas funcionam como fatores
de ponderação, o que leva a calcular a média
aritmética ponderada.
_
µ = ∑ xi.fi
população X = ∑ xi.fi amostra
N
n
Página 16
Exemplo: Considerando a distribuição relativa a 34
famílias de quatro filhos, adotando-se a variável
Σ
“número de filhos do sexo masculino”, determine a
média.
N.º de Meninos fi
0
2
1
6
2
10
3
12
4
4
= 34
Página 17
Com intervalos de classe: Convenciona-se que
todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto
médio, e determina-se a média aritmética
ponderada.
µ = ∑ xi.fi
N
__
população
X = ∑ xi.fi amostra
n
Onde Xi é o ponto médio da classe
Página 18
Exemplo:
SALÁRIOS SEMANAIS EM REAIS DE UMA
AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z
Salários semanais
(R$)
Freqüência
s
150 -- ├ 154
4
154 ├ 158
9
158 ├ 162
11
162 ├ 166
8
166 ├ 170
5
170 ├ 174
3
Total
40
Página 19
A média é utilizada quando:
Desejamos obter a medida de posição que
possui a maior estabilidade;
Houver a necessidade de um tratamento
algébrico ulterior.
Página 20
Média Geométrica Simples
Para uma seqüência numérica x:
x1, x2, ......., xn, a média
geométrica simples, que
designaremos por , é definida por:
Exemplo: Se X: 2, 4, 6, 9, então:
Página 21
Média Geométrica Ponderada
Para uma seqüência numérica x:
x1, x2, ...., xn afetados de pesos
p1, p2, ..., pn respectivamente, a
média geométrica ponderada que
designaremos por é definida por:
Página 22
Exemplo: Se x: 1, 2, 5, com pesos
3, 3, 1 respectivamente então:
xg =
7
1 .2 .5 =
3
3
1
7
1.8.5 =
7
40 = 1,6938
Página 23
Média Móvel
•
Uma média, como o nome diz, mostra
o valor médio de uma amostra de
determinado dado. Uma média móvel
aritmética (MMA) é uma extensão desse
conceito, representando o valor médio,
normalmente dos preços de fechamento,
em um período de tempo.
Página 24
Exemplo: A média móvel simples é calculada pela
formação do preço médio por um número
específico de períodos. Para o cálculo usamos o
preço de fechamento. Por exemplo: Vamos
utilizar a média dos últimos 10 dias. Devemos
somar os preços finais durante os últimos 10
dias e dividir o total por 10.
10+11+12+13+14+15+16+17+18+19=145
(145/10) = 14,50
Página 25
• Devemos repetir este cálculo conforme o passar dos
dias, assim, as médias vão se juntando e formando uma
linha. Se continuarmos com o nosso exemplo, o próximo
preço final na média será 20, então teremos um novo
período, somando o último dia (20) e removendo o
primeiro da lista (10). Continuando com a média dos
últimos 10 dias, a média móvel simples deverá ser
calculada da seguinte maneira:
11+12+13+14+15+16+17+18+19+20=155
(155/10) = 15,50
•
Repare que removemos o primeiro dia da lista (10)
para incluir o novo dia (20).
•
Durante os últimos dois dias, a média moveu-se de
14,50 para 15,50. Como são somados novos dias, os
antigos serão removidos e a média permanece se
movendo com o passar do tempo.
Página 26
Exercícios
Página 27
Moda: valor mais
provável.
Página 28
Moda (Mo)
A moda de uma distribuição é o valor da variável que tem a maior freqüência
absoluta simples, quer dizer aquele valor que aparece mais [mais se
repete]. Existem algumas situações nas quais não existe moda, isto é, todos
os valores da variável só aparecem uma vez, não se repetem.
Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou
mais valores da variável têm maior freqüência [freqüências iguais], neste
caso diz-se que o conjunto é bimodal. Podem-se ter três, quatro, etc. Nestes
casos é difícil escolher a moda como um representante do grupo, uma vez
que teremos muitos representantes. Para que se possa obter o valor da
moda é necessário que os dados estejam no mínimo em escala nominal,
quer dizer, com qualquer nível de mensuração podemos obter o valor da
moda, uma vez que ela é oriunda apenas de uma contagem. Portanto, a
moda é o valor que ocorre com maior freqüência em uma série de valores.
Página 29
Exemplo: - o dono do restaurante vai preparar
mais o filé de maior saída; maioria tirou “C”
numa turma; o proprietário da loja de sapato vai
comprar mais os números de maior saída.
Página 30
Dados não-agrupados
A moda é facilmente reconhecida: basta procurar o
valor que mais se repete.
Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11,
12, 12, 12, 12, 13, 15 tem moda igual a 12.
Amodal: são as séries nas quais nenhum valor
apareça mais vezes que outros.
Exemplo: 3, 5, 8, 10, 13.
Multimodal: é uma série que possui dois ou mais
Página 31
valores modais.
Dados agrupados
Sem intervalos de classe: É o valor da variável de maior
freqüência
Xi
3
5
7
fi
8
1
15
9
10
7
6

Classe
Modal
Mo = 7
Página 32
Com intervalos de classe:
A classe que apresenta maior freqüência é
denominada classe modal.
O método mais simples para o cálculo da moda
consiste em tomar o ponto médio da classe
modal. Damos a esse valor a denominação de
moda bruta.
Há, para o cálculo da moda, outros métodos
mais elaborados, como, por exemplo, o que faz
uso da fórmula de CZUBER:
Página 33
Exemplo: Calcule a moda da seguinte distribuição
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$)
150
154
158
162
166
170
|--- 154
|--- 158
|--- 162
|--- 166
|--- 170
|--- 174
Total
Freqüências
4
9
11
8
5
3
40
Página 34
Empregamos a moda quando:
Desejamos obter uma medida rápida e
aproximada de posição;
A medida de posição deve ser o valor
mais típico da distribuição
Página 35
Mediana: divide o conjunto
em duas partes iguais.
Página 36
Mediana (Md):
É o número que se encontra no centro de uma série de
números, estando estes dispostos segundo uma ordem.
Para que se possa obter o valor da mediana os dados têm
que estar em uma escala de medida no mínimo ordinal,
uma vez que se precisa ordená-los.
A mediana é o valor que divide o conjunto ao meio, isto é,
concentra antes e depois de si, 50% das observações
ordenadas. Ao contrário da média aritmética a mediana não
sofre influência quando temos no conjunto valores
discrepantes [tanto para mais como para menos]. Neste
caso a mediana pode melhor representar um conjunto do
que a média aritmética, porém não tem o mesmo
significado que aquela.
Página 37
A mediana pode ou não pertencer ao conjunto do
qual ela é originária, vai pertencer sempre que o
conjunto tiver um número ímpar de informações
e vai ou não pertencer quando o conjunto tiver
um número par de observações. Com isso já
podemos ver que a quantidade de observações
influi na maneira pela qual vamos encontrar o
valor da mediana.
Página 38
Dados não-agrupados:
Estando ordenados os valores de uma série e
sendo n o número de elementos da série, o valor
mediano será, quando n for:
ímpar : o termo de ordem ; n + 1
2
par : a média aritmética dos termos de ordem
n e n + 1.
2 2
Página 39
Exemplo 1: Dada à série de valores: 5, 13, 10, 2,
18, 15, 6, 16, 9, identifique a mediana.
Md = 10
Exemplo 2: Dada à série de valores: 2, 6, 7, 10,
12, 13, 18, 21, calcule a mediana.
Md = 11
O valor da mediana pode coincidir ou não com um
elemento da série.
Página 40
Dados agrupados: Para o caso de uma
distribuição, porém, a ordem, a partir de qualquer
um dos extremos, é dada por: n
2
Sem intervalos de classe: É o bastante identificar
a freqüência acumulada imediatamente superior à
metade da soma das freqüências. A mediana será
aquele valor da variável que corresponde a tal
freqüência acumulada.
Exemplo: Considerando a distribuição relativa a 34
famílias de quatro filhos, tomando para variável o
número de filhos do sexo masculino, determine a
mediana:
Página 41
Σ
N.ºde Meninos
0
1
2
3
4
fi
2
6
10
12
4
= 34
Página 42
No caso de existir uma freqüência acumulada
(Fi), tal que:
a mediana será dada por:
Md = xi + X i + 1
2
isto é, a mediana será a média aritmética entre o
valor da variável correspondente a essa
freqüência acumulada e a seguinte.
Página 43
Exemplo: Determine a mediana da distribuição abaixo:
Xi
12
14
15
16
17
20
fi
1
2
1
2
1
1
Fi
Página 44
Com intervalos de classe: Classe mediana é
aquela correspondente à freqüência
acumulada imediatamente superior a ∑ fi.
2
Página 45
Em seguida, emprega-se a fórmula:
Me = li + h ( ∑ fi/2 - Fi ( i -1) )
fi
Sendo: li = limite inferior da classe
mediana
h = amplitude do intervalo da classe
mediana
fi = freqüência simples da classe mediana
Fi = freqüência acumulada da classe
anterior à classe mediana
Página 46
Exemplo: Calcule a mediana da seguinte distribuição:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA
DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA
EMPRESA Z
Salários semanais
(R$)
150 -- |--- 154
154 |--- 158
158 |--- 162
162 |--- 166
166 |--- 170
170 |--- 174
Total
Freqüência
s
4
9
11
8
5
3
40
Página 47
No caso de existir uma freqüência acumulada
exatamente igual a , a mediana será o limite
superior da classe correspondente.
i
Exemplo
Classes
0 |--- 10
10 |--- 20
20 |--- 30
30 |--- 40
40 |--- 50
50 |--- 60
fi
1
3
9
7
4
2
26
Fi
Página 48
Empregamos a mediana quando:
Desejamos obter o ponto que divide a
distribuição em partes iguais;
Há valores extremos que afetam de uma
maneira acentuada a média;
A variável em estudo é salário.
Página 49
ESTATÍSTICA
O que a Estatística significa para
você?
Página 50
INTRODUÇÃO
ESTATÍSTICA:
é a ciência dos dados. Ela envolve
coletar, classificar, resumir, organizar, analisar e
interpretar informação numérica.
ANTIGUIDADE:
os povos já registravam o número de
habitantes, nascimentos, óbitos, faziam estimativas das
riquezas individual e social, distribuíam terras ao povo,
cobravam impostos.
Página 51
ESTATÍSTICA
Página 52
ESTATÍSTICA ENVOLVE DOIS
PROCESSOS DIFERENTES
DESCREVER
CONJUNTO
DE DADOS
OBTER CONCLUSÕES
(FAZER ESTIMATIVAS,
PREVISÕES,TOMAR
DECISOES,
ETC.)
Página 53
ESTATÍSTICA
DESCRITIVA
A Estatística descritiva utiliza
métodos numéricos e gráficos
para detectar padrões em um
conjunto de dados, para resumir
a informação revelada em um
conjunto
de
dados
para
apresentar a informação de uma
forma
conveniente.
INFERENCIAL
A Estatística inferencial utiliza uma
amostra de dados para fazer
estimativas,
tomar
decisões,
previsões ou outras generalizações
acerca de um conjunto maior de
dados.
Página 54
Página 55
ESTATÍSTICA DESCRITIVA
COLETAR
CONTAR
ORGANIZAR
TABULAR
DADOS ESTATÍSTICOS
DESCREVER O FENÔMENO ESTATÍSTICO
Página 56
ESTATÍSTICA INFERENCIAL
POPULAÇÃO
AMOSTRA
MEDIANTE MÉTODOS E MODELOSPágina 57
VAI INFERIR POSSÍVEIS RESULTADOS
A natureza dos dados estatísticos
Dados numéricos ou
dados quantitativos.
Obtidos: medindo ou contando
discreto
Resultam de um
conjunto finito de
valores possíveis,
ou de um conjunto
enumerável desses
valores. (ou seja,
números inteiros.).
Ex.: números de
ovos que as
galinhas põem.
contínuo
Resultam de um
número infinito de
valores possíveis
que podem ser
associados
a pontos em uma
escala contínua.
Ex: quantidade de
leite que as vacas
produzem
Dados categóricos ou
dados qualitativos.
Resultam de
descrições, por
exemplo, grupos
sanguíneos,
estado civil ou na
religião de
pacientes de um
hospital.
Página 58
Exemplos . Cor dos olhos das aluna: qualitativa
. Produção de café no Brasil: quantitativa contínua
. Número de defeitos em aparelhos de TV: quantitativa
discreta
. Comprimento dos pregos produzidos por uma empresa:
quantitativa contínua
. O ponto obtido em cada jogada de um dado:
quantitativa discreta
Página 59
POPULAÇÃO
PESSOAS, ANIMAIS,
OBJETOS ou NÚMEROS
PASSÍVEIS DE UM LEVANTAMENTO OU PESQUISA
Página 60
POPULAÇÃO
FINITA
Consiste em um número finito,
ou fixo, de elementos, medidas
ou observações. Exemplos:
pesos líquidos de 3000 latas
de tintas de um certo lote de
produção; pontos obtidos por
todos os candidatos no
vestibular de 2008 numa certa
universidade.
INFINITA
Contém, pelo menos hipoteticamente, um
número infinito de elementos. Por exemplo:
quando medimos repetidamente o ponto de
ebulição de um composto de silicone (não
há limite para o número de vezes que
podemos medir); quando observamos os
totais obtidos em repetidas jogadas de um
par de dados (não há limite para o número
de vezes que podemos jogar um par de
dados).
Página 61
é
um
plano
definido, completamente
determinado antes da coleta de quaisquer
dados, de obter uma amostra de uma dada
população.
Página 62
AMOSTRAGEM
POPULAÇÃO
AMOSTRA
Página 63
MÉTODOS PARA COMPOR A
AMOSTRA
PROBABILÍSTICAS
ALEATÓRIA
SISTETMÁTICO
ESTRATIFICADO
CONGLOMERADOS
NÃO PROBABILÍSTICAS
OU INTENCIONAL
ACIDENTAL
INTENCIONAL
CONVENIÊNCIA
Página 64
Métodos Probabilísticos
O método de amostragem probabilística exige
que cada elemento da população possua
determinada probabilidade de ser selecionado.
Normalmente possuem a mesma probabilidade.
Assim, se N for o tamanho da população, a
probabilidade de cada elemento será 1/N. Tratase do método que garante cientificamente a
aplicação das técnicas estatísticas de inferências.
Somente com base em amostragens
probabilísticas é que se podem realizar
inferências induções sobre a população a partir
do conhecimento da amostra.
Página 65
AMOSTRAGEM ALEATÓRIA
os elementos da população são escolhidos
de tal forma que cada um deles tenha igual
chance de figurar na amostra. (Escolhe-se
uma amostra aleatória simples de n
elementos, de maneira que toda amostra de
tamanho n possível tenha a mesma chance
de ser escolhida.)
Página 66
Ex:
Vamos obter uma amostra, de 10%, representativa
para a pesquisa da estatura de 90 alunos de uma escola:
1º - numeramos os alunos de 1 a 90.
2º - escrevemos os números dos alunos, de 1 a 90, em
pedaços iguais de papel, colocamos na urna e após
misturar retiramos, um a um, nove números que formarão a
amostra.
OBS: quando o número de elementos da amostra é muito
grande, esse tipo de sorteio torna-se muito trabalhoso.
Neste caso utiliza-se uma Tabela de números aleatórios,
construída de modo que os algarismos de 0 a 9 são
distribuídos ao acaso nas linhas e colunas.
Página 67
ESTRATIFICADA
Com a amostragem estratificada,
subdividimos a população em, no
mínimo, duas sub populações (ou
estratos) que compartilham das
mesmas características (como sexo) e,
em seguida, extraímos uma amostra de
cada estrato.
Página 68
Ex: Vamos obter uma amostra proporcional estratificada, de
10%, do exemplo anterior, supondo, que, dos 90 alunos, 54
sejam meninos e 36 sejam meninas. São portanto dois
estratos (sexo masculino e sexo feminino). Logo, temos:
SEXO
POPULACÃO
10 %
AMOSTRA
MASC.
54
5,4
5
FEMIN.
36
3,6
4
Total
90
9,0
9
Numeramos então os alunos de 01 a 90, sendo 01 a
54 meninos e 55 a 90, meninas e procedemos o
sorteio casual com urna ou tabela de números
aleatórios.
Página 69
PROBABILÍSTICA SISTEMÁTICA
Quando se conhece uma listagem dos elementos da população
pode-se obter uma amostra aleatória de elementos dividindo-se o
número de elementos da população pelo tamanho da amostra.
Exemplo: Se a população tem 10.000, onde
devemos selecionar uma amostra de 1000. Vamos
sortear o primeiro entre 1 e 10 e a partir deste
acrescentar sempre 10, até completar a amostra.
Página 70
CONGLOMERADO
Na amostragem por conglomerados, começamos dividindo a área da população
em seções (ou conglomerados); em seguida escolhemos algumas dessas
seções e, finalmente, tomamos todos os elementos das seções escolhidas.
Uma diferença importante entre a amostragem por conglomerados e a
amostragem estratificada é que a amostragem por conglomerados utiliza todos
os elementos dos conglomerados selecionados, enquanto a amostragem
estratificada utiliza uma amostra de membros de cada estrato. Pode-se
encontrar um exemplo de amostragem por conglomerado em uma pesquisa préeleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos
todos os elementos de cada uma das zonas escolhidas. Esse método é muito
mais rápido e menos dispendioso do que a escolha de um indivíduo de cada
uma das inúmeras zonas da área populacional. Os resultados podem ser
ajustados ou ponderados para corrigir qualquer representação
desproporcionada de grupos. A amostragem por conglomerados é
extensamente utilizada pelo governo e por organizações particulares de
pesquisa.
Página 71
NÃO PROBABILÍSTICA
São amostragens em que há uma escolha
deliberada dos elementos da amostra. Não é
possível generalizar os resultados das pesquisas
para a população, pois as amostras nãoprobabilísticas não garantem a representatividade
da população.
Página 72
ACIDENTAL
Trata-se de uma amostra formada por aqueles
elementos que vão aparecendo, que são
possíveis de se obter até completar o número de
elementos da amostra. Geralmente utilizada em
pesquisas de opinião, em que os entrevistados
são acidentalmente escolhidos.
Exemplo: As pessoas que de modo voluntário
estão dispostas para responder ao questionário.
Pesquisas de opinião em praças
públicas, ruas...
As pessoas que estão mais ao alcance do
investigador.
Página 73
INTENCIONAL
De acordo com determinado critério, é escolhido
intencionalmente um grupo de elementos que irão compor a
amostra. O investigador se dirige intencionalmente a grupos
de elementos dos quais deseja saber a opinião.
Exemplo1: Em um teste de mercado o investigador
pesquisa na cidade para comprovar as possibilidades de
comercialização de um produto.
Exemplo2: Para extrair uma amostra de revistas que
reflitam os valores da classe média brasileira, poderíamos ser
levados pela intuição, selecionar Veja, Exame e Isto é.
Exemplo 3: Numa pesquisa sobre preferência por
determinado cosmético, o pesquisador se dirige a um
grande salão de beleza e entrevista as pessoas que ali se
encontram.
Página 74
Amostragem de Conveniência
Na amostragem de conveniência, simplesmente utilizamos
resultados que já estão disponíveis.
Página 75
Aula 1- 05/08/10
Profª Rosane Worm
ESTATÍSTICA BÁSICA
1. INTRODUÇÃO
O que a Estatística significa para você?
ESTATÍSTICA:
é a ciência dos dados. Ela envolve coletar, classificar, resumir,
organizar, analisar e interpretar informação numérica.
ANTIGUIDADE:
os povos já registravam o número de habitantes, nascimentos,
óbitos, faziam estimativas das riquezas individual e social,
distribuíam terras ao povo, cobravam impostos.
TIPOS DE APLICAÇÕES ESTATÍSTICAS NA EMPRESA
Para a maioria das pessoas, estatística significa, descrições numéricas, taxas
mensais de desemprego, índice de falência para um novo negócio e proporção de
mulheres executivas em um setor em particular, todos esses exemplos representam
descrições estatísticas de um grande conjunto de dados coletados sobre algum
fenômeno. Freqüentemente os dados são selecionados de algum conjunto maior do
qual desejamos estimar alguma característica. Este processo de seleção é chamado
de amostragem. Por exemplo, você pode coletar as idades de uma amostra de
consumidores em uma videolocadora para estimar a idade média de todos os
consumidores da loja. Assim, você poderia usar suas estimativas nos anúncios da
loja para atingir o grupo de faixa etária apropriada. Repare que a estatística envolve
dois processos diferentes: (1) descrever conjuntos de dados e (2) obter conclusões
(fazer estimativas, previsões, tomar decisões, etc.) sobre os conjuntos de dados
baseados na amostragem. Assim, as aplicações da Estatística podem ser divididas
em duas grandes áreas: estatística descritiva e estatística inferencial.
Por meio de sondagem, de coleta de dados e de recenseamento de opiniões,
podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e
financeiros disponíveis, as expectativas da comunidade sobre a empresa, e
estabelecer suas metas, seus objetivos com maior possibilidade de serem
alcançados a curto, médio ou longo prazo.
A Estatística ajudará em tal trabalho, como também na seleção e organização
da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas
de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos
possíveis lucros e/ou perdas.
A Estatística descritiva utiliza métodos numéricos e gráficos para detectar padrões
em um conjunto de dados, para resumir a informação revelada em um conjunto de
dados para apresentar a informação de uma forma conveniente.
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o
comportamento ético e visando ao desenvolvimento Regional”.
Página 76
A Estatística inferencial utiliza uma amostra de dados para fazer
estimativas, tomar decisões, previsões ou outras generalizações acerca de um
conjunto maior de dados.
A coleta, a organização ,a descrição dos dados, o cálculo e a
interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto
a análise e a interpretação dos dados, associado a uma margem de incerteza,
ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada
como a medida da incerteza ou métodos que se fundamentam na teoria da
probabilidade.
A natureza dos dados estatísticos
Dados numéricos ou dados quantitativos. São obtidos medindo ou
contando, por exemplo, pesos de ratos utilizados num experimento (obtidos
medindo) ou as faltas diárias de alunos numa turma ao longo do ano letivo (obtidos
contando).
Podemos descrever os dados quantitativos distinguido entre discreto e
contínuo.
•
•
Dados discretos. Resultam de um conjunto finito de valores possíveis, ou
de um conjunto enumerável desses valores. (ou seja, números inteiros.).
Ex.: números de ovos que as galinhas põem.
Dados contínuos. Resultam de um número infinito de valores possíveis
que podem ser associados a pontos em uma escala contínua. Ex:
quantidade de leite que as vacas produzem.
Dados categóricos ou dados qualitativos. Resultam de descrições, por
exemplo, grupos sanguíneos, estado civil ou na religião de pacientes de um hospital.
Exemplos . Cor dos olhos das aluna: qualitativa
. Produção de café no Brasil: quantitativa contínua
. Número de defeitos em aparelhos de TV: quantitativa discreta
. Comprimento dos pregos produzidos por uma empresa: quantitativa contínua
. O ponto obtido em cada jogada de um dado: quantitativa discreta
Populações e Amostras
Quando dissemos que a escolha de uma descrição estatística pode
depender da natureza dos dados, estamos nos referindo, entre outras coisas, à
seguinte distinção: se um conjunto de dados consiste em todas as observações
possíveis de um dado fenômeno, dizemos que é uma população; se um conjunto de
dados consiste em apenas uma parte da população, dizemos que é uma amostra.
Originalmente, a Estatística tratava apenas da descrição de populações
humanas, resultados de censos. Mas, à medida que seus objetivos se ampliaram, o
Página 77
termo “população” passou a ter a conotação muito mais ampla. Em Estatística,
“população” é um temo técnico com um significado próprio.
Podemos designar como população qualquer grupo de elementos, depende
do contexto em que os itens serão considerados. Suponhamos, por exemplo, que
nos ofereçam um lote com 400 ladrilhos de cerâmicas, que podemos comprar ou
não, dependendo de sua resistência. Se medirmos a resistência à quebra de 20
desses ladrilhos para estimar a resistência média de todos os ladrilhos, essas 20
mensurações constituem uma amostra da população que consiste nas resistências
de todos os 400 ladrilhos. Em outro contexto, se pensarmos em firmar um contrato
de longo prazo para o fornecimento de dezenas de milhares desses ladrilhos,
consideraríamos como apenas uma amostra o conjunto das resistências dos 400
ladrilhos originais.
Distinguiremos ainda dois tipos de populações, as populações finitas e as
populações infinitas.
Populações finitas. Consiste em um número finito, ou fixo, de elementos,
medidas ou observações. Exemplos: pesos líquidos de 3000 latas de tintas de um
certo lote de produção; pontos obtidos por todos os candidatos no vestibular de 2008
numa certa universidade.
Populações infinitas. Contém, pelo menos hipoteticamente, um número
infinito de elementos. Por exemplo: quando medimos repetidamente o ponto de
ebulição de um composto de silicone (não há limite para o número de vezes que
podemos medir); quando observamos os totais obtidos em repetidas jogadas de um
par de dados (não há limite para o número de vezes que podemos jogar um par de
dados).
Planejamento da amostra e amostragem
Em Estatística, um planejamento de amostra é um plano definido,
completamente determinado antes da coleta de quaisquer dados, de obter uma
amostra de uma dada população. Assim, o plano para extrair uma amostra aleatória
simples de tamanho 12 das 247 farmácias de uma cidade, utilizando uma tabela de
números aleatórios de uma maneira predeterminada, constitui um planejamento de
amostra.
Basicamente, existem dois métodos para composição da amostra: probabilístico e não probabilístico ou intencional.
Métodos Probabilísticos
O método de amostragem probabilística exige que cada elemento da
população possua determinada probabilidade de ser selecionado. Normalmente
possuem a mesma probabilidade. Assim, se N for o tamanho da população, a
probabilidade de cada elemento será 1/N. Trata-se do método que garante
cientificamente a aplicação das técnicas estatísticas de inferências. Somente com
base em amostragens probabilísticas é que se podem realizar inferências induções
sobre a população a partir do conhecimento da amostra.
Amostragem Aleatória
Em uma amostra aleatória, os elementos da população são escolhidos de tal
forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma
amostra aleatória simples de n elementos, de maneira que toda a mostra de
tamanho n possível tenha a mesma chance de ser escolhida.)
As amostras aleatórias podem ser escolhidas por diversos métodos,
inclusive a utilização de tabelas de números aleatórios e de computadores para
Página 78
gerar números aleatórios. Com a amostragem aleatória, espera-se que todos os
grupos da população sejam representados na amostra de forma aproximadamente
proporcional. Uma amostragem descuidada pode facilmente resultar em uma
amostra tendenciosa, com características assaz diferentes das da população que a
originou. Em contrapartida, a amostragem aleatória é cuidadosamente planejada
para evitar qualquer tendenciosidade. Por exemplo, a utilização de catálogos
telefônicos elimina automaticamente todos aqueles cujos telefones não figurem no
catálogo, e a exclusão desse segmento da população pode facilmente conduzir a
resultados falsos. Há cidades que, por exemplo, 42,5% dos números de telefones
não estão no catálogo. Os pesquisadores costumam contornar esse problema
utilizando computadores para gerar números de telefone, de modo que todos os
números sejam possíveis. Eles devem também ter o cuidado de incluir os que
inicialmente não foram encontrados ou se recusaram a responder. Uma empresa
constatou que a taxa de recusa para entrevistas telefônicas é em geral de 20%, no
mínimo. O fato de ignorarmos os que inicialmente se recusam a responder pode
concorrer para que nossa amostra seja tendenciosa.
Amostragem Estratificada
Com a amostragem estratificada, subdividimos a população em, no mínimo,
duas sub populações (ou estratos) que compartilham das mesmas características
(como sexo) e, em seguida, extraímos uma amostra de cada estrato.
Em uma pesquisa sobre a Emenda Constitucional da Igualdade de Direitos,
poderíamos utilizar o sexo como base para a criação de dois estratos. Após obter
uma relação dos homens e uma relação das mulheres, aplicamos um método
conveniente (como a amostragem aleatória) para escolher determinado número de
elementos de cada relação. Quando os diversos estratos têm tamanhos amostrais
que refletem a população global, temos o que se chama amostragem proporcional.
No caso de alguns estratos não serem representados na proporção adequada então
os resultados poderão ser ajustados ou ponderados convenientemente.
Para um tamanho fixo de amostra, se escolhemos aleatoriamente elementos
de diferentes estratos, temos chance de obter resultados mais consistentes (e
menos variáveis) do que com a simples escolha de uma amostra aleatória de toda a
população. Por essa razão, costuma-se usar a amostragem estratificada para reduzir
a variação nos resultados.
Amostragem Sistemática
Quando se conhece uma listagem dos elementos da população pode-se
obter uma amostra aleatória de n elementos dividindo-se o número de elementos da
população pelo tamanho da amostra.
N
k=
n
Escolhemos um ponto de partida, que deve ser um valor entre 1 e k e a
partir de então selecionamos cada k − ésimo elemento da população para fazer parte da
amostra.
Por exemplo, se a Motorola quisesse fazer uma pesquisa sobre seus
107.000 empregados, poderia partir de uma relação completa dos mesmos e
selecionar cada 100º empregado, obtendo uma amostra de 1.070 elementos. Esse
método é simples e utilizado com freqüência.
Amostragem por Conglomerado
Página 79
Na amostragem por conglomerados, começamos dividindo a área da
população em seções (ou conglomerados); em seguida escolhemos algumas dessas
seções e, finalmente, tomamos todos os elementos das seções escolhidas.
Uma diferença importante entre a amostragem por conglomerados e a
amostragem estratificada é que a amostragem por conglomerados utiliza todos os
elementos dos conglomerados selecionados, enquanto a amostragem estratificada
utiliza uma amostra de membros de cada estrato. Pode-se encontrar um exemplo de
amostragem por conglomerado em uma pesquisa pré-eleitoral, onde escolhemos
aleatoriamente 30 zonas eleitorais e pesquisamos todos os elementos de cada uma
das zonas escolhidas. Esse método é muito mais rápido e menos dispendioso do
que a escolha de um indivíduo de cada uma das inúmeras zonas da área populacional. Os resultados podem ser ajustados ou ponderados para corrigir qualquer
representação desproporcionada de grupos. A amostragem por conglomerados é
extensamente utilizada pelo governo e por organizações particulares de pesquisa.
Métodos não Probabilísticos
São amostragens em que há uma escolha deliberada dos elementos da
amostra. Não é possível generalizar os resultados das pesquisas para a população,
pois as amostras não-probabilísticas não garantem a representatividade da
população.
Amostragem Acidental
Trata-se de uma amostra formada por aqueles elementos que vão
aparecendo, que são possíveis de se obter até completar o número de elementos da
amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados
são acidentalmente escolhidos.
Amostragem Intencional
De acordo com determinado critério, é escolhido intencionalmente um grupo
de elementos que irão compor a amostra. O investigador se dirige intencionalmente
a grupos de elementos dos quais deseja saber a opinião. Por exemplo, numa
pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um
grande salão de beleza e entrevista as pessoas que ali se encontram.
Amostragem de Conveniência
Na amostragem de conveniência, simplesmente utilizamos resultados que já
estão disponíveis.
Em alguns casos, os resultados da amostragem de conveniência podem ser
muito bons, mas em outros casos podem apresentar séria tendenciosidade. Ao fazer
uma pesquisa sobre pessoas canhotas, seria conveniente um estudante pesquisar
seus próprios colegas de classe, porque estão ao seu alcance imediato. Mesmo que
tal amostra não seja aleatória, os resultados devem ser bem satisfatórios. Em
contrapartida, poderia ser muito conveniente (e talvez mesmo lucrativo) para a ABC
News fazer uma pesquisa pedindo aos espectadores que liguem para um número de
telefone “900” para registrar suas opiniões, mas essa pesquisa seria autoselecionada e os resultados seriam provavelmente tendenciosos
Um erro amostral é a diferença entre um resultado amostral e o verdadeiro
resultado populacional; tais erros resultam de flutuações amostrais aleatórias.
Ocorre um erro não-amostral quando os dados amostrais são coletados,
registrados ou analisados incorretamente. Tais erros resultam de um erro que não
Página 80
seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não
aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso,
um grande número de recusas de resposta ou a cópia incorreta dos dados
amostrais.
Se extrairmos uma amostra cuidadosamente, de forma que ela represente
realmente a população, podemos aplicar os métodos descritos neste livro para
analisar o erro amostral, mas devemos ter o máximo de cuidado em minimizar os
erros não-amostrais.
Exercício:
1- Classifique a variável como quantitativa discreta ou quantitativa contínua:
a) População: funcionários de uma empresa. Variável: salários mensais.
b) População: computadores produzidos por uma empresa. Variável: número
de peças usadas.
c) População: jogadores de basquete de um clube. Variável: estatura.
2 . Classifique as variáveis em qualitativas ou quantitativas contínuas ou discretas:
a) População: alunos de uma escola.
Variável: cor dos cabelos
b) População: casais residentes em uma cidade.
Variável: número de filhos.
c) População: as jogadas de um dado.
Variável: o ponto obtida em cada jogada.
d) População: peças produzidas por certa máquina.
Variável: número de peças produzidas por hora.
e) População: peças produzidas por certa máquina.
Variável: diâmetro externo.
3 - uma agência de turismo tem 2.500 clientes cadastrados. Para melhor atendê-los,
foi pesquisada a preferência em relação ao tempo de duração, ao preço, ao número
de acompanhantes, ao número de passeios e à qualidade dos serviços prestados
em uma viagem. Foram consultados de modo imparcial, 700 pessoas.
a) Quantas pessoas têm a população estatística envolvida nessa pesquisa?
b) A amostra pesquisada foi de quantas pessoas?
c) Quais foram as variáveis qualitativas pesquisadas?
4- Quais são as etapas básicas do método estatístico?
5. Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma
pesquisa sobre a preferência de compra em relação a “cor”(branco, vermelho ou
azul), “preço”, “número de portas”(duas ou quatro) e “estado de conservação” (novo
ou usado). Foram consultados 210 clientes. Diante dessas informações, responda:
Página 81
a) Qual é o universo estatístico e qual é a amostra dessa pesquisa?
b) Quais são as variáveis e qual é o tipo de cada uma?
c) Quais os possíveis valores da variável “cor” nessa pesquisa?
6. Ao nascer, os bebês são pesados e medidos, para se saber se estão dentro das
tabelas de peso e altura esperados. Estas duas variáveis são:
a) Qualitativas
b) Ambas discretas.
c) Ambas contínuas.
d) Contínua e discreta, respectivamente.
e) Discreta e contínua, respectivamente.
7. Para cada uma das seguintes variáveis aleatórias, determine se a variável é
quantitativa ou qualitativa. Se quantitativa, determine se a variável de interesse é
discreta ou contínua.
a.
Número de telefones por domicílio.
b.
Tipo de telefone mais utilizado.
c.
Número de chamadas de longa distância realizadas por mês.
d.
Duração (em minutos) da mais demorada chamada de longa distância.
e.
Cor do telefone mais utilizado.
f.
Quantia em dinheiro gasto com livros.
g.
Número de livros didáticos comprados.
h.
Tempo gasto na livraria.
i.
Sexo.
j.
Principal matéria acadêmica.
k.
Número de créditos matriculados para o semestre corrente.
l.
Método de pagamento na livraria.
m.
Nome do provedor de internet.
n.
Tarifa mensal do serviço de internet.
o.
Quantidade de tempo gasto por semana navegando na internet.
p.
Número semanal de e-mails recebidos.
q.
Número mensal de compras on-line.
r.
Total gasto em compras on-line.
s.
Quantia gasta no mês passado com vestuário.
t.
Número de agasalhos que possui.
u.
Quantia de tempo gasto no mês passado comprando vestuário.
v.
Horário mais provável para compra de vestuário (comercial, à noite ou fim de
semana).
w.
Loja de departamento preferida.
x.
Número de pares de meias que possui.
y.
Número de alunos matriculados na disciplina de Estatística I.
z.
Disciplinas disponíveis para cursar no semestre corrente.
8. Identifique o tipo de amostragem utilizada: aleatória, estratificada, sistemática, por
conglomerado ou conveniência.
a.
Ao escrever um livro, o autor baseou suas conclusões em 4.500 respostas a
100.000 questionários distribuídos a mulheres.
b.
Um sociólogo seleciona 12 homens e 12 mulheres de cada uma de quatro
turmas de inglês.
c.
Um cabo eleitoral escreve o nome de cada senador em cartões separados,
mistura-os e extrai 10.
Página 82
d.
Um programa de Planejamento Familiar pesquisa 500 homens e 500
mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais.
e.
Um pesquisador médico de uma Universidade entrevista todos os portadores
de leucemia em cada um de 20 hospitais selecionados aleatoriamente.
f.
Obtém-se uma amostra de um produto extraindo-se cada 100ª unidade de
linha de montagem.
g.
Geram-se números aleatórios em um computador para selecionar números de
série de carros a serem escolhidos para uma amostra de teste.
h.
Um fornecedor de peças para automóvel obtém uma amostra de todos os
itens de cada um de 12 fornecedores selecionados aleatoriamente.
i.
Um fabricante de automóveis faz um estudo de mercado compreendendo
testes de direção feitos por uma amostra de 10 homens e 10 mulheres em cada uma
de quatro diferentes faixas etárias.
j.
Um fabricante de automóveis faz um estudo de mercado entrevistando
clientes em potencial que solicitam teste de direção a um revendedor local.
Página 83
Aula 02- Estatística I – 12/08/10
Profª Rosane Worm
Atividades
1. Explique uma forma de se obter uma amostra estratificada dos empregados de uma
empresa em que existam funcionários de escritório, funcionários de produção e vendedores.
2. Numa escola com 1200 alunos, foi feito um recenseamento, recolhendo-se dados referentes
às seguintes variáveis:
Idade dos alunos; anos de escolaridade; meio de transporte utilizado para ir à escola; local de
almoço; número de irmãos; local de trabalho; número de televisores em casa; local de moradia.
a) Das variáveis observadas, quais são quantitativas e quais são qualitativas?
b) Como organizar uma amostra simples e uma sistemática para fazer esse recenseamento?
3. Deseja-se fazer uma pesquisa em uma população constituída por um número maior de
homens que de mulheres. Como você faria para selecionar uma amostra:
a) com o mesmo número de homens e de mulheres?
b) Com mais mulheres que homens?
4. Suponha que 40% da população mencionada no problema anterior seja constituída por
mulheres. Numa amostra estratificada proporcional formada por 50 indivíduos, qual seria o
número de homens e o de mulheres? E numa amostra composta de 150 pessoas, quais seriam
esses números?
5. Uma empresa de publicidade quer fazer um estudo sobre o interesse despertado por certa
propaganda entre os alunos de 10 anos de idade das escolas de Ensino Fundamental de uma
cidade. Para isso, pretende estratificar uma amostra de 300 crianças.
Como a empresa poderia fazer essa amostra a partir dos dados da tabela abaixo?
Escola
A
B
C
D
E
População
400
300
350
450
520
Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e
visando ao desenvolvimento Regional”.
Página 84
F
300
DESCRIÇÃO DE POPULAÇÃOES E AMOSTRAS COM TABELAS
Representação tabular
Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem
assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis,
apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras
informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas
e pedagógicas mais coerentes e científicas.
TABELA:
É um quadro que resume um conjunto de dados dispostos segundo linhas e
colunas de maneira sistemática.
•
De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos
colocar :
 um traço horizontal ( - ) quando o valor é zero;
 três pontos ( ... ) quando não temos os dados;
 zero ( 0 ) quando o valor é muito pequeno para ser expresso pela
unidade utilizada;
 um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de
determinado valor.
Obs.: O lado direito e esquerdo de uma tabela oficial deve ser aberto.
Elementos Essenciais e Facultativos de uma Tabela:
Podemos determinar que uma tabela estatística é formada por elementos facultativos e
por elementos essenciais:
ELEMENTOS ESSENCIAIS
Título: É a parte superior que
procede a tabela e que contém a
designação do fato observado, o local e a
época em que foi registrado.
Corpo: É o conjunto de colunas e
linhas, respectivamente, em ordem vertical
e horizontal, que contém as informações
sobre o fato observado.
Cabeçalho: É a parte da tabela que
especifica o conteúdo das colunas.
Coluna Indicadora: É a parte da
tabela que especifica o conteúdo das
colunas no sentido vertical.
.
ELEMENTOS FACULTATIVOS
Fonte: É a indicação da entidade
responsável pelo fornecimento dos dados.
Notas: São as informações
destinadas a esclarecer o conteúdo das
tabelas.
Chamadas: São as informações
utilizadas para esclarecer certas minúcias
em relação as linhas e colunas.
Obs. Todos os elementos
facultativos de uma representação tabular
estão situados no rodapé.
Página 85
CORPO
Fonte: IBGE ( rodapé)
Listando dados numéricos
Em geral, listar, e portanto, organizar dados é a primeira etapa em qualquer tipo de
análise estatística. Como situação típica, consideremos os dados seguintes, que representam o
comprimento (em centímetros) de 60 sardinhas pescadas em uma colônia de pescadores:
17,2
16,5
16,5
20,0
17,8
24,2
18,8
17,8
18,5
22,8
22,7
21,0
20,7
17,9
20,7
21,4
24,7
24,4
22,6
24,7
20,0
19,2
22,7
18,8
18,6
20,7
21,9
22,5
22,4
17,5
18,3
20,9
17,6
20,8
18,3
18,8
22,7
25,0
23,4
24,4
24,2
17,2
24,0
21,0
16,5
17,0
23,1
24,6
20,0
17,2
24,0
18,9
16,7
21,2
22,4
18,4
22,5
16,7
16,1
18,6
A coleta desses dados por si só já não é tarefa simples, mas deveria ser evidente que é
preciso fazer muito mais para tornar os números compreensíveis. Seria interessante se
soubéssemos os valores extremos (menor e maior valor). Ocasionalmente, é útil dispor os
dados de maneira crescente ou decrescente. A listagem a seguir dos comprimentos das
sardinhas está arranjada em ordem crescente:
16,1
17,5
18,6
20,7
22,4
24,0
16,5
17,6
18,8
20,7
22,5
24,0
16,5
17,8
18,8
20,8
22,5
24,2
16,5
17,8
18,8
20,9
22,6
24,2
16,7
17,9
18,9
21,0
22,7
24,4
16,7
18,3
19,2
21,0
22,7
24,4
17,0
18,3
20,0
21,2
22,7
24,6
17,2
18,4
20,0
21,4
22,8
24,7
17,2
18,5
20,0
21,9
23,1
24,7
17,2
18,6
20,7
22,4
23,4
25,0
Esta listagem de dados ordenados, também, no meio estatístico como ROL.
SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de
dados estatísticos em função da época, do local ou da espécie.
SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta
ou descontínua. Podem ser do tipo temporal, geográfica ou específica.
Página 86
Séries históricas, cronológicas ou temporais
É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia
o tempo e permanece constante o fato e o local.
Tabela 1. PREÇO DO ACÉM NO VAREJO
EM SÃO PAULO – 1989-94
ANOS
1989
1990
1991
1992
1993
1994
Tabela 2. Produção de Petróleo Bruto no
Brasil
De 1976 a 1980 (x1000m3)
PREÇO MÉDIO
(US$)
2,24
2,73
2,12
1,89
2,04
2,62
Anos
1976
1977
1978
1979
1980
Produção
9.702
9.332
9.304
9.608
10.562
Fonte: Conjuntura Econômica (fev. 1983)
Fonte: APA
Séries geográficas, espaciais, territoriais ou de localização
É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e
permanece constante a época e o fato.
Tabela 3. EXPORTAÇÃO BRASILEIRA
1985
Tabela 4. População Urbana do Brasil em
1980(x1000)
IMPORTADORES
América Latina
EUA e Canadá
Europa
Ásia e Oceania
África e Oriente Médio
Região
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
(%)
13,0
28,2
33,9
10,9
14,0
Fontes: MIC e SECEX.
Produção
3.037
17.568
42.810
11.878
5.115
Fonte: Anuário Estátistico (1984)
Séries específicas ou categóricas
É a série cujos dados estão dispostos em correspondência com a espécie ou
qualidade, ou seja, varia o fato e permanece constante a época e o local.
Tabela 5. PRODUÇÃO BRASILEIRA DE
AÇO BRUTO EM 1991 (em toneladas)
PROCESSOS
Oxigênio
básico
Forno elétrico
EOF
1991
17.934
4.274
409
Fonte: Instituto Brasileiro de Siderurgia.
SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas
à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de
classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográficatemporal.
Tabela 6. População Urbana do Brasil por Região de 1940 a 1980 (x1000)
Anos
N
NE
REGIÕES
SE
S
CO
Página 87
1940
1950
1960
1970
1980
406
581
958
1.624
3.037
3.381
4.745
7.517
11.753
17.567
7.232
10.721
17.461
28.965
42.810
1.591
2.313
4.361
7.303
11.878
271
424
1.007
2.437
5.115
Fonte: Anuário Estatístico (1984)
1. Classifique as seguintes séries:
b) AVICULTURA BRASILEIRA 1992
a) PRODUÇÃO DE BORRACHA
NATURAL
ANOS
1991
1992
1993
TONELADAS
29.543
30.712
40.663
ESPÉCIE
Galinhas
Galos, frangos e pintos
Codornas
Fonte: IBGE
NÚMERO
(1.000 cabeças)
204.160
435.465
2.488
Fonte: IBGE
c) VACINAÇÃO CONTRA A
DE AVIÃO
POLIOMIELITE – 1993
REGIÕES
QUANTIDADES
Norte
211.209
Nordeste
631.040
Sudeste
1.119.708
Sul
418.785
Centro185.823
Oeste
FONTE: Ministério da Saúde
d) AQUECIMENTO DE UM MOTOR
DE MARCA X
MINUTOS
0
1
2
3
4
5
6
Dados fictícios
TEMPERATURA
( °C )
20
27
34
41
49
56
63
2.
De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsitos, 27306
casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478
condutores.. Faça uma tabela para representar esses dados.
3.
De acordo com o ministério dos transportes, em 1998, o tamanho das malhas de
transporte no Brasil é assim distribuído: 320480 km de rodovias (estradas municipais não estão
incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias
(desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para representar
esses dados.
4.
De acordo com o Ministério de Educação a quantidade de alunos matriculados no ensino
de 1º grau no Brasil nos anos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 –
21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para representar esses dados.
5.
Estabelecimentos de ensino da região norte do Brasil em 1982 subdividiam-se em:
Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e
Página 88
9 estabelecimentos de ensino, respectivamente, segundo o MEC. Faça uma tabela para
apresentar esses dados.
6.
De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986,
segundo a causa atribuída, foi a seguinte: 263 alcoolismo, 198 por dificuldade financeira, 700
por doença metal, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras
causas. Apresente essa distribuição em uma tabela.
Página 89
Aula 3 – Estatística I – 19/08/10
Profª Rosane Worm
Distribuição de Freqüência
A freqüência é o número de repetições da observação no conjunto de observações.
A distribuição de freqüência de uma série de observações é uma função que representa os
pares de valores formados por cada observação e seu número de repetições.
Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS
PELOS FUNCIONÁRIOS DA EMPRESA Z
Salários
semanais (R$)
150 ├ 154
154 ├ 158
158 ├ 162
162 ├ 166
166 ├ 170
170 ├ 174
Total
Quantidade( fi)
4
9
11
8
5
3
40
FONTE: PESQUISA DO SETOR DE PESSOAL
Na construção de tabelas de freqüências, devemos observar as seguintes diretrizes:
1. As classes devem ser mutuamente excludentes, ou seja, cada valor original deve pertencer
exatamente a uma e só uma classe.
2. Todas as classes devem ser incluídas, mesmo as de freqüência zero.
3. Procurar utilizar a mesma amplitude para todas as classes, embora eventualmente seja
impossível evitar intervalos com extremidade aberta.
4. Escolher números convenientes para limites de classe. Arredondar para cima a fim de ter
menos casas decimais, ou utilizar números adequados à situação.
5. Utilizar entre 5 e 20 classes.
6. As somas das freqüências das diversas classes deve ser igual ao número de observações
originais.
Elementos de uma Distribuição de Freqüência
1. Classe: Classes de freqüência ou, simplesmente, classe são intervalos de variação da
variável.
As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o
número total de classes da distribuição).
Exemplo: O intervalo 154 ├ 158 define a segunda classe (i = 2)
A distribuição é formada por seis classes, podemos afirmar que i = 6.
2. Limites de Classe: Determinam-se limites de classes os extremos de cada classe. O
menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da
classe ( ls ).
Exemplo: Na terceira classe do exemplo acima, temos: li 3 = 158 e Ls 3 = 162
3. Amplitude de um Intervalo de Classe (h): É a medida de intervalo que define a classe.
Ela é obtida pela diferença entre os limites superior e inferior. Assim:
Página 90
h = ls − li
Exemplo: o intervalo de classe do exemplo acima é 4, pois 162 ├ 158 = 4
4. Amplitude Total ( AT) : É a diferença entre o valor máximo e o valor mínimo da amostra.
AT = Vmax - Vmin
Exemplo: A amplitude amostral do exemplo acima é 24, pois 174 ├150 = 24
5.Ponto Médio de uma Classe ( Xi) : É o ponto que divide o intervalo de classe em duas
partes iguais.
Xi =
li + ls
2
Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156.
6. TIPOS DE FREQUÊNCIAS




Freqüência absoluta (fi). É o número de repetições de um valor individual ou
de uma classe de valores da variável.
Freqüência relativa (fri ou fri%) Representa a proporção de observações de
um valor individual ou de uma classe, em relação ao número total de
observações, ou seja, é o número de repetições dessa observação dividida
pelo tamanho da amostra.
Freqüência absoluta acumulada (Fi). É a soma das freqüências daquela
classe e de todas as classes que a antecedem.
Freqüência relativa acumulada (Fri ou Fri%). É a Fi dividida pelo total de
observações (n).
Freqüência Simples ou Absoluta (fi): É o número de observações correspondentes a uma
classe. A soma de todas as freqüências é representada por:
N = ∑ fi ( população )
n = ∑ fi ( amostra )
Exemplo: Para a distribuição em estudo, temos: n = ∑ fi = 40
Freqüência Acumulada ( F i )
É o total das freqüências de todos os valores inferiores ao limite superior.
do intervalo de uma dada classe.
Fi = f 1 + f 2 + ... + fi
ou Fi = ∑ fi
Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso
exemplo:
Página 91
Freqüências Relativas simples (f ri )
São os valores da razão entre as freqüências simples e a freqüência total.
fi
fri =
n
Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo:
Freqüência Acumulada Relativa ( F ri )
É a freqüência acumulada da classe, dividida pela freqüência total da distribuição.
Fri =
Fi
n
Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa?
7. Número de Classes: Pode-se utilizar a regra de STURGES, que fornece o número de
classes em função do total de casos:
K = 1 + 3,33 log n( N )
Onde:
K é o número de classes;
N ou n é o número total de observações.
Para determinar a amplitude do intervalo de classe, temos:
H
h=
K
SIMBOLOGIA ENTRE OS VALORES DE CLASSE:




Inclui o valor da esquerda mas não o da direita.
Inclui o valor da direita mas não o da esquerda.
Não inclui nem o valor da direita, nem o da esquerda.
Inclui tanto o valor da direita quanto o da esquerda.
– Distribuição de Freqüência sem Intervalos de Classe
Quando se trata de variáveis discretas de variação relativamente pequena, cada valor pode
ser tomado como um intervalo de classe.
Ex: Uma professora organizou os resultados obtidos em uma prova da seguinte forma:
4–5–7–9–9–4–5–7–9–9–4–5–7–9–9–4–6–8–9–9–4–6–8–9–9
Nota
Nº de alunos
Total
Página 92
EXERCÍCIO
1. Complete a seguinte tabela e responda as seguintes perguntas:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS
PELOS FUNCIONÁRIOS DA EMPRESA Z
Salários semanais Freqüências Xi
% fr i
Fi
Fr i %
(R$)
150 ├ 154
4
154 ├ 158
9
158 ├ 162
11
162 ├ 166
8
166 ├ 170
5
170 ├ 174
3
Total
40
100
FONTE: PESQUISA DO SETOR DE PESSOAL
a) Quantos empregados têm salário entre R$ 154, inclusive, e R$ 158?
b) Qual a percentagem de empregados cujos salários são inferiores a R$ 154?
c) Quantos empregados têm salário abaixo de R$ 162?
d) Quantos empregados têm salário não inferior a R$ 158?
1. Conhecidas as notas de 50 alunos:
33
41
50
55
60
35
42
52
55
61
35
45
53
56
64
39
47
54
57
65
41
48
55
59
65
66
67
68
68
69
71
73
73
73
74
74
76
77
78
80
81
84
85
85
88
89
91
94
94
98
Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10
para intervalo das classes.
Página 93
2. Os resultados do lançamento de um dado 50 vezes foram os seguintes
6
5
2
6
4
3
6
2
6
5
1
6
3
3
5
1
3
6
3
4
5
4
3
1
3
5
4
4
2
6
2
2
5
2
5
1
3
6
5
1
5
6
2
4
6
1
5
2
4
3
Forme uma distribuição de freqüência sem intervalos de classe.
4) Abaixo são mostrados os saldos médios amostrais de 48 contas de clientes do BB S.A. (
dados brutos em US$ 1,00).
120
150
150
150
150
150
225
225
230
250
250
270
275
275
275
300
350
360
375
375
375
450
450
470
475
500
500
500
500
500
550
600
600
600
650
650
700
750
750
800
800
900
950
1000
1000
1000
1000
1000
Pede-se:
a) agrupar os dados numa distribuição de freqüências com intervalo de classes (use Teorema
de STURGES);
b) determine as freqüências simples e acumuladas (absolutas e relativas);
c) calcule a interprete: fr2, f3 e Fr4 - Fr2;
5. Considere a seguinte distribuição de freqüência correspondente aos diferentes preços
de um determinado produto em 20 lojas pesquisadas.
Preços ($)
50
51
52
53
54
Total
Número de lojas
2
5
6
6
1
20
a) Quantas lojas apresentaram um preço de $52,00?
b) Construa uma tabela de freqüências simples relativas.
c) Construa uma distribuição de freqüência acumulada relativa.
d) Quantas lojas apresentaram um preço de até $51,00 (inclusive)?
e) Qual a porcentagem de lojas com preço maior que $52,00?
f) Qual a porcentagem de lojas com preço maior do que $51,00 e menor do que
$54,00?
Página 94
6. Com referência tabela abaixo
Distribuição de freqüência de Diárias
para 200 apartamentos
Diárias (R$)
Número de apartamentos
150 |--- 180
3
180 |--- 210
8
210 |--- 240
10
240 |--- 270
13
270 |--- 300
33
300 |--- 330
40
330 |--- 360
35
360 |--- 390
30
390 |--- 420
16
420 |--- 450
12
200
Total
Responda:
a) Quais os limites (inferior e superior) da primeira classe?
b) A amplitude dos intervalos de classe é a mesma para todas as classes?
c) Suponha um aluguel mensal de $239,50. Identificar os limites superior e inferior da
classe na qual esta observação seria registrada.
d) Construir a distribuição de freqüência simples relativa.
e) Construir a distribuição de freqüência acumulada.
Página 95
Aula 4 – Estatística I – 26/08/10
Profª Rosane Worm
Representação Gráfica
Com as tabelas de freqüência, podemos identificar a natureza geral da
distribuição dos dados, bem como construir gráficos que facilitem a visualização
dessa distribuição. O gráfico estatístico é uma forma de apresentação dos
dados, onde o objetivo é o de produzir, no investigador ou no público em geral,
uma impressão mais rápida e visual do fenômeno em estudo.
Excelência gráfica
1.
É uma apresentação bem elaborada de dados, que fornece substância,
estatísticas e formas;
2.
Comunica idéias complexas com clareza, precisão e eficiência;
3.
Fornece ao observador o maior número de idéias, no menor espaço de
tempo, com o menor volume de impressão;
4.
Exige que seja transmitida a verdade sobre os dados.
Vejamos alguns tipos de gráficos
Histogramas
É utilizado para descrever dados numéricos que tenham sido agrupados
na forma de distribuições de freqüências ou distribuições de freqüências relativas.
Ao desenhar um histograma, a variável aleatória de interesse é exibida ao
longo do eixo horizontal (eixo X). O eixo vertical (eixo Y) representa o número
(freqüência), proporção ou porcetagem de observações por intervalo de classe.
Altura em centímetros de 160 alunos do
curso de estatística
Fonte: Departamento de Estatística
Idade (em anos) de um grupo de 30 Clientes de uma loja de
calçados em Santa Cruz do Sul
Página 96
14
Número de Pessoas
12
10
8
6
4
2
0
15|---26
26|---37
37|---48
48|---59
59|---70
Idade (Anos)
Histograma da Percentagem de Fundos de Alto Risco
35%
Percentagem
30%
25%
20%
15%
10%
5%
0%
---
-20
0
20
40
60
80
100
Pontos Médios da Classe
Como se interpreta um histograma?
Este gráfico é utilizado para variáveis contínuas.
Características:
- Cada barra representa a freqüência do intervalo respectivo;
- Os intervalos devem ter a mesma amplitude;
- As barras devem estar todas juntas.
A simples observação da forma do histograma permite algumas
conclusões. Veja a figura. Os dados têm uma tendência central. As freqüências
mais altas estão no centro da figura. Nos processos industriais, esta é a forma
desejável.
Página 97
Histograma
A figura ao lado apresenta um
histograma com assimetria positiva. A
média dos dados está localizada à
esquerda do centro da figura e a cauda à
direita é alongada. Esta ocorre quando o
limite inferior é controlado ou quando não
podem ocorrer valores abaixo de
determinado limite.
Histograma com
assimetria positiva
A figura apresenta um histograma com
assimetria negativa. A média dos dados está
localizada à direita do centro da figura e a
cauda à esquerda é alongada. Esta forma
ocorre quando o limite superior é controlado ou
quando não podem ocorrer valores acima de
certo limite.
Histograma com
assimetria negativa
Histograma em plateau, isto é, com
exceção das primeiras e das últimas classes,
todas as outras têm freqüências quase iguais.
Essa forma ocorre quando se misturam várias
distribuições com diferentes médias.
Histograma em plateau
Página 98
A figura mostra um histograma com dois
picos, ou duas modas. As freqüências são
baixas no centro da figura, mas existem dois
picos fora do centro. Esta forma ocorre quando
duas distribuições com médias bem diferentes
se misturam. Podem estar misturados, por
exemplo, os produtos de dois turnos de
trabalho.
Histograma com
Dois picos
Os histogramas também mostram o grau de dispersão da variável. O
histograma à esquerda mostra pouca dispersão, mas o histograma à direita
mostra grande dispersão.
Histogramas com dispersões diferentes
 Gráficos em Linhas
Usado principalmente para ilustrar uma série temporal.
Produção de Petróleo Bruto no
Brasil de 1976 a 1980 (x1000 m³)
Fonte: Conjuntura Econômica (Fev. 1983)
Página 99
Gráfico de linhas comparativas
População Urbana do Brasil por
Região de 1940 a 1980 (x 1000)
Fonte: Conjuntura Econômica (1984)
 Gráficos de colunas ou barras
Representação gráfica da distribuição de freqüências. Este gráfico é
utilizado para variáveis nominais e ordinais.
Características:
• Todas as barras devem ter a mesma largura
• Devem existir espaços entre as barras
Gráfico de Colunas
Usado para ilustrar qualquer tipo de série.
População
População Urbana do Brasil em 1980 (x 1000)
45000
40000
35000
30000
25000
20000
15000
10000
5000
0
42810
17568
11878
5115
CO
3037
S
SE
NE
N
Regiões
Fonte: Anuário Estatístico (1984)
Página 100
Fonte: Anuário Estatístico (1984)
As larguras das barras que deverão ser todas iguais podendo ser adotado
qualquer dimensão, desde que seja conveniente e desde que não se
superponham. O número no topo de cada barra pode ou não ser omitido, se forem
conservados, a escala vertical pode ser omitida.
Gráfico de colunas comparativas
a. Colunas Justapostas (gráfico comparativo)
População Urbana do Brasil por Região de
1940 a 1980 (x1000)
Fonte: Anuário Estatístico (1984)
b. Colunas Sobrepostas (gráfico comparativo)
População Urbana do Brasil por Região de
1940 a 1980 (x 1000)
Página 101
Fonte: Anuário Estatístico (1984)
Gráfico de Barras
As regras usadas para o gráfico de barras são iguais as usadas para o
gráfico de colunas.
População Urbana do Brasil em 1980 (x
1000)
3037
N
17568
NE
42810
SE
11878
S
CO
5115
0
10000
20000
30000
40000
50000
Fonte: Anuário Estatístico (1984)
Assim como os gráficos de Colunas podem ser construídos gráficos de
barras comparativas.
 Gráficos circulares ou de Setores
Representação gráfica da freqüência relativa (percentagem) de cada
categoria da variável. Este gráfico é utilizado para variáveis nominais e ordinais. É
uma opção ao gráfico de barras quando se pretende dar ênfase à comparação das
percentagens de cada categoria. A construção do gráfico de setores segue uma
regra de 3 simples, onde as freqüências de cada classe correspondem ao ângulo
que se deseja representar em relação à freqüência total que representa o total de
360.
Características:
Página 102
• A área do gráfico equivale à totalidade de casos (360º = 100%);
• Cada “fatia” representa a percentagem de cada categoria.
População Urbana e Rural do Brasil em 1980 (x 1000)
32%
Urbana
Rural
68%
Fonte: Anuário Estatístico (1984)
População Urbana e Rural do
Brasil em 1980 (x 1000)
32%
Urbana
Rural
68%
Fonte: Anuário Estatístico (1984)
Gráfico Pictorial - Pictograma
Tem por objetivo despertar a atenção do público em geral, muito desses
gráficos apresentam grande dose de originalidade e de habilidade na arte de
apresentação dos dados.
Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)
Página 103
Fonte: Grandes números da educação brasileira março de 1996
Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes
entrevistados no Canadá
Gráfico Polar (radar)
É o tipo de gráfico ideal para representar séries temporais cíclicas, ou
seja, toda a série que apresenta uma determinada periodicidade.
Precipitação pluviométrica do município de Santa Maria – RS- 1999
Fonte: Base Aérea de Santa Maria
Página 104
 Cartograma
É a representação de uma carta geográfica. Este tipo de gráfico é
empregado quando o objetivo é o de figurar os dados estatísticos diretamente
relacionados com as áreas geográficas ou políticas.
Brasil
por vendas (em mil reais)
144
237
300
440
320
Atividades
1. O gráfico a seguir ilustra o número de inscritos nos últimos quatro
vestibulares que disputaram as vagas oferecidas pela Universidade de
São Paulo (USP) e pelas universidades federais do Rio de Janeiro
(UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS).
Fonte: Época 26/04/99 (com adaptações)
Com base nessas informações, julgue os itens seguintes como verdadeiro
ou falso:
a. De 1997 a 1998, o crescimento percentual do número de inscritos na
USP foi maior que o da UFRGS. (___)
b. Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano.
(___)
c. Todas as universidades tiverem crescimento no número de inscritos no
referido período. (___)
d. A UFRGS foi a única que apresentou crescimento no número de
inscritos. (___)
Página 105
e. A UFMG teve um crescimento de mais de 100% no número de
inscritos no período. (___)
f. A UFRGS teve um crescimento de 3,74%, 36,17% em 97 e 98,
respectivamente, e uma redução de cerca de 3,17% no número de
inscritos em 99.
2. Numa turma de cursinho de informática, a distribuição das idades dos
alunos, segundo o sexo, é dada pelo gráfico seguinte.
Com base nos dados do gráfico, pode-se afirmar que:
a. o número de meninas com, no máximo, 16 anos é maior que o
número de meninos nesse mesmo intervalo de idade. (___)
b. o número total de alunos é 19. (___)
c. a média de idade das meninas é 15 anos. (___)
d. o número de meninos é igual ao número de meninas. (___)
e. o número de meninos com idade maior que 15 anos é maior que o
número de meninas nesse mesmo intervalo de idades. (___)
3.
Considere os dados referentes ao consumo de água, em m3, de 75 contas
da CORSAN.
32
45
33
51
28
40
25
48
12
37
22
10
20
19
26
11
18
12
15
44
34
23
31
41
11
40
35
39
29
53
16
22
17
25
38
26
30
58
13
46
23
14
19
23
17
31
18
16
32
36
27
20
12
14
28
10
13
21
27
49
38
24
15
43
56
17
35
12
37
19
13
29
20
21
11
a.
agrupar os dados em uma distribuição de freqüência. Utilize o limite
inferior da distribuição igual a zero na primeira classe e amplitude de classe 10.
b.
determine as freqüências simples e acumuladas ( absolutas e
relativas);
c.
calcule e interprete: fr 2 , f 3 e Fr 4 – Fr 2 ;
d.
construa o correspondente histograma de freqüências relativas.
5. Abaixo são mostrados os saldos médios em R$ de 48 contas de clientes do BB
Novo S.A.
450 500 150 1000 250 275 550 500 225 475 150 450 950 300 800 275
600 750 375 650 150 500 1000 700 475 900 800 275 600 750 375 650
150 500 225 250 150 120 250 360 230 500 350 375 470 600 1030 270
Página 106
a.
b.
c.
Agrupe os dados numa distribuição de freqüências.
Determine as freqüências relativas: simples e acumulada.
Apresente o histograma de freqüências relativas.
6. Conhecidas as notas de 50 alunos:
33
35
35
39
39
40
40
40
41
41
41
42
45
47
48
50
52
53
54
55
55
59
60
61
64
65
65
66
66
67
68
69
71
73
74
74
76
77
77
80
84
85
88
89
94
94
97
97
100
100
a) Construa uma tabela de freqüências usando a regra de Sturges.
b) Construa o histograma e o polígono de freqüências.
7- Em uma eleição concorreram os candidatos A, B e C e, apurada a primeira
urna, os votos foram os seguintes: A: 50 votos; B: 80 votos; C: 60 votos; brancos e
nulos: 10 votos.A partir desses dados construa:
a) O gráfico de barras horizontal
8- Construa os gráficos de barras verticais e de setores para a variável hobby .
Hobby
Esporte
Música
Patinação
Dança
Freqüência
8
6
3
7
Página 107
Aula 5 – Estatística I- 02/09/10
Profª Rosane Worm
MEDIDAS DE TENDÊNCIA CENTRAL
Uma medida de tendência central é um valor no centro ou no
meio de um conjunto de dados.
Estudaremos aqui:
 Médias: aritmética, geométrica, ponderada e móvel
 Mediana
 Moda
 Ponto médio.
1. Média aritmética
A média (aritmética) é, de modo geral, a mais importante de todas as
mensurações numéricas descritivas.
A média aritmética de um conjunto de valores é o
resultado da divisão da soma de todos os elementos desse
conjunto pelo número de elementos do conjunto.
Representamos a média pelo símbolo:
x  Média da amostra (leia-se “x barra”)
µ  média da população (minúscula grega: mi)
então
Σxi
n
Σx
Média de uma população: µ = i
N
Média de uma amostra: x =
Onde,
n é o tamanho da amostra.
N é o tamanho da população.
Σ indica um somatório de valores (sigma maiúsculo).
Ex. Selecionados aleatóriamente 10 alunos da turma, e obtemos as
seguntes alturas (em m):
1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 1,77 1,59
Calcule a média das alturas.
Solução: Como se trata de uma amostra:
Σxi 1,76+1,73+1,80+1,65+1,70+1,74+1,81+1,63+1,77+1,59 17,18
=
x =
=
= 1, 718
10
10
n
Página 108
Média Aritmética Ponderada – dados agrupados
Sem intervalos de classe: As freqüências são números indicadores da
intensidade de cada valor da variável, elas funcionam como fatores de
ponderação, o que leva a calcular a média aritmética ponderada.
µ=
∑ xi. fi
N
X =
( população )
∑ xi. fi
n
( amostra )
Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos,
adotando-se a variável “número de filhos do sexo masculino”, determine a
média.
N.º de Meninos
0
1
2
3
4
fi
2
6
10
12
4
Σ = 34
Com intervalos de classe: Convenciona-se que todos os valores incluídos
em um determinado intervalo de classe coincidem com o seu ponto médio, e
determina-se a média aritmética ponderada.
µ=
∑ xi. fi
( população )
N
onde Xi é o ponto médio da classe.
X =
∑ xi. fi
n
( amostra )
Exemplo:
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais
Freqüências
(R$)
150 ├ 154
4
154 ├ 158
9
158 ├ 162
11
162 ├ 166
8
166 ├ 170
5
170 ├ 174
3
Total
40
FONTE: PESQUISA DO SETOR DE PESSOAL
Página 109
Média Geométrica Simples
Para uma seqüência numérica x: x 1 , x 2 , ......., x n , a média geométrica simples,
que designaremos por
xg
, é definida por:
Exemplo: Se X: 2, 4, 6, 9, então:
xg =
4
2.4.6.9 =
4
432 = 4,559
Média Geométrica Ponderada
Para uma seqüência numérica x: x 1 , x 2 , ...., x n afetados de pesos p 1 , p 2 , ..., p n
respectivamente, a média geométrica ponderada que designaremos por x g é
definida por:
Exemplo: Se x: 1, 2, 5, com pesos 3, 3, 1 respectivamente então:
xg =
7
13.2 3.51 =
7
1.8.5 =
7
40 = 1,6938
Observando-se que:
A média geométrica só é indicada para representar uma série de valores
aproximadamente em progressão geométrica.
Os casos anteriores não são muito freqüentes nas aplicações. Vamos
restringir o desenvolvimento de médias ao caso de média aritmética, que é a
média mais utilizada nas aplicações.
4. Média Móvel
Uma média, como o nome diz, mostra o valor médio de uma amostra de
determinado dado. Uma média móvel aritmética (MMA) é uma extensão desse
conceito, representando o valor médio, normalmente dos preços de fechamento,
em um período de tempo.
Exemplo: A média móvel simples é calculada pela formação do preço médio
por um número específico de períodos. Para o cálculo usamos o preço de
fechamento. Por exemplo: Vamos utilizar a média dos últimos 10 dias. Devemos
somar os preços finais durante os últimos 10 dias e dividir o total por 10.
Página 110
10+11+12+13+14+15+16+17+18+19=145
(145/10) = 14,50
Devemos repetir este cálculo conforme o passar dos dias, assim, as médias
vão se juntando e formando uma linha. Se continuarmos com o nosso exemplo, o
próximo preço final na média será 20, então teremos um novo período, somando o
último dia (20) e removendo o primeiro da lista (10). Continuando com a média dos
últimos 10 dias, a média móvel simples deverá ser calculada da seguinte maneira:
11+12+13+14+15+16+17+18+19+20=155
(155/10) = 15,50
Repare que removemos o primeiro dia da lista (10) para incluir o novo dia
(20).
Durante os últimos dois dias, a média moveu-se de 14,50 para 15,50. Como
são somados novos dias, os antigos serão removidos e a média permanece se
movendo com o passar do tempo.
No modelo da média móvel, a projeção yˆ t +1 é calculada com a fórmula:
yˆt +1=
t
1
× ∑ yi
k i =t − k +1
Ou, média móvel de ordem k:
yˆt +1 =
Yt + Yt −1 + Yt − 2 + ... + Yt − k +1
k
EXERCÍCIOS
1.
As notas finais de 15 alunos de um curso de computação estão
apresentadas abaixo. Qual a média das notas obtidas?
7,5 9,0 4,5 4,0 5,5 8,0 8,5 9,0 7,5 7,5 7,0 6,5 7,5 9,0 6,5
NOTAS
2.
Os dados abaixo referem-se ao tempo de vida útil, em anos, de
determinado aparelho eletrônico:
5 – 5 – 6 – 4 – 20
Calcule a média aritmética simples.
Página 111
3.
No ano 2000, o número de nascimentos, por mês, em uma maternidade
foi:
MÊS Jan. Fev. Março Abril Maio Junho Julho Agosto Set. Out. Nov. Dez.
NASC. 38
25
42
30
29
47
18
36
38
43
49
37
a) Calcule a média mensal de nascimentos.
b) Em que meses o número de nascimentos ficou acima da média?
4.
A classificação final para um determinado curso é a média ponderada
das provas de capacidade geral, com peso 3, e das provas de
capacidade específica, com peso 2. Nessas condições, qual é a
classificação final de um aluno que obteve 162 pontos na prova de
capacidade geral e 147 pontos na prova de capacidade específica?
5.
O quadro de distribuição de freqüências representa os salários mensais
de 40 empregados de uma firma.
CLASSE (EM
REAIS)
180 ├ 200
200 ├ 220
220 ├ 240
240 ├ 260
260 ├ 280
PONTO MÉDIO DA
CLASSE ( X I )
190
210
230
250
270
FREQÜÊNCIA (
fi )
4
18
10
5
3
Calcule o salário médio mensal dos empregados dessa firma.
6.
Calcule a média geométrica para as séries:
X : 1, 2, 4, 7, 16
Y : 81, 26, 10, 3, 1
7.
Calcule a média aritmética da série:
xi
2
3
4
5
fi
1
4
3
2
Página 112
Aula 6 – Estatística I – profª Rosane Worm
09/09/2010
A Mediana
A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão
dispostos em ordem crescente (ou decrescente). A mediana é representada geralmente por ~
x (lê-se: “x til”) ou
pode também ser representada com o símbolo md..
Para calcular a mediana, primeiro coloque os valores em ordem (crescente ou decrescente); em seguida
aplique um dos dois processos a seguir:
 Se o número de valores é ímpar, a mediana é o número localizado exatamente no meio da
lista.
 Se o número de valores é par, a mediana é a média dos dois valores do meio.
Exemplo 1. Calcule a mediana da altura de 7 alunos da turma.
1,76 1,73 1,80 1,65 1,70 1,74 1,81
Exemplo 2. Calcule a mediana da altura de 8 alunos da turma.
1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63
Moda
A moda de um conjunto de dados é o valor que ocorre com maior freqüência.
Quando dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda, e o
conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é
uma moda, e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda (amodal).
Costuma-se denotar a moda por Mo.
Exemplo 1. Um estudo sobre tempos de reação abrangeu 30 canhotos, 50 destros e 20 ambidestros.
Qual é a moda das características citadas.
Exemplo 2. Determine a moda dos seguintes conjuntos de dados:
a. 5 5
5
3
1
5
1
4
3
5
b. 1 2
2
2
3
5
6
6
6
7
c. 1 2
3
6
9
4
Ponto Médio
O ponto médio é o valor que está a meio caminho entre o maior e o menor valor. Para obtê-lo,
somamos esses valores extremos e dividimos o resultado por 2, como na fórmula a seguir:
ponto médio =
maior valor + menor valor
2
Embora o ponto médio não seja muito usado, incluímo-lo aqui para enfatizar o fato de que há
diferentes maneiras de definir o centro de um conjunto de dados.
Ao nos referirmos ao valor médio de um conjunto de dados, devemos ser precisos, mencionando o
termo exato, como média, mediana, moda ou ponto médio.
Página 113
Exemplo. Calcule o ponto médio da altura de 8 alunos da turma.
1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63
Regra do Arredondamento
Eis uma regra simples para arredondamento de respostas:
“Tome uma decimal a mais, além das que aparecem nos dados.”
Devemos arredondar apenas a resposta final, e não os valores intermediários. Por exemplo,
a média de 2, 3, 5 é 3,33333333..., que deve ser arredondada para 3,3. Como os dados originais são expressos
em números inteiros, arredondamos a resposta para o décimo mais próximo. Outro exemplo: a média de 2,1, 3,4
e 5,7 é arredondada para 3,73 com duas decimais (uma a mais em relação às que figuram nos valores originais).
Atividades
1.
As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25, 26, 18, 19, 18, 20,
21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a média, moda, mediana e ponto médio de
idade desse grupo de pessoas.
2.
Calcule a média para a amostra abaixo que representa as pessoas apresentados na questão anterior:
PESOS ( Kg)
fi
45 |--- 50
2
50 |--- 55
5
55 |--- 60
8
60 |--- 65
5
65 |--- 70
3
70 |--- 75
2
3.
Numa faculdade obtiveram-se amostras de carros de estudantes e carros de professores e funcionários da
faculdade, com as respectivas idades (em anos). Essas idades estão resumidas na tabela de freqüência a seguir.
Ache a idade média de ambos os grupos de carros. Encontre também a classe modal e a classe da mediana.
Idade (em anos)
0 - 2
3 - 5
6 - 8
9 - 11
12 - 14
15 - 17
18 - 20
21 - 23
Estudantes
23
33
63
68
19
10
1
0
Profs. E Funcs.
30
47
36
30
8
0
0
1
4.
As companhias de seguro pesquisam continuamente as idades na morte e as respectivas causas. Os
dados se baseiam em um estudo de uma revista sobre mortes causadas por armas de fogo na América durante
uma semana. Calcule a média, o ponto médio. Encontre as classes modal e mediana.
Página 114
Idade na morte
16 - 25
26 - 35
36 - 45
46 - 55
56 - 65
66 - 75
76 - 85
Freqüência
22
10
6
2
4
5
1
5. Qual é a média de idade de um grupo em que há 6 pessoas de 14 anos, 9 pessoas de 20 e 5
pessoas de 16?
6. Pesquisa sobre o peso em quilogramas de um grupo de pessoas. Determine a média, a moda e a
mediana:
Peso (kg)
fi
40 ├ 44
1
44 ├ 48
3
48 ├ 52
7
52 ├ 56
6
56 ├ 60
3
20
Total
7. Determine a média, a moda e a mediana:
Idade (em anos)
13
14
15
16
Total
fi
3
2
4
1
8. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; e 7,2.
Determine:
a) A nota média.
b) A nota mediana.
c) A nota modal.
Página 115
– Aula 7 – Estatística- 16/09/2010
Profª Rosane Worm
1. A parcela da população convenientemente escolhida para representá-la é
chamada de:
a) variável
b) rol
c) amostra
d) dados brutos
e) nenhuma das alternativas acima
2. Os gráficos próprios de uma distribuição de freqüência são:
a) colunas, curva de freqüência e histograma
b) polígono de freqüência e histograma
c) colunas, curva de freqüência e polígono de freqüência
d) gráfico de setor, gráfico de barra, curva de freqüência e curva normal
e) colunas, barra, setor e curva de freqüência.
3. Dados os conjuntos de valores abaixo
A = { 3, 5, 6, 8, 9, 10, 10, 10, 11, 12, 17 }
B = { 4, 5, 7, 10, 11, 13, 15 }
C = { 2, 3, 4, 5, 5, 5, 5, 6, 7, 8, 8, 8, 8, 9, 10, 11 }
Em relação à moda, podemos dizer que
I.
A é unimodal e a moda é 10
II.
B é unimodal e a moda é 10
III.
C é bimodal e as modas são 5 e 8
Então:
a.
b.
c.
d.
e.
estas afirmações estão todas corretas
estas afirmações estão todas erradas
I e II estão corretas
I e III estão corretas
II e III estão corretas.
4. A altura de 80 homens de uma comunidade está distribuída de acordo com a
tabela abaixo:
Altura (metros)
1,60 ├ 1,65
1,65 ├ 1,70
1,70 ├ 1,75
1,75 ├ 1,80
1,80 ├ 1,85
1,85 ├ 1,90
1,90 ├ 1,95
Total
fi
4
12
18
26
10
8
2
80
fr i (%)
5
15
22,5
32,5
12,5
10
2,5
100
Fr i %
5
20
42,5
75
87,5
97,5
100
Página 116
A moda que corresponde aos dados da tabela é
a) 1,75 m.
b) 1,80 m
c) 1,775 m
d) 1,70 m
e) 1,725 m
5. A representação gráfica que apresenta a sequência de um trabalho de forma
analítica, caracterizando as operações, os responsáveis e(ou) as unidades
organizacionais envolvidas no processo é chamada de
(A) organograma.
(B) histograma.
(C) gráfico de barras.
(D) diagrama de dispersão.
(E) fluxograma.
Página 117
FACULDADE DOM ALBERTO
MEDIDAS DE DISPERSÃO
Aula 8- Estatística- 14/10/2010
Profª Rosane Worm
Dispersão ou Variabilidade
A média, ainda que considerada como um número que tem a faculdade de representar uma série de
números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe
entre os valores que compõem o conjunto.
Considerando os seguintes conjuntos de valores das variáveis X, Y e Z:
X: 5, 5, 5, 5, 5.
Y: 3, 4, 5, 6, 7.
Z: 5, 0, 10, 8, 2.
Calculando a média aritmética de cada um desses conjuntos, obtém-se: X = Y = Z = 5.
Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável
em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou variabilidade nula
e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o conjunto zi.
Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou
variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão. Dessas
medidas, estudaremos: a variância absoluta, o desvio padrão e o coeficiente de variação ou de
variabilidade.
Medidas de Dispersão Absoluta
As principais medidas de dispersão absolutas são: amplitude total, desvio médio simples,
variância e desvio padrão.
1. DESVIO MÉDIO SIMPLES
O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética do
desvio de cada elemento da série para a média da série.
Cálculo do Desvio Médio Simples:
1º) Caso: Dados Brutos ou Rol
Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada
elemento da seqüência para sua média. Finalmente, calculamos a média destas distâncias.
Se a seqüência for representada por X: x 1 , x 2 , x 3 ,... , x n , então DMS admite como fórmula de
cálculo:
DMS = ∑ x i - x
Página 118
n
Exemplo: Calcule o DMS para a seqüência x : 2, 8, 5, 6.
O DMS é a média aritmética simples destes valores.
2º) Caso: Variável Discreta
No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada
elemento representa o número de vezes que este valor figura na série. Conseqüentemente, haverá
repetições de distâncias iguais de cada elemento distinto da série para a média da série. Assim, a
média indicada para estas distâncias é uma média aritmética ponderada.
A fórmula para o cálculo do DMS é:
DMS = ∑| x i – x | f i .
∑ fi
Exemplo: Determinar o DMS para a série:
Xi
1
3
4
5
fi
2
5
2
1
3º) Caso: Variável Contínua
Nesta situação, por desconhecer os valores individuais dos elementos componentes da série,
substituiremos estes valores x i , pelos pontos médios da classe.
Desta forma, o desvio médio simples tem por cálculo a fórmula:
DMS = ∑ x i – x  f i
∑ fi
Onde x i é o ponto médio da classe i.
Exemplo: Determinar o DMS para a série:
Classe
1
2
3
4
Intervalo de classe
2  4
4  6
6  8
8  10
fi
5
10
4
1
Página 119
Exercícios:
1. Calcule o DMS da série X : 3, 8, 12, 3, 9, 7.
2. Calcule o DMS da série Y: 2; 2,5; 3,5; 7; 10; 14,5; 20.
3. Calcule o DMS da série:
Xi
2
4
5
6
8
10
fi
3
8
10
6
2
1
4. Responda, justificando: Qual das série X e Y da 1ª e 2ª questão possui maior dispersão
absoluta?
5. Calcule o DMS da série:
Classe
1
2
3
4
5
6
Salários US$
70  120
120  170
170  220
220  270
270  320
320  370
Nº de vendedores
8
28
54
32
12
6
6. A tabela mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000.
ANOS
1996
TIME A 7
TIME B 18
1997
12
16
1998
20
15
1999
16
9
2000
10
12
a) Qual o desvio médio de cada um desses times?
b) Qual o time mais regular nesse período?
Variância (σ² ou s²) e Desvio Padrão (σou s)
A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o desvio
padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar a idéia de
módulo, o que faz delas índices de variabilidade bastante estáveis e os mais empregados. A variância
Página 120
baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos
quadrados dos desvios.
Dados não agrupados
σ
2
∑ ( xi − µ )
=
Dados agrupados
2
ou σ
N
s2 =
∑ ( xi − x)
2
∑ ( xi − µ )
=
n −1
fi
N
2
ou
2
s2 =
∑ ( xi − x)
n −1
2
fi
( população )
( amostra)
Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade
quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas,
denominada desvio padrão, definida como a raiz quadrada da variância.
σ = σ2
s = s2
( população )
( amostra )
•
Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade.
O uso de uma ou de outra dependerá da finalidade que se tenha em vista.
•
A variância é uma medida que tem pouca utilidade na estatística descritiva, porém é extremamente
importante na inferência estatística e em combinações de amostras.
Para o cálculo do desvio padrão, considera-se os seguintes casos:
Observe como exemplo, o conjunto de valores da variável populacional x: 40, 45, 48, 52, 54, 62
Exemplo: Calcule o desvio padrão da seguinte distribuição amostral:
Xi
fi
0
1
2
3
4
2
6
12
7
3
30
Xi fi
__
(X i - x )2 .
fi
– Com intervalos de classe
Exemplo: Calcule o desvio padrão da tabela abaixo.
Página 121
SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS
FUNCIONÁRIOS DA EMPRESA Z
Salários semanais (R$)
Freqüências
150 |--- 154
4
154 |--- 158
9
158 |--- 162
11
162 |--- 166
8
166 |--- 170
5
170 |--- 174
3
Total
40
FONTE: PESQUISA DO SETOR DE PESSOAL
Exercícios sobre Medidas de Dispersão
1) Calcule a variância e o desvio padrão da População:
X: 2, 3, 7, 9, 11, 13.
2)Calcule a variância e o desvio padrão da População:
Y: 5, 12, 4, 20, 13, 17.
3) Calcule a variância e o desvio padrão da amostra:
Z: 15, 16, 17, 20, 21.
4) Calcule a variância e o desvio padrão da amostra:
T: 6, 5, 10, 12, 19.
5) Calcule a variância e o desvio padrão da população:
Idade (anos)
Nº. de alunos
17
3
18
18
19
17
20
8
21
4
50
Página 122
6) Calcule a variância e o desvio padrão para o número de acidentes diários,
observados em um cruzamento, durante 40 dias. (Amostra)
Nº. de acidentes por dia Nº. de dias
0
30
1
5
2
3
3
1
4
1
7) Calcule a variância e o desvio padrão para a distribuição de valores de 54
notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos.
(Amostra)
Classe Consumo por nota US$
Nº.de notas
1
0├ 50
10
2
50├100
28
3
100 ├ 150
12
4
150├ 200
2
5
200├ 250
1
6
250├ 300
1
54
8) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma
classe (Amostra).
Classe Alturas
Nº. de
(cm)
alunos
1
150├ 160
2
2
160├ 170
15
3
170├ 180
18
4
180├ 190
18
5
190├ 200
16
6
200├ 210
1
Página 123
Aula 9 – Estatística – 21/10/2010
Profª Rosane Worm
1.
As companhias de seguro pesquisam continuamente as idades na morte e as respectivas causas. Os dados
se baseiam em um estudo de uma revista sobre mortes causadas por armas de fogo na América durante uma
semana. Calcule o desvio-padrão e a variância.
Idade na morte
Freqüência
16 - 25
22
26 - 35
10
36 - 45
6
46 - 55
2
56 - 65
4
66 - 75
5
76 - 85
1
2. Calcule o desvio-padrão e a variância para a amostra abaixo que representa o peso das pessoas.
PESOS ( Kg)
f
45 |--- 50
2
50 |--- 55
5
55 |--- 60
8
60 |--- 65
5
65 |--- 70
3
70 |--- 75
2
3. Em um colégio funciona uma cantina. Os gastos diários de 12 alunos com a cantina estão abaixo relacionados em
reais: (amostra)
0,80 1,20 0,90 1,40 2,00 1,00 1,50 1,50 0,80 1,50 1,00 0,80
a) determine o gasto médio diário de um aluno na cantina.
b) Determine a variância e o desvio padrão.
c) Qual é a moda dos gastos diários na cantina?
4. Com o objetivo de verificar o comportamento do consumidor, um órgão de defesa do consumidor registrou o
seguinte número de queixas ao longo de 10 dias: (amostra)
58
39
63
60
95
48
56
72
75
80
a) Determine à média e a mediana do número de queixas recebidas?
b) Qual é o desvio padrão dos dados acima?
5. Em uma classe as notas obtidas pelos alunos foram agrupadas da seguinte maneira: (população)
Nota
Nº alunos
0├2
1
2├4
6
4├6
9
6├8
8
8 ├ 10
6
A partir desses dados calcule o desvio padrão.
Página 124
Aula 10- Estatística – 28/10/2010
Profª Rosane Worm
Medidas de Posição
As Medidas de Posição nos permitem comparar valores, elas nos dão informações
importantes sobre sobre a posição dos dados dentro do conjunto.
Estudaremos aqui:
 Escore Z
 Quartis, Decis e Percentis.
Escores z
O escore padronizado, ou escore z, é o número de desvios-padrão
pelo qual um valor x dista da média (para mais ou para menos). Obtém-se
como segue:
z=
z=
x−x
s
x−µ
σ
→
Amostra
→
População
OBS: Arredondar z para duas decimais.
A importância dos escores z na estatística reside no fato de que eles permitem distinguir
entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores
padronizados estão entre -2,00 e 2,00, e incomuns os valores com escore z inferior a -2,00 ou superior
a 2,00. Nosso critério para classificar um escore z como incomum decorre da regra empírica e do
teorema de Tchebichev.
Valores incomuns
Valores Usuais
Valores incomuns
Valores incomuns
-3
-2
-1
0
z
1
2
3
Exemplo. As alturas da população de homens adultos têm média µ = 175 cm., desviopadrão σ = 7,1 cm. e distribuição em forma de sino. O jogador de basquete Michael Jordan ganhou
reputação de gigante por suas proezas no jogo, mas com 198 cm, ele pode ser considerado
excepcionalmente alto, comparado com a população geral de homens adultos? Determine o escore z
para a altura de 198 cm.
Em comparação com a população geral, Michel Jordan é exepcionalmente alto.
Quartis, Decis e Percentis
Página 125
Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por
Q 1 , Q 2 e Q 3 , dividem as observações ordenadas (dispostas em ordem crescente) em quatro partes
iguais. Ao grosso modo:
- Q 1 separa os 25% inferiores dos 75% superiores dos valores ordenados;
- Q 2 é a mediana;
- Q 3 separa os 75% inferiores dos 25% superiores dos dados.
Mais precisamente, ao menos 25 % dos dados serão no máximo iguais a Q 1 , e ao menos 75%
dos dados serão no mínimo iguais a Q 1 . Ao menos75% dos dados serão no máximo iguais a Q3 ,
enquanto ao menos 25 % serão, no mínimo, iguais a Q3 .
Analogamente, há nove decis, denotados por D1 , D2 , D3 ,..., D9 , que dividem os dados em
10 grupos com cerca de 10% deles em cada grupo.
Há, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em
cada grupo.
O processo de determinação do percentil correspondente a um determinado valor x, é
bastante simples, como se pode ver na expressão seguinte.
=
percentil do valor x
número de valores inferiores a x
⋅100
número total de valores
Para o processo inverso, há vários métodos diferentes para achar o valor correspondente a
determinado percentil, sendo um deles:
Cálculo do p-ésimo percentil
Etapa 1: Arranje os dados na ordem crescente
Etapa 2: Calcule o índice L
 k 
=
L 
⋅n
 100 
onde
n
→ número de escores, ou valores, no conjunto de dados
k
→ percentil a ser utilizado
L
Pk
→ indicador que dá a posição de um escore
→ k mo percentil
Página 126
Uma vez dominados os cálculos para os percentis, podemos seguir o mesmo processo para
calcular os quartis e decis fazendo-se os ajustes relativos. Sendo que:
Quartis
Q1 = P25
Q2 = P50
Q3 = P75
Decis
D1 = P10
D2 = P20

D9 = P90
Exemplo: calcule Q 1 da sequência X : 2, 5, 8, 5, 5, 10, 12, 12, 11, 13, 15
Exemplo: calcule D3 da sequência: 2; 8; 7,5; 6; 10; 12; 2; 9
Xi
2
4
5
7
10
Exemplo: calcule D 4 da série
fi
3
5
8
6
2
Exemplo: Calcule o Q 3 da série
Classe
1
2
3
4
5
Intervalo de classe
0 ├ 10
10 ├ 20
20 ├ 30
30 ├ 40
40 ├ 50
fi
16
18
24
35
12
Atividades
1. Os carros dos estudantes de certa faculdade têm idade média de 7,9 anos com desviopadrão de 3,67 anos, determine os escores z para os carros com as seguintes idades:
a. Um GOL de 12 anos
Página 127
b. Um Corsa de 2 anos
c. Um Fiesta novo
2. Os números de horas que os calouros passam estudando cada semana têm média de 7,06
h e desvio-padrão de 5,32 h. Determine o escore z para um calouro que estuda 20 horas
por semana.
3. Qual dos dois escores abaixo acusa melhor posição relativa?
a. Um escore de 60 em um teste com x = 50 e s = 5
b. Um escore de 250 em um teste com x = 200 e s = 20
4. Dois grupos semelhantes de estudantes fazem testes equivalentes de facilidade de
linguagem. Qual dos resultados seguintes indica maior facilidade relativa a linguagem?
a. Uma pontuação de 65 em um teste com x = 70 e s = 10
b. Uma pontuação de 455 em um teste com x = 500 e s = 80
5. A distribuição de frequência abaixo representa a idade de 50 alunos de uma classe de 1º
ano de uma faculdade:
Idade (anos) Nº de alunos
17
3
18
18
19
17
20
8
21
4
Calcule:
b) K 3
a) Q 1
c) D 1
d) Q 3
e) P 95
6. A distribuição de freqüências abaixo representa o consumo por nota de 50 notas fiscais emitidas
durante um dia em uma loja de departamentos
Classe
1
2
3
4
5
6
Intervalo de classe
0 ├ 50
50 ├ 100
100 ├ 150
150 ├ 200
200 ├ 250
250 ├ 300
Calcule:
a) Q 1
b) D 3
N° notas
10
28
12
2
1
1
c) D 7
d) Q 2
e) P 98
Página 128
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Aula 11 – 04/11/2010
Profª Rosane Worm
Coeficiente de Variação ( δ para população ou g para amostras )
É a caracterização da dispersão ou variabilidade dos dados em termos relativos a seu
valor.
δ =
σ
µ
ou
g =
s
x
MEDIDAS DE ASSIMETRIA
Assimetria
A comparação da média, mediana e moda pode nos dizer algo sobre a característica da
assimetria, definida a seguir.
Definição: Uma distribuição de dados é simétrica quando a metade esquerda do seu
histograma é aproximadamente a imagem-espelho da metade direita (uma distribuição de
dados é assimétrica quando não é simétrica, estendendo-se mais para um lado do que para o
outro).
Negativamente assimétricos: a média e a mediana estão à esquerda da moda.
Embora nem sempre previsíveis, os dados negativamente assimétricos têm em geral a média à
esquerda da mediana.
Positivamente assimétricos; a média e a mediana estão à direita.
Assimetria para a esquerda
(negativamente assimétrica):
A média e a mediana estão à
esquerda da moda.
Simetria (assimetria zero):
A média, a mediana e a
moda coincidem.
Assimetria para a direita
(positivamente assimétrica):
A média e a mediana estão à
direita da moda.
Histogramas de distribuições assimétricas e simétrica:
f
f
Histograma de distribuição
simétrica.
(média = mediana = moda)
x
Histograma de distribuição
assimétrica para a direita (positiva).
(média > mediana > moda)
x
Página 129
f
Histograma de distribuição assimétrica
para a esquerda (negativa).
(média < mediana < moda)
x
Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson
AS = 0 diz-se que a distribuição é simétrica
1º Coeficiente de Pearson
AS =
x − Mo
S
AS > 0 diz-se que a distribuição é assimétrica
positiva (à direita)
AS ∠ 0 diz-se que a distribuição é assimétrica
positiva (à direita)
1. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.
(população)
Xi
1
2
3
4
5
6
fi
2
10
6
4
2
1
2. Classifique, quanto à assimetria, a distribuição abaixo: (amostra)
Classe
1
2
3
4
5
Int. C.
3 ├5
5 ├7
7 ├9
9 ├ 11
11 ├ 13
fi
1
2
13
3
1
3. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson.
População
Página 130
Xi
2
3
4
5
fi
2
4
6
1
0
6
7
8
6
4
2
4. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de
Pearson.
Amostra
Classe
Int. C.
fi
1
0 ├4
10
2
4 ├8
15
3
8 ├ 12
6
4
12 ├ 16
2
5
16 ├ 20
1
5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio
padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6.
a)Em que disciplina foi maior a dispersão relativa?
b) Se um estudante obteve 75 em Estatística e 71 em Matemática. Em qual dos exames foi
mais elevada a sua posição relativa?
6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso
médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg.
a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais
elevada?
7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de
variação de 3,3%. Qual o desvio padrão desse grupo?
Página 131
8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte
distribuição:
População
Classe
Nº de
Nº de dias
televisores
1
5
0 | 20
2
25
20 | 40
2
40
40 | 60
3
15
60 | 80
4
10
80 | 100
5
5
100 | 120
∑
a) Calcule o desvio padrão da distribuição:
b) Calcule a variância populacional da distribuição:
c) Calcule o coeficiente de variação.
d) Classifique, quanto à assimetria, a distribuição segundo o coeficiente de Pearson.
e) Calcule o Q 3 da distribuição.
9. Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, a
variância, o desvio padrão, o coeficiente de variação e a assimetria das distribuições de
freqüências abaixo:
a)
NOTAS
0  2
2  4
4  6
6  8
8  10
fi
5
8
14
10
7
∑ = 44
Estaturas (cm)
150  158
158  166
166  174
174  182
182  190
fi
5
12
18
27
8
∑ = 70
b)
PROBABILIDADES
Conhecidas certas condições, podemos prever, por exemplo, a temperatura em que a
água entrará em ebulição ou a velocidade com que um corpo, em queda livre, atingirá o solo.
Página 132
Estes experimentos cujos resultados podem ser previstos, isto é, podem ser
determinados antes da sua realização, são denominados experimentos determinísticos.
Considere agora os seguintes experimentos:
∗ No lançamento de uma moeda, qual a face voltada para cima?
∗
No
lançamento
de
um
dado,
qual
o
número
que
saiu?
∗ Uma carta foi retirada de um baralho completo. Que carta é essa?
Estes experimentos que, ao serem realizados repetidas vezes, nas mesmas condições,
não podem ter seus resultados previstos são denominados experimentos aleatórios.
Experimento aleatório apresenta as seguintes características:
∗ Pode se repetir várias vezes nas mesmas condições;
∗ É conhecido o conjunto de todos os resultados possíveis;
∗ Não se pode prever o resultado.
Como não se pode prever o resultado de um experimento aleatório, procura-se descobrir
as possibilidades de ocorrência de cada um, ou seja, a probabilidade de que ele ocorra.
A teoria da probabilidade mede a “chance” de ocorrer um determinado resultado num
experimento aleatório.
EXPERIMENTO ALEATÓRIO
Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é
provável que meu time ganhe a partida de hoje” pode resultar:
a.
Que, apesar do favoritismo, ele perca;
b.
Que, como pensamos, ele ganhe;
c.
que empate.
Como vimos, o resultado final depende do acaso. Fenômenos como esse são chamados
fenômenos aleatórios ou experimentos aleatórios.
ESPAÇO AMOSTRAL
A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao
lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou coroa. Já ao
lançarmos um dado há 6 resultados possíveis: 1, 2, 3, 4, 5, ou 6.
Ao conjunto desses resultados possíveis damos o nome de Espaço Amostral ou
Conjunto Universo, representado por S.
S = { Cara, Coroa}
S = { 1, 2, 3, 4, 5, 6}
Se temos 2 lançamento sucessivos de uma moeda podemos obter cara nos dois
lançamentos, ou cara no primeiro e coroa no segundo, ou cara no primeiro e coroa no segundo,
ou cara nos dois lançamentos, o espaço amostral é:
S= { ( C, C), (C, K), ( K, C) ( K, K)
EVENTO
Chamamos de evento qualquer subconjunto do espaço amostral S de um
experimento aleatório.
1Considere o espaço amostral do lançamento de um dado e a observação
da face superior. Descreva, por seus elementos, os seguintes eventos:
a) A: sair face par.
b) B: sair face com número primo.
c) C: sair face maior que três.
d) D: sair face maior que 6.
Página 133
e) E: sair face múltipla de 3.
f) F: sair face menor ou igual a 4.
Suponha-se que um evento E possa acontecer de h maneiras diferentes, em um total de n
modos possíveis, igualmente prováveis. Então, a probabilidade de ocorrência do evento
(denominada sucesso) é definida por:
p = Pr {E} = h/n
A probabilidade de não ocorrência do evento (denominado insucesso ou fracasso) é
definida por:
q = Pr {não E} = n – h /n = 1 – h/n = 1 – p = 1 – Pr {E}
Assim, p + q = 1 ou Pr { não E} = 1
O evento “não E” é representado, às vezes por E, ou ~E
Admita-se que o evento E seja a ocorrência dos números 3 ou 4, em um único lance de um
dado. Há 6 maneiras segundo as quais o dado pode cair, e que resultam nos números 1, 2, 3,
4, 5, ou 6. Se o dado é honesto (isto é, não é viciado), pode-se supor que as seis maneiras
sejam igualmente prováveis. Como E pode ocorrer de duas destas maneiras, tem-se:
p= Pr {E} = 2/6 = 1/3
A probabilidade de não ser conseguido um 3 ou um 4 ( isto é de ocorrência de um 1, 2, 5
ou 6) é:
q = Pr {~E} = 1 – 1/3 = 2/3
Note-se que a possibilidade de um evento é um número compreendido entre 0 e 1. Se o
evento não pode ocorrer, sua probabilidade é 0. Se ele deve ocorrer isto é, se sua ocorrência é
certa, sua probabilidade é 1.
Se p é a probabilidade de que um evento ocorra, a vantagem a favor de seu
acontecimento é q:p. por conseguinte, a vantagem contra o aparecimento de um 3 ou um 4, em
um único lance de um dado honesto, é de q : p = 2/3 : 1/3 = 2 : 1, isto é, 2 para 1
2. Considere o espaço amostral S= { 1,2,3,4,5,6,7,8,9,10} e os seguintes eventos:
A= { 2, 3, 4}
B= { 1, 3, 5, 7, 9}
C= { 5 }
D= { 1, 2, 3 }
E = { 2, 4, 6}
Determine:
a) A U B
b) A ∩ B
c) A ∩ C
d) (A ∩ D) U E
Exercícios:
1- Determine a probabilidade de cada evento:
a) um número par aparece no lançamento de um dado.
b) Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas.
c) Uma só coroa aparece no lançamento de três moedas. S= { (c,c,c), (k,k,k), (c,k,c),
(k,c,k), (c,k,k), (k,k,c)(k,c,c) (c,c,k)}
2- Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50.
determine a probabilidade de:
a. o número ser divisível por 5.
Página 134
b. O número terminar em 3
c. O número ser divisível por 6 ou por 8;
d. O número ser divisível por 4 e por 6.
3- Dois dados são lançados simultaneamente. Determine a probabilidade de:
a. a soma ser menor que 4;
b. a soma ser 9;
c. o primeiro resultado ser maior que o segundo;
d. a soma ser menor ou igual a 5.
4- O experimento consiste em retirar ao acaso uma bola de uma urna que contém 20 bolas
iguais em peso e volume; sendo 5 bolas brancas, 8bolas pretas e 7 bolas amarelas, e anotar
sua cor. Determine a função de probabilidade.
5- Um casal planeja ter 3 filhos. Determine os eventos;
a) os três são do sexo feminino.
b) pelo menos 1 é do sexo masculino.
c) os 3 do mesmo sexo.
6- uma urna contém 20 bolinhas numeradas de 1 a 20. Escolhe-se ao acaso uma bolinha e
observa-se o seu número. Determine os seguintes eventos:
a) o número escolhido é impar.
b) o número escolhido é maior que 15.
c) o número escolhido é múltiplo de 5.
d) o número escolhido é múltiplo de 2 e de 3.
e) o número escolhido é primo.
f) o número escolhido é ímpar e múltiplo de 7.
Função de Probabilidade
Uma vez identificado o espaço amostral S = { a 1, a 2,... a n } de um elemento, podemos
associar a cada elemento sua possibilidade de ocorrência.
1. 0 ≤ p(a i ) ≤ 1 i = 1,2,…,n
Página 135
2. ∑ p(a i ) = 1
i = 1,2,…n
O valor p(a i ) é denominado probabilidade de ocorrência do resultado a i .
PROBABILIDADE CLÁSSICA
Aplica-se às situações em que os resultados que compõem o espaço amostral
ocorrem com mesma regularidade, ou seja, os resultados são equiprováveis.
Deste modo definimos:
P(a i ) = n (a i )
n (a i ) é o número de casos favoráveis à realização de a i
n
n é o número total de casos possíveis
OU
P=E
S
Probabilidade de um evento
Exemplo: lançamento de um dado e observação da face superior. Determine a probabilidade de
cada um dos eventos abaixo:
a) Sair face 2 ou face 3.
b) Sair face ímpar.
c) Sair face maior que 1.
d) Sair face 5.
e) Sair face 1 ou 2 ou 3 ou 4 ou 5 ou 6.
f) Sair face múltiplo de 9
Inicialmente, determinamos o espaço amostral e a função de probabilidade.
O espaço amostral é S= { 1, 2, 3, 4, 5, 6}
A função de probabilidade é dada por:
S __P___R
1 _____ p(1) = 1/6
2 _____ p ( 2) = 1/6
3 _____ p ( 3) = 1/6
4 _____ p ( 4) = 1/6
5 _____ p ( 5) = 1/6
6 _____ p ( 6) = 1/6
1. O experimento consiste em lançar dois dados e observar a diferença dos pontos das faces superiores.
Determine a função de probabilidade.
2. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores.
Determine a função de probabilidade.
3. No lançamento de dois dados e na observação da soma dos pontos das faces superiores, determine
a probabilidade de cada um dos eventos seguintes:
a. A – a soma ser par.
b. B - A soma ser ímpar.
c. C - a soma ser múltiplo de 3.
d. D - A soma ser um número primo.
e. E - A soma ser maior ou igual a 7.
Página 136
f.
F – A soma ser maior que 12.
Página 137
CENTRO DE ENSINO SUPERIOR DOM ALBERTO
Aula 12 – Estatística I – 11/11/2010
Profª Rosane Worm
Eventos Complementares
Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra
(sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe
sempre a relação: p + q = 1 ⇒ q = 1 – p
Ex. A probabilidade de tirar um 4 no lançamento de um dado é p = 1/6. logo a
probabilidade de não tirar o 4 no lançamento de um dado é q = 1 – 1/6 = 5/6.
Eventos Independentes
Dois eventos são independentes quando a realização ou a não-realização de um dos
eventos não efeta a probabilidade da realização do outro e vice-versa.
Ex. quando lançamos dois dados, o resultado obtido em um deles independe do resultado
obtido no outro. A probabilidade de que dois eventos se realizem simultâneamente é dada por p =
p1 x p2
Ex. Lançamos dois dados. A probabilidade de obter 1 no 1º dado é : p 1 = 1/6. A
probabilidade de obtermos 5 no 2º dado é p 2 = 1/6.
Logo, a probabilidade de obtermos, simultaneamente, 1 no 1º e 5 no 2º é : p = 1/6 x 1/6 = 1/36.
Eventos Mutuamente Exclusivos
Dois eventos são mutuamente exclusivos quando a realização de um exclui a realização
do(s) outro(s). Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa”
são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. P = p 1 + p 2.
Ex. Lançamos um dado. A probabilidade de tirar o 3 ou o 5 é : p = 1/6 + 1/6 = 2/6 = 1/3
Exercícios
1. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho
com 52 cartas?
2. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52
cartas?
3. Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule:
a) a probabilidade de essa peça ser defeituosa.
b) a probabilidade de essa peça não ser defeituosa.
4. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5.
Página 138
5. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro
baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e
a do segundo ser o 5 de paus?
6. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas
brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é
retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e
terceira urnas serem, respectivamente, branca, preta e verde?
7. No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a
5?
8. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10
ou maior que 10.
9. Em um lote de 12 peças, 4 são defeituosas. Sendo retiradas aleatoriamente 2 peças,
calcule:
a) A probabilidade de ambas serem defeituosas.
b) A probabilidade de ambas não serem defeituosas.
10. Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma
peça é escolhida ao acaso. Calcule a probabilidade de que:
a) Ela não tenha defeitos graves.
b) Ela não tenha defeitos.
c) Ela seja boa ou tenha defeitos graves.
11- O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto
de 50 deputados presentes em uma reunião.
ESTADO CIVIL
Casado
Solteiro
Desquitado
Divorciado
SEXO
M
F
10
5
7
8
8
3
5
4
Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos:
a) Ser um homem.
b) Ser uma mulher
c) Ser uma pessoa casada.
d) Ser uma pessoa solteira.
e) Ser uma pessoa desquitada.
Página 139
f) Ser uma pessoa divorciada.
12- O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o
estado civil e a cor dos cabelos:
ESTADO CIVIL
Casada
Solteira
Viúva
Divorciada
COR DOS CABELOS
Loira
5
2
0
3
Morena
8
4
1
1
Ruiva
3
1
1
1
Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos:
a) Ser casada.
b) Não ser loira.
c) Não ser morena nem ruiva.
d) Ser viúva.
e) Ser solteira ou casada.
f) Ser morena e solteira.
g) Ser viúva e ruiva.
13- Um experimento consiste em sortear um aluno em uma classe pela lista de chamada
(1 a 20). Determine a probabilidade dos seguintes eventos.
a) ser sorteado um número par.
b) Não ser sorteado um número maior que 12 e múltiplo de 3.
c) Ser sorteado um número menor que 7 e múltiplo de 4.
d) Ser sorteado um número menor que 13, maior que 8 e múltiplo de 7.
e) Ser sorteado um número real.
Página 140
Download

Caderno de Estatística I Dom Alberto