Faculdade Estácio de Sá de Santa Catarina
Cursos de Graduação em Administração e TRH
Prof. Hubert Chamone Gesser, Dr.
Graduação em Administração - ESAG/UDESC
Doutorado e Mestrado em Engenharia de Produção - UFSC
- SUMÁRIO -
Conceitos Básicos em Estatística
Conhecendo os Dados
Medidas de Tendência Central
Amostragem
Tabelas e Gráficos
Intervalo de Confiança
Distribuição Normal
Medidas de Ordenamento
Correlação
Medidas de Dispersão
Testes de Associação
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
ADMINISTRAÇÃO
A administração é o processo de planejar, organizar, liderar e
controlar os esforços realizados pelos membros da organização e o
uso de todos os recursos organizacionais para alcançar os
objetivos estabelecidos.
ESTATÍSTICA
Origem no latim
status (estado) + isticum (contar)
Informações referentes ao estado
Coleta, Organização, Descrição, Análise e Interpretação de Dados
ESTATÍSTICA
O Que é Estatística?
Para Sir Ronald A. Fisher
(1890-1962):
Estatística é o estudo das
populações, das variações e dos
métodos de redução de dados.
ESTATÍSTICA
O Que é Estatística?
“Eu gosto de pensar na
Estatística como a
ciência de
aprendizagem a partir
dos dados...”
Jon Kettenring
Presidente da
American Statistical Association, 1997
ESTATÍSTICA
O Que é Estatística (definição)?
“Estatística é um conjunto de
técnicas e métodos que nos auxiliam
no processo de tomada de decisão na
presença de incerteza.”
ESTATÍSTICA
LIVROS DE ESTATÍSTICA
ESTATÍSTICA
POR QUE A ESTATÍSTICA É IMPORTANTE?

As diferenças são atribuídas a causas erradas;

As coincidências ocorrem frequentemente;

As pessoas têm dificuldades com probabilidades;

Acrescentam polimento às publicações;

Faz conhecer o “grau de confiança” das conclusões.
ESTATÍSTICA
ASSOCIAÇÃO ENTRE ESTATÍSTICA E ESTADO
Recenseamentos
Como o surgimento dos Estados, aparece a
necessidade de se contar o povo (produção) e o
exército (poder).
Esforços dos governos para conhecer seus
habitantes, sua condição socioeconômica, sua cultura,
sua religião, etc.
ESTATÍSTICA
ASSOCIAÇÃO ENTRE ESTATÍSTICA E PESQUISAS
Pesquisas de Opinião Pública, Estudos Mercadológicos
Gráficos e médias publicados na mídia
Análise de dados de processos com variabilidade
ESTATÍSTICA
As variabilidades mostram que existem diferenças
1o Mundo
Alta Expectativa de Vida
Boas Condições Sanitárias
Hábitos de Consumo
Assistência em Saúde
3o Mundo
Doenças Infecciosas
Alta Mortalidade Infantil
Baixa Escolaridade
Iniquidades em Saúde
Indicadores Sociais Diferentes
ESTATÍSTICA
EXPECTATIVA DE VIDA – Diferenças entre os países
ESTATÍSTICA
RENDA PER CAPITA NO BRASIL (PNUD, 2000)
ESTATÍSTICA
RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
ESTATÍSTICA
ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
ESTATÍSTICA
ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA (PNUD, 2000)
ESTATÍSTICA
GRÁFICO DE DISPERSÃO – RENDA x EDUCAÇÃO (PNUD, 2000)
ESTATÍSTICA
FONTES DEMOGRÁFICAS
Bancos de Dados (OMS, OPAS, MS, IBGE, etc)
Indicadores Sociais (IDH, GINI, QV)
Pesquisas de Mercado (Hábitos de Consumo)
Censos Demográficos
Pesquisa Nacional por Amostra de Domicílios (PNAD)
Programa das Nações Unidas para o Desenvolvimento (PNUD)
ESTATÍSTICA
POPULAÇÃO E AMOSTRA
POPULAÇÃO: Conjunto de elementos que se deseja estudar
AMOSTRA: Subconjunto da população
Nem sempre o Censo é viável (questões econômicas)
É mais barato coletar dados de amostras
ESTATÍSTICA
POPULAÇÃO: Também chamada de Universo
AMOSTRA: Parte da população
População
Amostra
ESTATÍSTICA
POPULAÇÃO E AMOSTRA
POPULAÇÃO (N): Todos os estudantes da FESSC
Plano de Amostragem
AMOSTRA (n): Parte dos estudantes da FESSC
ESTATÍSTICA
REQUISITOS DE UMA AMOSTRA
1) Ter um tamanho adequado (previamente calculado)
Existem fórmulas para o cálculo do adequado tamanho da amostra
2) Constituintes selecionados ao acaso (sorteio)
ESTATÍSTICA
CLASSIFICAÇÃO DO TAMANHO DA AMOSTRA
Amostras Grandes:
n > 100
Amostras Médias:
n > 30
(30 < n < 100)
Amostras Pequenas:
n < 30
(12 < n < 30)
Amostras Muito Pequenas: n < 12
Observação: As amostras com n > 30 geram melhores resultados.
O tamanho adequado deve ser pré-calculado.
ESTATÍSTICA
Áreas da Estatística
Amostragem e Planejamento de Experimentos
(coleta dos dados)
Estatística Descritiva
(organização, apresentação e sintetização dos dados)
Estatística Inferencial
(testes de hipóteses, estimativas, probabilidades)
ESTATÍSTICA
Amostragem e Planejamento de Experimentos
(coleta dos dados)
- É o processo de escolha da amostra
- É o início de qualquer estudo estatístico
- Consiste na escolha criteriosa dos elementos a serem submetidos ao estudo
Exemplos:
Pesquisa sobre tendência de votação
Cuidado: Perfil da Amostra = Perfil da População
ESTATÍSTICA
Estatística Descritiva
(organização, apresentação e sintetização dos dados)
- É a parte mais conhecida
- Diariamente veiculada na mídia (jornais, televisão, rádio)
- Distribuições de frequência, médias, tabelas, gráficos
Exemplos: % de Analfabetos em uma comunidade
Índice de Mortalidade Infantil (por mil nascimentos)
Índice de Desenvolvimento Humano
ESTATÍSTICA
Estatística Descritiva – Distribuição Populacional de uma Região
ESTATÍSTICA
Estatística Descritiva – Volume de Vendas de um Produto por Região
ESTATÍSTICA
Estatística Inferencial, Indutiva ou Analítica
(testes de hipóteses, estimativas)
- Auxilia o processo de tomada de decisões
- Responde uma dúvida, compara grupos
- Testam-se 2 hipóteses (hipótese nula e hipótese alternativa), sendo que
uma delas será aceita mediante a aplicação de um teste estatístico baseado
na teoria das probabilidades.
Exemplo: A venda de um produto esta associada a um outro?
Hipóteses: Nula (não há associação), Alternativa (há associação)
ESTATÍSTICA
EXERCÍCIO No 1
Em uma cidade de 500.000 habitantes onde 45% das
pessoas têm título de eleitor, realizou-se uma pesquisa
eleitoral com 2000 pessoas. Qual o tamanho da população de
estudo e da amostra?
ESTATÍSTICA
EXERCÍCIO No 2
Uma amostra de apenas 3000 eleitores pode fornecer
um perfil confiável sobre a preferência de todo o eleitorado,
na véspera de uma eleição presidencial? Por que?
ESTATÍSTICA
EXERCÍCIO No 3
Você considera a pesquisa proposta no exercício
anterior como experimental ou de levantamento? Por quê?
ESTATÍSTICA
EXERCÍCIO No 4
Elabore uma situação em que a estatística possa ser
empregada em benefício de uma organização.
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
TIPOS DE DADOS

Dados Nominais (Sexo, Raça, Cor dos Olhos)

Dados Ordinais (Grau de Satisfação)

Dados Numéricos Contínuos (Altura, Peso)

Dados Numéricos Discretos (Número de Filiais)
“Estatísticas aplicadas em alguns tipos de dados
não podem ser aplicadas a outros .”
ESTATÍSTICA
TIPOS DE DADOS

Dados Intervalares (Temperatura oC)
Quando se referem a valores obtidos mediante a
aplicação de uma unidade de medida arbitrária, porém
constante e onde o zero é relativo. Este tipo de dado
tem restrições a cálculos.
30oC não é três vezes mais quente que 10oC
Para cálculos se utiliza a escala Kelvin
ESTATÍSTICA
ARREDONDAMENTO DE DADOS CONTÍNUOS
1ª Regra: Arredondar para o número mais próximo
2ª Regra: Arredondar para o par mais próximo
5,0
5,5
6,0
6,0
6,5
7,0
ESTATÍSTICA
EXERCÍCIO No 1
Faça os seguintes arredondamentos:
38,648
para o centésimo mais próximo
38,65
54,76
para o décimo mais próximo
54,8
27,465
para o centésimo mais próximo
27,46
42,455
para o centésimo mais próximo
42,46
4,5
para o inteiro mais próximo
4
ESTATÍSTICA
AGRUPAMENTO DE DADOS POR VALORES DISTINTOS
8
5
3
5
5
3
2
2
6
7
4
4
6
5
5
5
5
7
6
5
3
6
4
6
2
5
4
6
x
2
3
4
5
6
7
8
Total
f (frequência)
3
3
4
9
6
2
1
28
ESTATÍSTICA
AGRUPAMENTO DE DADOS POR CLASSES
Classes
f (frequência)
Ponto Médio
39
50
4
44,5
50
61
72
83
61
72
83
94
5
5
6
5
55,5
66,5
77,5
88,5
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
f
10
8
6
4
2
2
3
4
5
6 7
8
x
ESTATÍSTICA
EXERCÍCIO No 2
Em uma amostra de estudantes foram coletadas as seguintes
alturas em metros: 1,70 1,58 1,67 1,72 1,70 1,71 1,75
1,58 1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77 1,76 1,75
1,73 1,65 1,64 1,63 1,62 1,66 1,71 1,68 1,69 1,70 1,59
1,61 1,64 1,76 1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70 1,67
1,71 1,72 1,63 1,70
a) Qual foi o tamanho da amostra (n)?
b) Qual é a altura do sujeito mais alto e a do mais baixo?
c) Faça o agrupamento de dados por valores distintos.
d) Faça o agrupamento por 6 classes.
e) Faça o polígono de frequência p/ o agrupamento por classes.
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Análise Vertical:
Assimétrica Positiva (cauda direita)
Leptocúrtica (alta)
Simétrica
Mesocúrtica
Assimétrica Negativa (cauda esquerda)
Platicúrtica (baixa)
Análise Conjunta:
Assimétrica Positiva Leptocúrtica
Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
ESTATÍSTICA
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Assimétrica Positiva (cauda direita é mais longa)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Simétrica
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Assimétrica Negativa (cauda esquerda é mais longa)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Leptocúrtica (alta)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Mesocúrtica
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Platicúrtica (baixa)
f
x
ESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
Apresentam-se os valores absolutos e as porcentagens
Podem ser usadas tabelas ou gráficos
20,4
40
35
30
25
45,9
20
15
10
5
0
1° Trim.
30,6
2° Trim.
Gráfico de Barras
Gráfico Circular
ESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
45
40
35
30
25
20
15
10
5
0
45,9
30,6
20,4
1° Trim.
2° Trim.
Gráfico de Linhas
(não é usado; restrito a dados contínuos)
0
10
20
30
40
50
Gráfico de Barras Horizontal
ESTATÍSTICA
DESCRIÇÃO DOS DADOS CONTÍNUOS
Trazem informações que expressam a tendência central e a
dispersão dos dados.
Tendência Central: Média ( x ), Mediana ( Md ), Moda ( Mo )
Medidas de Dispersão: Desvio Padrão, Variância, Amplitude,
Coeficiente de Variação,
Valor Máximo, Valor Mínimo
ESTATÍSTICA
EXERCÍCIO No 3
Em uma pesquisa com jogadoras de basquete foram
coletados os seguintes pesos corporais em quilogramas:
65 66 62 66 63 61 67 63 64 62 68 67 65 64 65 66 63
64 65 66 64 63 64 66 65 63 64 65 64 63 64 63 64 68
69 70
a) Qual foi o tamanho da amostra (n)?
b) Qual é o maior peso e o menor?
c) Faça o agrupamento de dados por valores distintos.
d) Faça o agrupamento em 3 classes.
e) Faça o polígono de frequência p/ o agrupamento por classes.
f) A curva de frequência encontrada se assemelha a normal?
ESTATÍSTICA
EXERCÍCIO No 4
Na pesquisa do exercício anterior faça a representação
gráfica em barras e a circular para as 3 classes de
jogadoras geradas.
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
MEDIDAS DE TENDÊNCIA CENTRAL
Nos dão uma idéia de onde se localiza o centro, o
ponto médio de um determinado conjunto de dados.
Medidas: Média, Moda e Mediana.
f
x
ESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto de dados.
Fisicamente representa o ponto de equilíbrio da distribuição.
Modos de calcular
1) para dados simples
x=Sx/n
2) para valores distintos
x = S fx / n
3) para agrupamentos em classes
x = S fx / n
ESTATÍSTICA
MÉDIA
1) Cálculo para dados simples
x=Sx/n
16 18 23 21
17 16 19 20
S x = Soma dos valores
n = tamanho da amostra
x = (16+18+23+21+17+16+19+20)
8
x = 18,75
ESTATÍSTICA
MÉDIA
2) Cálculo para valores distintos
x
2
3
4
5
6
7
8
f
fx
3
6
3
9
4 16
9 45
6 36
2 14
1
8
Total 28 134
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 134
28
x = 4,7857
ESTATÍSTICA
MÉDIA
3) Cálculo para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
x
fx
4
5
5
6
5
44,5
55,5
66,5
77,5
88,5
178
277,5
332,5
465
442,5
25
-
1695,5
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 1695,5
25
x = 67,82
ESTATÍSTICA
MEDIANA
É o valor que ocupa a posição central de um conjunto de
dados ordenados.
Para um número par de termos a mediana é obtida através
da média aritmética dos dois valores intermediários.
Interpretação:
50% dos valores estão abaixo ou coincidem com a mediana e
50% estão acima ou coincidem com a mediana.
ESTATÍSTICA
MEDIANA
1) Cálculo da posição da mediana para dados simples
2 3 4 5 6
7 8 9 10
PMd =(n+1) / 2
PMd = (9+1) / 2
PMd = 5o Termo
Mediana (Md) = 6
ESTATÍSTICA
MEDIANA
2) Cálculo da posição da mediana para valores distintos
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
fa
3o
6o
10o
19o
25o
27o
28o
-
PMd =(n+1) / 2
PMd = (28+1) / 2
PMd = 14,5
x entre 14o e 15o Termo
Mediana (Md) = 5
ESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
4
5
5
6
5
25
x
fa
44,5 4o
55,5 9o
66,5 14o
77,5 20o
88,5 25o
-
-
PMd =(n+1) / 2
PMd = (25+1) / 2
PMd = 13o Termo
Classe Mediana
61
72
Mediana (Md) = 66,5 (estimativa)
ESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Pode-se fazer a interpolação da classe mediana
Md = Li + ((PMd - faa) / f ) . A
Classe Mediana
61
72
Li = limite inferior da classe mediana
PMd = posição da mediana
faa = frequência acumulada da classe anterior
f = frequência da classe mediana
A = amplitude da classe mediana
ESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Interpolação da classe mediana
Md = Li + ((PMd - faa) / f ) . A
Classe Mediana
61
72
Md = 61 + ((13 - 9) / 5) . 11
Mediana (Md) = 69,8
ESTATÍSTICA
MODA
É o valor que ocorre com maior frequência em um conjunto
de dados. Símbolo = Mo
1) Moda para dados simples
Exemplos:
2, 3, 4, 5, 6, 7, 8
AMODAL
2, 3, 3, 4, 5, 6 ,7
MODA = 3
2, 3, 3, 4, 5, 5, 6
BIMODAL (Mo = 3 e Mo = 5)
ESTATÍSTICA
MODA
2) Moda para valores distintos
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
O valor 5 tem o maior
número de ocorrências (9)
Mo = 5
ESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
4
5
5
6
5
25
x
fa
44,5 4o
55,5 9o
66,5 14o
77,5 20o
88,5 25o
-
-
Moda Bruta
Ponto médio da classe de
maior frequência
Mo = 77,5
É uma estimativa
ESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Moda de King
Mo = Li + (A . f2 / (f1 + f2))
Li = limite inferior da classe modal
A = amplitude do intervalo da classe modal
f1 = frequência da classe anterior a modal
f2 = frequência da classe posterior a modal
Mo = 72 + (11 . 5)
5+5
Mo = 77,5
ESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA:
Dados Numéricos e Intervalares
É a medida mais utilizada.
MODA:
Dados Nominais
MEDIANA: Dados Ordinais
ESTATÍSTICA
EXERCÍCIO No 1
Determine a média, a mediana e a moda para o seguinte
conjunto de dados
6 5 8 4 7 6 9 7 3
ESTATÍSTICA
EXERCÍCIO No 2
Determine o menor valor, o maior valor, a média, a mediana
e a moda para o seguinte conjunto de dados
12 32 54 17 82 99 51 11 44 22
22 33 44 52 76 41 37 10 5 87
ESTATÍSTICA
EXERCÍCIO No 3
Dado o seguinte agrupamento em classes determine:
Classes
1,60
1,65
1,65
1,70
1,70
1,75
1,75
1,80
1,80
1,85
f
10
15
22
18
3
Total
68
a) os pontos médios de cada classe
b) a classe modal
c) a moda bruta
d) a moda de King
e) a classe mediana
f) a mediana por agrupamento de classes
g) a média por agrupamento de classes
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
MEDIDAS DE ORDENAMENTO
São os valores que subdividem uma disposição em rol
Medidas: QUARTIS, DECIS E PERCENTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9
Os Percentis dividem a disposição em 100 partes iguais
P1, P2, P3, P4, P5, P6, ... , P99
ESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
Entre cada quartil há 25% dos dados da disposição
Posição do Primeiro Quartil (Q1) = (n + 1) / 4
Posição do Segundo Quartil (Q2) = 2.(n + 1) / 4
Posição do Terceiro Quartil (Q3) = 3.(n + 1) / 4
O segundo quartil coincide com a Mediana (Q2 = Md)
ESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
n = 27
Q1
Q2
Q3
7o termo
14o termo
21o termo
ESTATÍSTICA
DECIS
Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9
Entre cada decil há 10% dos dados da disposição
Posição do Primeiro Decil (D1) = (n + 1) / 10
Posição do Segundo Decil (D2) = 2.(n + 1) / 10
Posição do Nono Decil (D9) = 9.(n + 1) / 10
O Quinto Decil coincide com a Mediana (D5 = Md)
ESTATÍSTICA
PERCENTIS
Os percentis dividem a disposição em 100 partes iguais
P1, P2, P3, P4, P5, P6, ... , P99
Entre cada percentil há 1% dos dados da disposição
Posição do Primeiro Percentil (P1) = (n + 1) / 100
Posição do Segundo Percentil (P2) = 2.(n + 1) / 100
Posição do Nonagésimo Nono Percentil (P99) = 99.(n + 1) / 100
P50 = Md
P25 = Q1
P75 = Q3
ESTATÍSTICA
EXERCíCIOS
1) Dado o conjunto de dados:
a) apresente a disposição em rol;
b) o Percentil 50,
c) o Primeiro Quartil,
d) a Média,
e) a Moda e
f) a Mediana
10 13 24
45 66 77 11
14 26 33 65
21 57
ESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a posição do
oitavo decil, da mediana, do segundo decil, do terceiro
quartil e do segundo quartil?
ESTATÍSTICA
3) Determine a média, a moda, a mediana, o 1o quartil, o 5o
decil, o percentil 75 e o percentil 50 para a seguinte
distribuição por valores distintos?
Lucro (US$ mil)
64
65
66
67
68
69
70
71
72
f
4
10
12
12
15
14
9
5
2
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade.
Medidas mais comuns: Variância, Desvio Padrão, Amplitude
e Coeficiente de Variação
f
Dispersão dos dados
na amostra
Dispersão dos dados
na população
x
ESTATÍSTICA
Dispersão na População
É uma forma de se ver o quanto os dados se afastam da média.
Exemplo: Vilarejo com apenas 11 pessoas
135cm 152cm
136cm 152cm
138cm 157cm
141cm 163cm
143cm 170cm
152cm
Alturas de 11 pessoas
Média = 149cm
Mediana e Moda = 152cm
Valor Máximo = 170cm
Valor Mínimo = 135cm
Amplitude = 35cm
ESTATÍSTICA
Dispersão na População
Alturas
x-x
(N=11)
135cm
136cm
138cm
141cm
143cm
152cm
152cm
152cm
157cm
163cm
170cm
Total
135-149
136-149
138-149
141-149
143-149
152-149
152-149
152-149
157-149
163-149
170-149
-14
-13
-11
-8
-6
3
3
3
8
14
21
(x - x)2
196
169
121
64
36
9
9
9
64
196
441
1314
2 Variância
= 1314 / 11
= 119,454 cm2
 Desvio Padrão
=
119,454
= 10,92 cm
Soma dos desvios
quadráticos
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
 2 = S ( x - x )2 / N
Desvio Padrão da população = Raiz quadrada da variância
 = 2
Como a dispersão nas amostras é menor do que na
população, se faz um ajuste matemático.
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Variância da Amostra ( s2 ou v )
s2 = S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância
s = s2
A dispersão nas amostras é menor do que na população,
por isso é que se faz este ajuste matemático
ESTATÍSTICA
DESVIO PADRÃO
SIGNIFICADO:
É um modo de representar a dispersão dos dados ao redor da média.
f
Média
x
ESTATÍSTICA
DESVIO PADRÃO
A curva A mostra uma dispersão dos dados maior do que a curva B,
logo o desvio padrão de A é maior do que o de B.
f
f
Curva A
Média
Curva B
x
Média
x
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada,
assim um desvio medido em dias será maior do que um medido
em meses.
O coeficiente de variação expressa o desvio-padrão como
porcentagem do valor da média.
COEF. VARIAÇÃO = 100 . DESVIO PADRÃO
MÉDIA
Quanto menor for este coeficiente mais homogênea é a amostra.
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão apresenta sobre a média.
GRAU DE HOMOGENEIDADE DOS DADOS
até 10%

ÓTIMO
de 10% a 20%

BOM
de 20% a 30%

REGULAR
acima de 30%

RUIM
ESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
4 5 5 6
6 7 7 8
ESTATÍSTICA
2) Determine o valor de n, a amplitude, a média, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
22
76
21
28
22
53
32
24
58
33
47
36
45
21
92
73
28
88
22
78
11
11
24
99
46
43
16
29
21
18
Como a base de dados é
grande sugere-se o uso
da planilha eletrônica
Microsoft Excel .
ESTATÍSTICA
3) Com base nos coeficientes de variação calculados nos dois
exercícios anteriores classifique a dispersão encontrada:
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
APLICAÇÕES DE AMOSTRAGEM
Pesquisa Mercadológica (Índice de satisfação na população)
Pesquisa Eleitoral (Percentagem de votos para cada candidato)
Perfil Socioeconômico da População (Grau de escolaridade, Renda)
Na População
Na Amostra
População
Parâmetros
Estatísticas
Amostra
Inferência Estatística
ESTATÍSTICA
POR QUE USAR A AMOSTRAGEM?
Economia (É mais barato levantar dados de uma parcela da população)
Tempo (É mais rápido)
Confiabilidade dos Dados (Entrevista mais atenciosa, menos erros)
Operacionalidade (Controle dos entrevistadores)
QUANDO NÃO USAR A AMOSTRAGEM?
Quando a população for pequena (n > 0,8.N)
Quando a característica for de fácil mensuração (Sim ou Não)
Quando houver a necessidade de alta precisão (Censo IBGE)
ESTATÍSTICA
TIPOS DE AMOSTRAGEM
AMOSTRAGEM ALEATÓRIA SIMPLES
(Tem que obedecer a propriedade de qualquer elemento da população
ter a mesma chance de pertencer à amostra. Pode-se utilizar uma tabela
de números aleatórios ou sorteios)
AMOSTRAGEM ALEATÓRIA SISTEMÁTICA
(Após obter-se a lista dos elementos da população, sorteia-se a entrada e
segue-se a relação N/n.)
AMOSTRAGEM ALEATÓRIA ESTRATIFICADA
(Elabora-se a amostra através do perfil conhecido da população.
Exemplo: Se na UFSC 70% são alunos e 30% Funcionários, a amostra é
confeccionada obedecendo-se estes parâmetros.)
ESTATÍSTICA
OUTROS TIPOS DE AMOSTRAGEM
AMOSTRAGEM NÃO ALEATÓRIA
(De fácil obtenção.)
AMOSTRAGEM PARA ESTUDOS COMPARATIVOS
(Não visa a descrição de uma população, mas a comparação entre
grupos diferentes. Exemplos: Comparar as taxas de tabagismo em
indivíduos com câncer de pulmão e sadios.)
Procure respeitar o Plano de Amostragem para que seja
alcançada uma amostra representativa da população.
ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Sejam: n0 = Primeira aproximação para o tamanho da amostra
E0 = Erro Amostral Tolerável
n = Tamanho da Amostra
N = Tamanho da População
n0 = 1 / (Eo)2
n = (N . n0) / (N + no)
ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Populações Finitas com Parâmetros de Prevalência Conhecidos
n=
(N . z2 . p . (1-p))
(E02 . (N-1) + z2 . p . (1-p))
Onde: N = Tamanho da População
z = Nível de confiança expresso em desvio padrão (95%) = 1,96
E0 = Erro Amostral Tolerável
p = Prevalência do evento na População
ESTATÍSTICA
RELAÇÃO ENTRE (n) E (N)
Relação entre o tamanho da população e o tamanho da amostra
n
600
500
400
300
200
100
0
0
500
1000
1500
2000
2500
3000
3500
N
ESTATÍSTICA
EXERCÍCIOS
1) Determine o tamanho da amostra para uma pesquisa eleitoral
em uma cidade com 200.000 eleitores, adotando uma margem de
erro de 2 pontos percentuais.
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
TABELAS
Tabela é a forma não discursiva de apresentar informações, das
quais o dado numérico se destaca como informação central.
Uma tabela estatística conterá necessariamente uma série ou
uma distribuição de frequência.
Vantagens:
- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE TABELAS
São numeradas consecutivamente com algarismos arábicos;
Os números são precedidos da palavra “Tabela”;
No topo deve estar o título que indica a natureza e as abrangências
geográficas e temporal dos dados numéricos;
O centro da tabela é representado por uma série de colunas e
subcolunas onde são alocados os dados;
No rodapé deve-se colocar a fonte (o responsável pelos dados) e
opcionalmente uma nota geral ou uma nota específica;
A moldura deve conter no mínimo 3 traços horizontais;
Não se deve fechar uma tabela com traços verticais em suas
extremidades.
ESTATÍSTICA
CLASSIFICAÇÃO DAS TABELAS
Séries Cronológicas (temporais ou históricas);
Variável: Tempo Constantes: Lugar e Espécie
Séries Geográficas (territoriais);
Variável: Lugar
Constantes: Tempo e Espécie
Séries Especificativas;
Variável: Espécie
Constantes: Tempo e Lugar
Séries Mistas;
Quando há mais de uma variável.
Distribuição de Frequência
ESTATÍSTICA
Séries Cronológicas (Temporais ou Históricas)
Tabela 1: Aceitação do produto X na Cidade Y
Anos
Percentual
2007
25,74
2008
26,85
2009
27,94
2010
32,45
Fonte: Hipotética
ESTATÍSTICA
Séries Geográficas (Territoriais)
Tabela 2: Aceitação produto X no Ano de 2011
Cidades
Percentual
Itajaí
10,44
Lages
29,45
Florianópolis
8,66
Blumenau
9,82
Fonte: Hipotética
ESTATÍSTICA
Séries Especificativas
Tabela 3: Aceitação do produto X no Ano de 2011
em Florianópolis
Segmento populacional
Percentual
Infantil
60,25
Juvenil
20,72
Adulto
2,75
3a Idade
5,82
Fonte: Hipotética
ESTATÍSTICA
Séries Mistas (Ex: Especificativa-Cronológica-Geográfica)
Tabela 4: Vendas de alguns produtos por ano e cidade (milhares)
Produtos
2010
2011
Fpolis
Lages
24,24
9,34
25,95
112,72
27,45
111,75
29,48
Audio
86,75
18,45
79,37
19,57
Video
1,95
0,85
2,01
0,84
Cosméticos
Vestuário
Fonte: Hipotética
Fpolis Lages
9.98
ESTATÍSTICA
Distribuições de Frequência
Tabela 5: Distribuição de frequência dos pesos corporais de
uma amostra (valores em quilogramas)
Pesos
Frequência
Frequência Acumulada
64
51
51
65
100
151
66
22
173
67
14
187
Total
187
-
Fonte: Hipotética
ESTATÍSTICA
GRÁFICOS
Gráfico é a forma geométrica de apresentação dos dados e
respectivos resultados de sua análise.
A escolha do modelo ideal de representação gráfica depende das
preferências e do senso estético do elaborador.
Vantagens:
- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um leigo;
Não há a necessidade de se colocar título se estiver na mesma página
da tabela correspondente;
Há a necessidade de se colocar o título se a tabela correspondente
não estiver na mesma página.
O senso estético individual determina o espaço do gráfico (L x A);
As colunas, barras, linhas e áreas gráficas devem ser ordenadas de
modo crescente ou decrescente, mas a ordem cronológica prevalece;
ESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica que deu origem à
técnica de construção de gráficos estatísticos.
Utiliza-se o primeiro quadrante do sistema de eixos coordenados
cartesianos ortogonais.
Ordenadas (eixo y)
1o Quadrante
Abscissas (eixo x)
Eixo y
Eixo x
Frequências
Valores da Variável
ESTATÍSTICA
GRÁFICO EM COLUNAS OU DE BARRAS
Tabela 1: Quantidade de exames realizados
em um determinado laboratório em 2011.
25000
20000
Exames
Quantidade
Hematologia
9824
15000
Bioquímica
21534
10000
Imunologia
15432
5000
Parasitologia
4310
0
Hemat
Bioq
Imunol
Parasit
Fonte: Hipotética
Figura 1: Gráfico em colunas do número de
exames em um determinado laboratório em 2011.
ESTATÍSTICA
GRÁFICO DE BARRAS HORIZONTAL
Tabela 2: Quantidade de exames realizados
em um determinado laboratório em 2011.
Parasit
Exames
Quantidade
Hematologia
9824
Bioquímica
21534
Imunologia
15432
Parasitologia
Imunol
Bioq
Hemat
4310
0
5000
10000
15000
20000
25000
Fonte: Hipotética
Figura 2: Gráfico em barras horizontais do
número de exames realizados em um determinado
laboratório no ano de 2011.
ESTATÍSTICA
GRÁFICO DE SETORES OU CIRCULAR
Tabela 3: Quantidade de exames realizados
em um determinado laboratório em 2011.
Exames
Quantidade
Hematologia
9824
Bioquímica
21534
Imunologia
15432
Parasitologia
4310
Parasit
Hemat
Imunol
Bioq
Fonte: Hipotética
Figura 3: Gráfico circular do número de exames
realizados em um determinado laboratório no ano
de 2011.
ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
Tabela 4: Notas dos alunos na disciplina de
Estatística no curso de Administração (ano x)
12
10
8
Notas
Frequência
6
0
2
2
2
4
7
2
4
6
11
0
4
0a2
6
8
10
8
10
5
Fonte: Dados Fictícios
2a4
4a6
6a8
8 a 10
Figura 4: Histograma das notas dos alunos
ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
• A área do histograma é
proporcional à soma das
frequências;
35
31,4
28,6
30
25
20
• Para
comparar
duas
distribuições, o ideal é utilizar
números percentuais;
20
14,3
15
10
5,7
5
0
0a2
2a4
4a6
6a8
8 a 10
Figura 5: Histograma dos percentuais das notas
dos alunos
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
• É um Gráfico em Linha de
uma
distribuição
de
frequência;
35
31,4
30
28,6
25
20
• Para se obter um polígono
(linha
fechada),
deve-se
completar a figura, ligando os
extremos da linha obtida aos
pontos médios da classe
anterior à primeira e posterior
à última, da distribuição.
20
15
14,3
10
5,7
5
0
0
0a2
2a4
4a6
6a8
8 a 10
11
Figura 6: Polígono de Frequência percentual de
das notas dos alunos
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
(Sinônimo: Ogiva)
Tabela 5: Notas dos alunos na disciplina de
estatística no ano x
120
100
100
85,7
80
Notas
Frequência F. Acumulada %
57,1
60
0
2
2
5,7
40
2
4
7
25,7
20
4
6
11
57,1
0
6
8
10
85,7
8
10
5
100,0
Fonte: Dados Fictícios
25,7
5,7
0
0a2
2a4
4a6
6a8
8 a 10
Figura 7: Polígono de frequências acumuladas
das notas dos alunos
ESTATÍSTICA
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
13
22
33
45
53
62
71
14
23
35
47
57
63
72
15 15
28 29
36 37 39 39
58 58 59
65
Conjunto de Dados
Tronco (Stem)
1
2
3
4
5
6
7
Folha (Leaf)
3455
2389
356799
57
37889
235
12
Figura 8: Gráfico Stem-Leaf onde o primeiro
dígito é o tronco e o segundo é a folha
ESTATÍSTICA
GRÁFICO DE BARRAS COM DESVIO PADRÃO
1,95
1,9
1,85
1,8
1,75
1,7
1,65
1,6
1,55
Medicina
Odontologia
Farmacia
Nutrição
Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de
estudantes da faculdade x (valores fictícios).
ESTATÍSTICA
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
1,95m
1,90m
1,85m
1,80m
1,75m
1,70m
1,65m
1,60m
1,55m
Valor Máximo
Percentil 75
Percentil 50
Percentil 25
Valor Mínimo
Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).
ESTATÍSTICA
EXERCÍCIOS
1) Construa uma série cronológica com os dados das vendas de
um determinado produto de uma empresa fictícia.
ESTATÍSTICA
2) Construa o Gráfico de Barras com os dados do exercício
anterior.
ESTATÍSTICA
3) Construa o Gráfico em Setores do seguinte agrupamento em
classes:
Pesos (Kg)
f
40
60
15
60
80
26
80
100
38
100
120
9
Total
88
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
POPULAÇÃO E AMOSTRA
x
x
x
Média
x
x
População
x
Amostras
ESTATÍSTICA
POPULAÇÃO E AMOSTRA
f
Distribuição
da população
Distribuição das médias de
amostras de mesmo tamanho
extraídas da população
x
x
ESTATÍSTICA
POPULAÇÃO E AMOSTRA
A média calculada para uma amostra dificilmente será igual à
média real da população;
O tamanho da discrepância depende do tamanho da amostra e
da variabilidade dos dados.
Discrepância
Inversamente
proporcional a n
Diretamente
proporcional à
variabilidade dos dados
f
Média a
Média b
x
ESTATÍSTICA
ERRO PADRÃO DAS MÉDIAS
f
O desvio padrão da distribuição
das médias é chamado
ERRO PADRÃO DAS MÉDIAS
(EPM)
x
x
ESTATÍSTICA
ERRO PADRÃO DAS MÉDIAS
CÁLCULO DO ERRO PADRÃO
DAS MÉDIAS (EPM)
f
EPM = s
/
n
Mede a dispersão das médias das
diferentes amostras de mesmo
tamanho, extraídas da mesma
população, em torno da média das
médias, isto é, em torno da média
verdadeira da população estudada.
x
x
ESTATÍSTICA
CÁLCULO DO ERRO-PADRÃO A PARTIR
DE UMA AMOSTRA COM 10 PESOS
Pesos
20Kg
23Kg
24Kg
36Kg
37Kg
38Kg
39Kg
43Kg
45Kg
55Kg
Total
x-x
(n=10)
20-36
23-36
24-36
36-36
37-36
38-36
39-36
43-36
45-36
55-36
-16
-13
-12
0
1
2
3
7
9
19
(x -
x)2
256
169
144
0
1
4
9
49
81
361
1074
Variância (s2)
= 1074 / (10-1)
= 119,333 Kg2
Desvio Padrão (s)
= 119,333
= 10,924 Kg
Erro Padrão (EPM)
= 10,924 / 10
= 3,45 Kg
ESTATÍSTICA
INTERVALO DE CONFIANÇA (Amostras Grandes)
Mostra o intervalo em que se situa a média real da população;
Comumente se adota um intervalo com 95% de confiança (z=1,96);
O tamanho da amostra deve ser razoavelmente grande (n>30).
f
Limite Inferior:
IC(95%) = x - 1,96 . EPM
Limite Superior:
Média a
Média b
x
IC(95%) = x + 1,96 . EPM
ESTATÍSTICA
INTERVALO DE CONFIANÇA (Amostras Pequenas)
Comumente se adota um intervalo com 95% de confiança;
O valor de t (Distribuição t de Student) varia conforme o tamanho da
amostra (gl = n-1)
Possibilita o cálculo para amostras pequenas (n<30).
f
Limite Inferior:
Distribuição t de Student
IC(95%) = x - t . EPM
Limite Superior:
Média a
Média b
x
IC(95%) = x + t . EPM
ESTATÍSTICA
COMPARAÇÃO DE DISTRIBUIÇÕES
Amostras Pequenas
Amostras Grandes
Valor de t é variável (t = 1,96 a 12,706)
95% de Confiança
Valor de z é constante (z = 1,96)
95% de Confiança
f
f
Média a
Média b
Distribuição t de Student
x
Média a
Média b
Distribuição Normal
x
ESTATÍSTICA
INTERVALO DE CONFIANÇA
INTERPRETAÇÃO:
Se forem extraídas 100 amostras de mesmo tamanho da população,
95 delas estarão situadas dentro do intervalo e 5 não;
Um intervalo de confiança muito grande sugere que a média da
amostra encontrada é pouco representativa da média (verdadeira)
da população;
O erro padrão da média mostra o quão bem a média é conhecida,
assim quanto menor for o EPM menor será o IC.
ESTATÍSTICA
INTERVALO DE CONFIANÇA
EXEMPLO:
Em uma amostra de 300 estudantes do sexo masculino da faculdade Z,
verificou-se que a média das alturas era de 1,75m. Sabendo que o
desvio-padrão da amostra era de 10cm, determine o intervalo de
confiança para a média das alturas desta população.
EPM = s /
n
IC(95%) = x - 1,96 . EPM = 175 - 1,96 . 0,5773 = 173,87cm
EPM = 10 /
300
IC(95%) = x + 1,96 . EPM = 175 + 1,96 . 0,5773 = 176,13cm
EPM = 0,5773cm
1,7387m
1,7613m
ESTATÍSTICA
COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA
IC (95%) Faculdade Z
1,7387m
1,7613m
x = 1,75m
IC (95%) IES X
1,71m
1,75m
x = 1,73m
Conclusão: As médias populacionais não devem ser consideradas diferentes.
ESTATÍSTICA
COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA
IC (95%) Faculdade Z
1,7387m
1,7613m
x = 1,75m
IC (95%) IES Y
1,726m 1,734m
x = 1,73m
Conclusão: As médias populacionais PODEM ser consideradas diferentes.
ESTATÍSTICA
EXERCÍCIOS
1) Quando se compara duas médias amostrais oriundas de
populações distintas, pode-se dizer que as populações são
diferentes quando as médias amostrais são diferentes?
ESTATÍSTICA
2) Uma empresa com sede em São José verificou que o prazo
médio de entrega de um lote de produtos tinha em Florianópolis
um tempo médio de 10 dias e desvio padrão de 1 dia. Outra
amostra de produtos entregue em Chapecó, apresentou como
média 12 dias e desvio padrão de 2,5 dias. Sabendo que a primeira
amostra continha 70 produtos e a segunda 90 pergunta-se:
Há diferença entre as duas populações com relação ao tempo
necessário de entrega dos produtos?
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
DISTRIBUIÇÃO NORMAL
Variável contínua
y
(infinitos resultados possíveis)
Não dá para enumerar
os possíveis resultados
x
Média, Moda e
Mediana
ESTATÍSTICA
CURVA NORMAL
 É descrita pela média e pelo
desvio padrão.
y
 A mediana, a média e a moda
coincidem.
 A curva é simétrica ao redor
da média.
A curva é mesocúrtica.
Média, Moda e
Mediana
x
ESTATÍSTICA
CURVA NORMAL
 As inferências em pesquisas em
administração estão baseadas em
dados, cuja distribuição é normal.
y
 A curva normal (Gauss) é
simétrica, unimodal e tem forma
de sino.
 É assintótica em relação ao eixo
horizontal (eixo x).
Média, Moda e
Mediana
x
ESTATÍSTICA
A ESTATÍSTICA Z
 A estatística Z (standard
score) está baseada na curva
normal.
 Mede o afastamento de um
valor em relação a média em
unidades de desvios padrão.
y
1 DP
Z = x - x
s
1 DP
2 DP
2 DP
3 DP
-3
-2
3 DP
-1
0
+1
+2
+3
x
ESTATÍSTICA
A ESTATÍSTICA Z
y
Exemplo:
A altura média dos estudantes
da FESSC é de 1,70m com
desvio padrão de 10cm
Z = x - x
s
140 150
-3
-2
160
170
-1
0
180 190 200 x
+1
+2
+3 z
ESTATÍSTICA
ÁREAS DA CURVA NORMAL
Áreas
y
-1DP a +1DP  68,27%
-2DP a +2DP  95,45%
-3DP a +3DP  99,73%
1 DP
1 DP
-1,96DP a +1,96DP  95%
2 DP
2 DP
Média a 1DP  34,13%
Média a 2 DP  47,72%
3 DP
-3 DP
-2 DP
-1 DP
Média a 3DP  49,86%
3 DP
Média, Moda e
Mediana
+1 DP
+2 DP
+3 DP
x
ESTATÍSTICA
ÁREAS DA CURVA NORMAL
y
34,13%
47,72%
49,86%
x
-3
-2
-1
0
+1
+2
+3
z
ESTATÍSTICA
ÁREAS DA CURVA NORMAL
y
68,27%
95,45%
99,73%
x
-3
-2
-1
0
+1
+2
+3
z
ESTATÍSTICA
TABELA Z
ESTATÍSTICA
EXERCÍCIOS
1) O processo de fabricação de uma determinada empresa apresenta a
média de peso de uma peça igual a 100g e desvio padrão de 1,5 g.
Qual é a proporção de peças entre 100 e 102g?
Z = (x - média) / desvio padrão = (102 - 100) / 1,5 = 1,33
?
na tabela qdo z = 1,33 a área é de 50% - 9,18% = 40,82%
100 102
0
?
x
z
ESTATÍSTICA
2) Calcule as seguintes proporções de peças:
(a) com peso entre 98 e 102g
(b) abaixo de 98g
(c) acima de 102g
(d) abaixo de 100g
(e) abaixo de 95g
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis quantitativas
(com dados numéricos).
a
a
b
a
b
b
ESTATÍSTICA
CORRELAÇÃO LINEAR POSITIVA
Quando valores pequenos da variável a tendem a estar relacionados
com valores pequenos de b, enquanto que valores grandes de a
tendem a estar relacionados com valores grandes de b.
a
Exemplos:
Peso x Altura
Nível socioeconômico x Volume de vendas
Consumo de Álcool x Preval. Cirrose Hepática
b
ESTATÍSTICA
CORRELAÇÃO LINEAR NEGATIVA
Quando valores pequenos da variável a tendem a estar relacionados
com valores grandes de b, enquanto que valores grandes de a
tendem a estar relacionados com valores pequenos de b.
a
Exemplos:
Renda Familiar x Número de Filhos
Escolaridade x Absenteísmo
Volume de vendas x Passivo circulante
b
ESTATÍSTICA
CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de pontos
aproximando-se mais de uma parábola do que de uma reta.
a
Exemplos:
Coef. de Letalidade (a) x Dose do Medicamento (b)
Custo (a) x Lote Econômico de Compra (b)
b
ESTATÍSTICA
COEFICIENTE DE CORRELAÇÃO DE PEARSON
r =
n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
S(X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a soma
SX = Somatório dos valores da variável X
SY = Somatório dos valores da variável Y
SX2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma
SY2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma
ESTATÍSTICA
EXEMPLO
Cálculo do coeficiente de correlação para os dados das variáveis
X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos.
X
Y
101
193
3,2
4,6
.
.
.
42
1452
.
.
.
2,8
39,3
X2
Y2
X.Y
10201 10,24
37249 21,16
.
.
.
.
.
.
323,2
887,8
.
.
.
1764
7,84 117,6
251538 153,55 5706,2
ESTATÍSTICA
r =
n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
r =
12 . 5706,2 - 1452 . 39,3
12 . 251538 - (1452)2 .
12 . 153,55 - (39,3)2
r = 0,69 (Correlação Linear Positiva
r > 0)
ESTATÍSTICA
INTERPRETAÇÃO
• O Valor de r (Correlação Linear de Pearson) varia de -1 a +1.
• O sinal indica o sentido (correlação positiva ou negativa).
• O valor indica a força da correlação (Fraca, Moderada ou Forte)
valor de r
Forte
-1
Moderada Fraca Ausência
- 0,7
- 0,3
0
Fraca Moderada
+ 0,3
Forte
+ 0,7
+1
ESTATÍSTICA
EXERCÍCIO
1) Coloque V (Verdadeiro ou F (Falso):
(
) Quando o valor de r for maior que 0,7 ou menor que -0,7 a
correlação entre as duas variáveis em estudo é forte
(
) O sinal negativo de r indica que as variáveis em estudo são
inversamente proporcionais
( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que
as variáveis sejam diretamente proporcionais.
( ) O coeficiente de correlação de Pearson pode ser aplicado em
dados nominais
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
TESTES DE ASSOCIAÇÃO
São Testes de Hipóteses para dados nominais
H0 (Hipótese Nula): Não existe associação entre as variáveis estudadas
H1 (Hipótese Alternativa): existe associação entre as variáveis estudadas
Respondem um problema:
(1) A propaganda está associada ao desempenho das vendas?
(2) Um método de treinamento está associado a produtividade?
(3) O número de horas de trabalho está associado ao estresse?
ESTATÍSTICA
TESTE DE ASSOCIAÇÃO QUI-QUADRADO
É um teste não paramétrico. Símbolo: 2
É muito empregado em pesquisas sociais e de saúde.
A interpretação dos resultados é mais favorável quando são baseados
em tabelas de contingência 2 x 2 (1 grau de liberdade).
Exemplo de uma tabela de contingência 2 x 2:
Aumento nas vendas Redução nas vendas
Com Propaganda
70 ( a )
21 ( b )
Sem Propaganda
35
24 ( d )
(c)
ESTATÍSTICA
TESTE DE ASSOCIAÇÃO QUI-QUADRADO
Cálculo do 2 em tabelas 2 x 2 com Correção de Continuidade.
2 =
n . ( a . d - b . c - ( n / 2 ) )2
(a+b).(c+d).(a+c).(b+d)
O valor de 2 encontrado é transferido para uma tabela que
fornecerá o valor de p (probabilidade de significância).
ESTATÍSTICA
Cálculo do exemplo: Propaganda x Desempenho das Vendas
2 =
n . ( a . d - b . c - ( n / 2 ) )2
(a+b).(c+d).(a+c).(b+d)
2 =
150 . ( 70 . 24 - 21 . 35 - ( 150 / 2 ) )2
( 70 + 21 ) . ( 35 + 24 ) . ( 70 + 35 ) . ( 21 + 24 )
2 = 4,475
p < 0,05 Há associação entre as variáveis
ESTATÍSTICA
TESTE DE ASSOCIAÇÃO QUI-QUADRADO
Valores de p com 1 grau de liberdade (tabelas 2 x 2)
p
0,250 0,100 0,050 0,025 0,010 0,005 0,001
2
1,32
2,71
3,84
5,02
6,63
7,88
10,8
Exemplos:
Se for encontrado um valor de 2 = 6,63 o valor de p será 0,01
Se for encontrado um valor de 2 = 2,54 então 0,10 > p > 0,05
ESTATÍSTICA
INTERPRETAÇÃO
Quando p > 0,05
Aceita-se H0 (Hipótese Nula)
Não há associação
Quando p < 0,05
Aceita-se H1 (Hipótese Alternativa)
Há associação
Observações
Comumente se adota 0,05 como nível de significância
O Teste Exato de Fisher substitui o 2 em amostras muito pequenas
A associação não deve ser confundida com relação causal
ESTATÍSTICA
EXERCÍCIOS
1) Uma pesquisa que tinha como objetivo verificar a existência
de associação de algumas variáveis com o volume de vendas de
um determinado produto encontrou os seguintes valores de 2:
2 = 9,88 para o índice de escolaridade
2 = 6,22 para o renda familiar
2 = 1,42 para o hábito de fumar
Qual destas 3 variáveis mostrou-se mais fortemente associada
com o volume de vendas e qual é o valor do seu p
(probabilidade de significância)?
ESTATÍSTICA
2) Uma organização está tentando descobrir se um novo
programa de treinamento do pessoal de vendas está associado a
uma maior satisfação de sua clientela. Observe a seguinte
tabela de contingência e tente responder essa dúvida.
Clientes satisf Clientes Insatisf
Treinamento Novo
Treinamento Clássico
41
103
37
106
Fonte Bibliográfica
 BARBETA, P. A. Estatística Aplicada às Ciências Sociais.
5.ed. Florianópolis: UFSC, 2006.
 DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical.
3.ed. New York: Lange Medical Books/McGraw-Hill, 2006.
 LEVIN, J. Estatística Aplicada às Ciências Humanas.
7.ed. São Paulo: Harbra, 2007.
 SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron
Books, 2006.
 STEVENSON, W. J. Estatística Aplicada à Administração.
São Paulo: Harbra, 2007.
Retornar
Download

Estatística - Professor Hubert Chamone Gesser, Dr.