ESTATÍSTICA EXPLORATÓRIA
Prof Paulo Renato A. Firmino
[email protected]
Aulas 01-02
Motivação/Justificativa
•
brain storm: Escreva o que vier à cabeça ao ler os textos:
ƒ “SUA PROFISSÃO”
ƒ “A ESTATÍSTICA”
• Haverá mesmo alinhamento entre esses dois mundos?
ƒ “A ESTATÍSTICA NA MINHA PROFISSÃO”
ƒ
Elaborem (em grupos de até 3) um problema característico da
sua futura área de atuação profissional cuja solução requeira
conceitos estatísticos
•
•
Descrevam em, no máximo, 500 palavras
Enviem por email até a próxima aula
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
2
Referências
•
1.
2.
3.
4.
5.
6.
7.
•
1.
2.
3.
4.
BÁSICAS
BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística: para cursos de engenharia e
informática. 3ª Ed. São Paulo: Atlas, 2010.
BUSSAB, W. O. & MORETIN, C. A. Estatística Básica. 6 ed. SP: Saraiva, 2010.
HOFFMANN, R. Estatística para Economistas. 3ª. ed. rev. e ampl. São Paulo: Livraria
Pioneira,1998. 430 p.
VIEIRA, S.; HOFFMANN, R. Estatística Experimental. São Paulo: Editora Atlas, l989.
179 p.
GONÇALVES, F. A. Introdução à Estatística: estatística descritiva. São Paulo: Atlas,
1976. 224p.
http://www.r-tutor.com/content/r-tutorial-ebook
http://rstudio.org/
COMPLEMENTAR:
SPIEGEL, Murray R. Estatística. 2ª. São Paulo: McGraw-Hill, 1985. 454 p.
BERQUO, Elza S.; SOUZA, José M.P.; GOTLIEL, Sabina. Bioestatística. 2ªed. São Paulo: EPU, 1981.
350p.
HOEL, Paul G. Estatística Elementar. São Paulo: Editora Atlas, 1992. 430 p.
FONSECA, Jairo S. da, MARTINS, Gilberto de A. Curso de Estatística. São Paulo: Editora Atlas,
1982.
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
3
Estatística Exploratória - Sumário
• 06243_EstatExplor_planoDeEnsino.pdf
4
Estatística
• Busca-se responder questões, testar hipóteses, prever
o futuro, diagnosticar causas
• Converte dados em informação, permitindo um
diferencial competitivo:
ƒ
ƒ
ƒ
ƒ
Maior controle interno
Maior capacidade de planejamento
Redução de incertezas
Otimização
• A Estatística ajuda a medir e elevar a Qualidade
• Elas nos permite medir riscos
ƒ Decidir racionalmente
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
5
Estatística
•
Estágios para o estudo estatístico: Exemplo
Formulação: Declara-se o problema e discrima-se as
variáveis de interesse
1.
•
•
Perfil sócio-econômico dos alunos da turma
Variáveis de interesse: ???
Planejamento: Determina-se como coletar os dados e
quais ferramemtas estatísticas serão adotadas
2.
•
•
Selecioar aleatoriamente 8 alunos
Como coletar?
Análise exploratória: Tem-se o primeiro contato
estatístico com os dados disponíveis. Filtra-se prováveis
erros de digitação
4. Análise Inferencial: Modela-se o problema e infere-se
sobre a população baseando-se nas conclusões amostrais
3.
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
6
Tipos de Variáveis
•
Qualitativas: Seus possíveis resultados são qualidades,
atributos, categorias:
ƒ
ƒ
•
Quantitativas: Seus possíveis resultados são quantidades
numéricas, resultantes de uma contagem ou mensuração:
ƒ
ƒ
•
Nominais: Não há qualquer relação matemática entre as
categorias da variável
Ordinais: Pode-se ordenar as categorias
Discretas: Seus possíveis resultados formam um conjunto
finito ou enumerável
Contínuas: Seus possíveis resultados formam um inervalo de
números reais
Rotineiramente variáveis qualitativas são registradas com
valores numéricos, gerando a falsa impressão de serem
quantitativas discretas
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
7
Tipos de variáveis
Variáveis
Funções dos
resultados do
experimento
Qualitativas
Valores são
qualidades
Nominais
Valores não permitem
qualquer operação matemática
•Marca (1- Dell, 2-HP, 3-Positivo, ...)
•Cor (1- branco, 2- prata, 3- preto, ...)
•País de origem (1- BR, 2- CH, 3-EUA, ...)
Ordinais
Valores permitem
ordenação
•Nível de estresse (1- baixo, 2-médio, 3-alto)
•Escolaridade(1-ens fundam, 2-ens médio, 3ens sup)
•Qualidade de vida (1- boa, 2- ruim)
Quantitativas
Valores são
quantidades
Discretas
Valores formam um conjunto
finito ou enumerável
Contínuas
Valores são números reais
•Nº de itens defeituosos (0, 1, 2, ...)
•Nº de reincidências de quebra (0, 1, 2, ...)
•Nº de peças defeituosas dentre n
compradas (0, 1, ..., n)
•Peso (>0)
•Tempo até o reparo (≥0)
•Saldo bancário (número real)
8
Variáveis (Qualitativas) Nominais
•
Cada categoria pode ser rotulada por um número, o qual não
possui significado matemático:
ƒ
•
É comum o uso da freqüência de ocorrências de cada
categoria [freq(·)] como fonte de análise:
ƒ
•
•
3+3=6 é falsa, 5>3 é falsa …
freq(1) + freq(2) = 6 é verdadeira, freq(1) > freq(3) é
verdadeira …
As categorias devem ser mutuamente exclusivas e
exaustivas
Exemplo: cor de produto, marca de produto, região de
procedência de insumo
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
9
Variáveis (Qualitativas) Ordinais
•
Cada categoria pode ser rotulada por um número
proporcional à sua magnitude relativa às demais categorias:
ƒ
ƒ
•
Contudo, a distância entre os rótulos das categorias não é
matemática definida:
ƒ
•
•
Suas categorias podem ser ordenadas entre si
1 < 2 é verdadeira…
6 = 2·3 pode ser falsa, 4 – 3 = 1 pode ser falsa …
As categorias devem ser mutuamente exclusivas e
exaustivas
Exemplo: Avaliação (de péssimo a ótimo), Condição (de
inaceitável a ideal), Degradação (de mínima a máxima)
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
10
Variáveis Quantitativas
•
Cada categoria é, de fato, um número real (para variáveis
contínuas) ou inteiro (para variáveis discretas):
ƒ
ƒ
•
Pode-se usar todas as operações matemáticas
ƒ
•
A distância entre as categorias é matematicamente definida
1 < 2 é verdadeira, 4 – 3 = 1 é verdadeira …
6 = 2·3 é verdadeira, 4 = 16/4 é verdadeira …
Exemplo: Número de ocorrências de determinada categoria
de uma variável nominal [freq(·)], Peso de componente,
Tempo de falha de componente, inflação, juros
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
11
Tipos de Variáveis - Exercício
•
Exercício 1: Identificar (justificando se preciso) o
tipo e a escala (conjunto de possíveis resultados) das
seguintes variáveis:
1.
2.
3.
4.
5.
6.
7.
Tempo até a falha
Preferência por dada marca
Cor da peça
Satisfação de um cliente
Tempo de execução de determinada tarefa manual
Tipo de memória a ser fabricada
PIB
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
12
Tipos de Variáveis
•
Note-se que a depender do tipo da variável em
mãos, o analista pode ou não utilizar medidas como
a média e a variância, por exemplo
•
A média aritmética soma valores e ao final divide
tal soma pelo número de observações
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
13
Estatística Descritiva – Tabelas
• Distribuições de frequência: Expõem distribuições de
percentagens, proporções, freqüências
ƒ Agrupam os dados relativos a uma variável
Degradação (Y) Baixa Moderada Alta
freq
53
40
7
Tempo de falha (T) freq
[0, 20)
53
[20, 30)
38
[30, 40)
7
[40, -)
2
table(x)
Fornecedor (X) A
freq
53
B
47
limits<-range(x)
nIntervals <- 4
delta <- (limits[2]-limits[1])/nIntervals
grid <- seq(limits[1], limits[2], by=delta)
freq <- cut(x, grid, right=FALSE)
table(freq)
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
14
Estatística Descritiva – Tabelas
•
Exercício 1: Elabore a distribuição de frequências para os
seguintes casos
1.
Sexo de entrevistados (1- masc, 2-femin): 1, 2, 2, 1, 1, 1, 2, 2, 2, 1,
1, 2, 1
2.
Grau de instrução de entrevistados (1- sem formação, 2-1º grau, 32º grau, 4-outros): 1, 4, 1, 2, 2, 4, 3, 3, 1, 2, 3, 2, 2, 3
3.
Nº de homens em grupos de 6 pessoas de uma comunidade: 0, 3, 2,
1, 5, 3, 2, 1, 0, 2, 3, 1, 2, 4, 3, 2, 3, 4, 0, 0
4.
Elabore distribuições de frequência para o conjunto de dados
“BSI01”, em anexo.
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
15
Estatística Descritiva – Tabelas
•
ƒ
ƒ
Distribuições de frequência para Variáveis contínuas:
1. O número de subintervalos (partições, classes), k, pode ser
definido como o inteiro mais próximo da raiz quadrada de n
(o número de observações)
2. Os subintervalos podem ter a mesma amplitude (diferença
entre os extremos) ou amplitudes diferentes
3. A amplitude dos subintervalos pode ser definida como a
razão entre a amplitude da amostra e k
Exemplo: tempo até a falha = {5, 10, 2.3, 4.5, 4.1, 3, 7, 2, 4,
0.3}
Exercício 2: agrupar os dados relativos aos tempos de
manutenção: {2, 14, 1.2, 7, 5.4, 3, 7, 3.5, 4, 1.9, 4.7, 1.3,
7.9, 9.5, 1.2}
Estatí
Estatística Explorató
Exploratória - Paulo Renato A. Firmino
16
Download

to get the file