Probabilidade e Estatística
Ciência da Computação
Parte 5
Introdução à Estatística
Prof. Adriano Pasqualotti
Objetivos
n
n
n
n
Definir os termos utilizados na área de
Estatística
Definir dados quantitativos e
qualitativos
Definir os níveis de mensuração
Descrever os métodos de amostragem
2/46
Problema
n
Programa de televisão realiza pesquisa
para verificar a opinião dos
telespectadores sobre a permanência
da sede das Nações Unidas nos USA
n
n
Os telespectadores pagavam 50 centavos
de dólar para fazer a chamada telefônica
Dos 186.000 que responderam, 67%
disseram que a sede da ONU devia sair
dos USA
3/46
1
Estatística
n
A palavra pode ser usada com dois sentidos
n
n
n
Em relação a números específicos obtidos de
dados
Como método de análise
É uma coleção de métodos para planejar
experimento, obter, organizar, resumir,
analisar, interpretar e extrair conclusões de
dados
4/46
Definição de termos
extensamente utilizados
n
População (N)
n
n
Consiste na totalidade de unidades de
observação a partir das quais se deseja
tomar uma decisão
Censo
n
Exame de todas as unidades de
observação de uma população
5/46
Definição de termos
extensamente utilizados
n
Amostra (n)
n
n
Parâmetro
n
n
Conjunto de unidades selecionadas de uma
população
É uma medida numérica que descreve uma
característica de uma população
Estatística
n
É uma medida numérica que descreve uma
característica de uma amostra
6/46
2
A natureza dos dados
n
Dados qualitativos (dados categóricos
ou atributos)
n
n
Podem ser separados em diferentes
categorias que se distinguem por alguma
característica não-numérica
Dados quantitativos
n
Consistem em números que representam
contagem ou medidas
7/46
A natureza dos dados
quantitativos
n
Dados discretos
n
n
Resultam de um conjunto finito de valores
possíveis ou infinito enumerável
Dados contínuos (numéricos)
n
Resultam de um conjunto infinito de
valores possíveis que podem ser
associados a pontos em uma escala
contínua
8/46
Exemplos de dados
qualitativos
n
n
n
n
n
Sexo: masculino e feminino
Religião: católica, judaica e protestante
Naturalidade: carioca, paulista, gaúcho
e mineiro
Cor dos olhos: castanho, verdes e azuis
Faixa etária: até 25 anos, de 26 a 49
anos e acima de 50 anos
9/46
3
Exemplos de dados
quantitativos discretos
n
n
n
n
Quantidade de valores de uma moeda:
1, 2, 5, 10, 20, 50 e 100
Número de alunos em uma sala de aula
Número de enfermeiros em um hospital
Quantidade de sabores de um suco:
tangerina, laranja, maracujá, abacaxi e
maçã
10/46
Exemplos de dados
quantitativos contínuos
n
n
n
Valor do patrimônio dos hospitais de
Passo Fundo: R$ 1.700.000,00; R$
11.240,00; R$ 120.977.174,96
Duração de uma bateria de marcapasso: 463h, 345h35min, e 1.280h
Valor de cirurgia paga pelo SUS: R$
170,32 e R$ 11,24
11/46
Exercício proposto
n
Identifique cada
número como
discreto ou
contínuo.
12/46
4
Problemas
n
n
n
Cada cigarro Camel tem 16,13 mg de
alcatrão
O altímetro de um avião da American Airlines
indica uma altitude de 21.359 pés
Uma pesquisa efetuada com 1.015 pessoas
indica que 40 delas são assinantes de um
serviço de computador on-line
13/46
Escalas utilizadas
n
Nominal
n
n
Os dados consistem em nomes, rótulos ou
categorias
Ordinal
n
Os dados podem ser dispostos em alguma
ordem
14/46
Escalas utilizadas
n
Intervalar
n
n
n
Os dados podem ser dispostos em alguma
ordem e também há variação numérica
entre as características
Uma unidade de medida (arbitrária e fixa)
Um zero relativo (convencional)
15/46
5
Escalas utilizadas
n
Racional
n
n
n
n
Os dados podem ser dispostos em alguma
ordem e também há variação numérica
entre as características
Uma unidade de medida (arbitrária e fixa)
Um zero absoluto
Diferenças e razões entre os dados têm
significado
16/46
Exemplos de níveis de
mensuração
n
Nominal
n
n
n
Sexo dos alunos em uma turma de
estatística
Respostas do tipo “sim” ou “não”
Ordinal
n
n
Editor classifica originais como excelente,
“bons” ou “maus”
Posição de corretores em uma prova
17/46
Exemplos de níveis de
mensuração
n
Intervalar
n
n
n
Os anos 1000, 2000, 1876 e 1984
As temperaturas anuais médias (em °C)
das capitais dos estados brasileiros
Racional
n
n
Pesos de artigos de material plástico
descartados pelos hospitais
Duração (em min) de filmes
18/46
6
Exercício proposto
n
Determine o nível
de mensuração
mais adequado.
19/46
Problemas
n
n
n
Classificação como superior, acima da
média, médio, abaixo da média ou
pobre para encontros marcados com
desconhecidos
Conteúdo de nicotina (em mg) de
cigarros Camel
Números de inscrições no INSS
20/46
Problemas
n
n
n
Rendas anuais de enfermeiras
Carros classificados como
subcompacto, compacto, intermediário
ou grande
Classificação do prefeitos da capitais da
região sul (em uma escala de 0 a 10):
Curitiba 6,7; Porto Alegre 6,4;
Florianópolis 6,4
21/46
7
Amostragem
n
n
Processo pelo qual uma amostra de
unidade da população é observada
Envolve pelo menos dois passos
n
n
n
Escolha das unidades
Registro das observações
Sem reposição
n
As unidades são selecionadas apenas
uma vez
22/46
Amostragem
n
Com reposição
n
n
As unidades são selecionadas mais de
uma vez
Justificativas para o seu uso
n
n
n
Escassez de tempo e recursos
Testes destrutivos
Impossibilidade de estudar a totalidade
23/46
Amostragem
n
Coleta de dados por observação direta
n
n
n
As unidades de observação são obtidas
pelo próprio pesquisador
Através de um instrumento
Coleta de dados por observação
indireta
n
As unidades de observação são obtidas
através de consulta à fontes secundárias
24/46
8
Tipos de amostragem
n
Amostragem aleatória simples
n
n
Processo de retirada de uma amostra de
população no qual cada unidade tem a
mesma chance de ser retirada
Nomes em cartões ou tabela de dígitos
pseudo-aleatórios
124-222
671-481
25/46
Exemplo amostragem
aleatória simples
n
Selecionar, aleatoriamente, dez
unidades de uma população de
tamanho N = 874
n
Utilizando tabela de dígitos pseudoaleatórios
874; 855; 422; 257; 706;
362; 434; 338; 365, 922; 767;
26/46
Tipos de amostragem
n
Amostragem estratificada
n
Subdivide a população em, no mínimo,
duas subpopulações (estratos) que
compartilham das mesmas características
e, em seguida, extraí-se uma amostra de
cada estrato
27/46
9
Exemplo amostragem
estratificada
n
O TER dos Estados quer verificar, no
conjunto do eleitores, quanto são
homens ou mulheres, quanto estão em
cada faixa etária pesquisada e quantos
estão na capital ou no interior
n
n
Dividir a população em termos de sexo,
faixa etária e tipo de cidade
Escolha da unidade por sorteio aleatório
28/46
Tipos de amostragem
n
Amostragem sistemática
n
Escolhe-se um ponto de partida, e
seleciona-se cada k-ésimo elemento da
população
29/46
Exemplo amostragem
sistemática
n
Selecionar, aleatoriamente, dez
unidades de uma população de
tamanho N = 874
n
Definir intervalo de seleção: 874/10 = 87,4
≅ 87 (aproxima-se sempre para menos)
87; 174; 261; 348; 435;
522; 609; 696; 783; 870;
30/46
10
Tipos de amostragem
n
Amostragem por conglomerado
n
Divide-se a área da população em seções
(conglomerados); em seguida escolhe-se
algumas dessas seções e, finalmente,
toma-se todos os elementos das seções
escolhidas
31/46
Exemplo amostragem por
conglomerado
n
Um enfermeiro quer entrevistar todos
os pacientes internados em uma UTI de
cada 10 hospitais das cidades da região
do planalto
n
n
n
Dividir em seções as UTIs dos hospitais
Selecionar aleatoriamente alguma dessas
UTIs
Tomar todos os pacientes dessas UTIs
32/46
Exercícios proposto
n
Identifique o tipo
de amostragem
utilizado:
aleatória,
estratificada,
sistemática ou
por
conglomerado.
33/46
11
Problemas
n
n
Quando escreveu Women and love: A
Cultural Revolution, a autora Shere Hite
baseou-se suas conclusões em 4.500
respostas a 100.000 questionários
distribuídos a mulheres
Um sociólogo da UPF seleciona 12
homens e 12 mulheres de cada uma
das quatro turmas de inglês
34/46
Problemas
n
n
Um psicólogo da Universidade de Nova
York faz uma pesquisa sobre todos os
estudantes de cada uma de 20 turmas
selecionadas aleatoriamente
A empresa Sony seleciona cada 200º
CD de uma linha de produção e faz um
teste de qualidade rigoroso
35/46
Problemas
n
n
Um cabo eleitoral escreve o nome de
cada senador do Brasil em cartões
separados, mistura-os e extrai 10
nomes
O programa Planejamento Familiar
pesquisa 500 homens e 500 mulheres
sobre seus pontos de vista sobre o uso
de anticoncepcionais
36/46
12
Problemas
n
n
Um pesquisador de mercado da Varing
entrevista todos os passageiros de
cada um de 10 vôos selecionados
aleatoriamente
Um repórter da revista Veja entrevista
todo 50º gerente geral constante da
relação dos 1000 hospitais com maior
número de internações pelo SUS
37/46
Exercício proposto
n
Selecionar
unidades de
observação de
uma população
utilizando a tabela
de dígitos
pseudo-aleatórios
38/46
Problema
n
Selecionar, aleatoriamente, 15
unidades de uma população de
tamanho N = 3.467. A leitura deverá
iniciar de baixo para cima, a partir da
última coluna
39/46
13
Solução do problema – tabela
de dígitos pseudo-aleatórios
2700;
753;
1014;
1475;
3361;
2124; 3205;
2770; 990;
3262; 3062;
559; 395;
3060; 1467;
40/46
Tipos de estudos
n
Observacional
n
n
Verifica e mede-se as características
específicas, mas não tenta-se manipular
ou modificar os elementos a serem
estudados
Experimento
n
Aplica-se determinados tratamentos e
passa-se a observar seus efeitos
41/46
Exercícios proposto
n
Determine se a
descrição dada
corresponde a um
estudo
observacional ou
a um
experimento.
42/46
14
Problemas
n
n
Mede-se o conteúdo de alcatrão,
nicotina e monóxido de carbono em
diferentes marcas de cigarro
Pede-se a fumantes que reduzem à
metade o número de cigarros
consumidos diariamente, para que se
possam medir os efeitos sobre a
freqüência de pulsação
43/46
Problema
n
Em uma turma de educação física,
estuda-se o efeito dos exercícios físicos
sobre a pressão sanguínea,
determinando-se que a metade dos
estudantes ande 2 km cada dia,
enquanto a outra metade corra 2,0 km
diariamente
44/46
Problema
n
Estuda-se a relação entre os pesos de
ursos e seus comprimentos, tomandose as medidas e ursos anestesiados
45/46
15
Atividade em grupo
n
Deseja-se fazer uma pesquisa junto a
estudantes de tempo integral do curso
de Computação da UPF. Planeja e
descreva detalhadamente um processo
para obter uma amostra aleatória de
100 estudantes.
46/46
16
Download

Probabilidade e Estatística Ciência da Computação Objetivos