ESTATÍSTICA ?
PRA QUÊ ?
ESTATÍSTICA
• No sentido comum – representa uma
coleção de dados numéricos:
– Resumir o desempenho de um time de futebol
durante uma temporada;
– Relacionar nascimentos em uma cidade;
– Índices PIB, IPC
ESTATÍSTICA
• Vem do latim “status” = Estado
• inicialmente envolvia:
– compilações de dados e gráficos representativos
dos vários aspectos de um estado ou país.
• taxa de mortalidade,
• taxa nascimento,
• renda,
• taxas de desemprego, etc.
ESTATÍSTICA
• É uma coleção de métodos para:
– planejar experimentos,
– obter dados,
– organizar,
– resumir,
– analisar
– concluir sobre as informações coletadas
Estatística
• Ramo da matemática que analisa dados
estatísticos
– Estatística Descritiva
– Inferência Estatística
• Ouvimos falar em estatísticas:
– do movimento da Bolsa de Valores
– da Saúde Pública
– do crescimento da população, etc.
• Essa noção prende-se normalmente apenas
à parte de ORGANIZAÇÃO E DESCRIÇÃO
dos dados observados.
Estatística
• Há ainda outro campo de atuação da
Estatística que se refere à ANÁLISE E
INTERPRETAÇÃO desses dados.
• OBJETIVO:
– utiliza os conceitos como auxílio nas tomadas
de decisão diante de incertezas
– justifica cientificamente as decisões
Estatística
• UTILIZAÇÃO: aplicável a qualquer ramo
do conhecimento onde se manipulem dados
numéricos:
–
–
–
–
Física
Química
Biologia
Engenharia
Ciências Sociais
Ciências Administrativas, etc.
Economia
Medicina
Estatística
• Estatística pode ser dividida em duas partes:
– .Estatística Descritiva - cuida da:
• Organização
• descrição dos dados experimentais;
– .Estatística Indutiva - cuida da:
• análise
• interpretação dos dados
STRESS
• Mecanismo que põe em alerta as funções
corporais;
• prepara a pessoa para a ação;
• PEQUENAS DOSES: melhora desempenho;
• CRÔNICO: mal à saúde.
STRESS
• ESTÁGIOS:
• 1) ALERTA:
– percepção do perigo;
– organismo se prepara para o confronto.
– Isto ocorre através de descargas extras de
hormônios na corrente sangüínea.
– Principal é a adrenalina
STRESS
• 2. CRÔNICO:
– sistema imunológico entra em colapso;
– abre espaço à doenças oportunistas;
– aumenta risco de males cardíacos e danos às
estruturas cerebrais.
STRESS - níveis de tensão
(médico americano)
•
•
•
•
•
•
Morte de filho........................123 pontos
Morte de cônjuge...................119 pontos
Morte dos pais ou irmãos......101 pontos
divórcio................................. 96 pontos
doença grave......................... 74 pontos
demissão no emprego........... 74 pontos
profissões campeãs de stress
• 1) policiais e seguranças privados
• 2) controladores de vôo e motoristas de
ônibus urbano;
• 3) executivos, trabalhadores de área de
saúde, de atendimento ao público e
bancários
• 4) jornalistas
Usos da Estatística
• AARP (Associação Americana de Aposentados)
alega que os motoristas mais idosos se envolvem
em menor número de acidentes do que os mais
jovens.
idade
nº de acidentes
16 - 19 anos
1.500.000
Mais de 70 anos
540.000
• A alegação da AARP é válida ?
Usos da Estatística
idade
taxa de acidentes
16 - 19 anos
8,6
75 - 79 anos
4,6
80 - 84 anos
8,9
Mais de 85 anos
20,3
• embora os motoristas mais novos tenham maior
número de acidentes, os mais velhos apresentam
as mais altas taxas de acidente
Abusos da Estatística
• Segundo Benjamin Disraeli: “Há três tipos de
mentira: as mentiras, as mentiras sérias e a estatística”
• Outro provérbio: “Os números não mentem; mas os
mentirosos forjam os números”
• “se torturarmos os dados por bastante tempo, eles
acabarão por admitir qualquer coisa”
Abusos da Estatística
• Andrew Lang (historiador): algumas pessoas usam a
estatística como um bêbado usa um poste de
iluminação - para servir de apoio e não para iluminar
Exemplo:
33% dos acidentes de trânsito envolvem pessoas
embriagadas...
Portanto, 67% estão completamente sóbrias,
Conclusão: devemos, então, dirigir totalmente
bêbados ??
Abusos da Estatística
• Números precisos:
– a área do território brasileiro é de 8.547.403,2574
metros quadrados
– a idade de uma peça de museu é de 10 mil e três
anos.
• Números precisos: (palpites)
– Quando o Papa visitou Miami, fontes informaram
uma estimativa de 250 mil pessoas. Através de
fotos aéreas e grades, estimaram em 150 mil
pessoas
Abusos da Estatística
• Porcentagens distorcidas:
– Uma Cia aérea anuncia a melhoria dos serviços.
– Houve uma melhora de 100% nos últimos meses em
relação à bagagem extraviada.
– Não se extravia mais bagagens?
• Perguntas tendenciosas
– quando as perguntas são feitas de modo a sugerir uma
resposta.
– Você gosta do refrigerante “X”?
– De qual refrigerante você gosta?
Abusos da Estatística
• Pressão do pesquisador:
– Perguntas feitas a indivíduos pesquisados, estes
normalmente dão respostas favoráveis à sua autoimagem.
– Em uma pesquisa telefônica 94% dos entrevistados
responderam que lavam suas mãos após usar um
banheiro, mas a observação em lugares públicos
confirmaram apenas em 68% dos indivíduos.
• Más amostras
– métodos inadequados para coleta de dados.
– Existem técnicas de amostragem.
Estatística
• Conceitos fundamentais:
– POPULAÇÃO
– AMOSTRA
População (Universo
Estatístico)
• conjunto de elementos com pelo menos
uma característica comum.
• Esta característica deve delimitar quais os
elementos que pertencem à população e
quais os que não pertencem.
• Exemplo:Vamos estudar o desempenho dos
estudantes em 2008.
– POPULAÇÃO = todos os estudantes de 2008
População
• Pode ser:
– FINITA: onde o número de unidades a
observar pode ser contado e é limitado. Ex
• alunos matriculados nas escolas públicas
• pessoas portadoras de aparelho telefone
celular
• pacientes da clínica de fisioterapia/terapia
ocupacional “Dom Bosco” de Lins
População
– INFINITA: onde a quantidade de observação é
ilimitada, ou as unidades da população não
podem ser contadas. Ex:
• conjunto de medidas de determinado
comprimento,
• gases, líquidos, onde as unidades não podem
ser identificadas ou contadas.
População - Universo
Estatístico
• Mas a quem interessa este resultado?
• Se o analista dos resultados for o
responsável pelo curso FISIOTERAPIA e
T.O., será que interessa a ele o desempenho
dos alunos de Administração e Ciências
Contábeis?
• Devemos procurar as características que
interessam ao analista dos resultados
População - Universo
Estatístico
• Os alunos da Enfermagem em 2008
• Os alunos da Enfermagem em 2008 que
cursam o 3º termo
• a cada item, estamos especificando cada vez
mais as características das pessoas a serem
observadas, restringindo a “população”
objeto de nossos estudos.
População - Universo
Estatístico
• uma vez definida as características da
POPULAÇÃO
– o passo seguinte é o levantamento de
dados da População acerca das
características objeto de estudo.
• Mas será que SEMPRE SERÁ POSSÍVEL
possível o levantamento de dados de toda
a população que devemos analisar?
Fatores que influenciam o
levantamento de uma população
• TEMPO: as informações devem ser
obtidas com rapidez
 PRECISÃO: as informações devem ser
corretas
 CUSTO: no processo de coleta,
sistematização, análise e interpretação,
o custo deve ser o menor possível.
Amostra
• Outros motivos para se tomar uma amostra
– Exame de doença contagiosa: o pesquisador
poderia infectar-se e começar a transmitir a
doença a todos os entrevistados.
– Testes destrutivos
– exame de sangue de um paciente
– trabalho extenso: anotações erradas
Amostra
• Devemos então delimitar nossas
observações a uma parte da população, isto
é, a uma amostra proveniente dessa
população.
• AMOSTRA: É um subconjunto de uma
população, necessariamente finito, pois todos
os seus elementos serão examinados para
efeito da realização do estudo estatístico
desejado.
Amostra
• A Estatística Indutiva tira conclusões sobre
populações com base nos resultados
observados em amostras extraídas dessas
populações.
• A partir do conhecimento de uma parte,
procura-se tirar conclusões sobre a
realidade, no todo.
• Logicamente a indução não traz resultado
exato, dando margem a erro.
Amostra
• A Estatística Indutiva, entretanto, irá nos
dizer até que ponto poderemos estar errando
em nossas induções e com que
probabilidade.
Amostra
• Quanto maior a amostra, mais confiáveis
serão as induções ?
• erros grosseiros e conclusões falsas podem
ocorrer devido a falhas na amostragem.
Amostragem
• Classificação quanto aos fatores em estudo:
– OBSERVACIONAL: o analista não há
controle sobre os fatores em estudo.
• Ex: Pesquisa eleitoral
– DE EXPERIMENTO: o analista têm o
controle sobre os fatores em estudo.
• O analista pode modificar situações do
ambiente de estudo. Utilizado em pesquisas
científicas.
Variável
• Qual a primeira pergunta que se deve fazer
quando pretende-se fazer uma pesquisa
científica?
Qual é a variável que queremos estudar?
Variável
• portanto, é necessário que se tenham bem
definidas quais características deverão ser
verificadas. Ex.: Alunos da FITEO.
(Universo Estatístico ou População).
• Dentro da população, é preciso definir quais
as características que nos interessa
averiguar.
Ex. idade, sexo, estado
civil, etc.
• A escolha da variável dependerá dos
objetivos do estudo estatístico.
Variável
• é o conjunto de resultados possíveis de um
fenômeno.
• é a característica ou propriedade da
população que está sendo medida. Ex.:
– População: moradores de uma cidade
– Variável : número de filhos
– População: alunos de Administração
– Variável : sexo
Variável
– População:
– Variável :
•
•
•
•
•
moradores de um prédio
peso
CLASSIFICAÇÃO DA VARIÁVEL
pode ser:
A) QUANTITATIVA
A 1 - DISCRETA
A.2 - CONTÍNUA
B) QUALITATIVA
VARIÁVEIS
• QUALITATIVAS: quando a variável é não
numérica ou definida através de atributos,
categorias. Ex:
–
–
–
–
sexo
plano de saúde
tipo de doença
raça
Variáveis
• QUANTITATIVA: quando pode ser
expressa em números. Ex:
–
–
–
–
quantidade de valores de notas de uma moeda
quantidade de sabores de refresco
duração de uma bateria de telefone celular
número de ossos existentes em um animal
Variáveis Quantitativas
• DISCRETAS:
– quando os valores podem assumir apenas
determinados valores e resultam de uma
contagem.
– O conjunto de valores possíveis que a variável
pode assumir é finito ou infinitos enumerável.
Ex:
• valores das cédulas da moeda brasileira
• número de filhos dos casais de Lins
Variáveis Quantitativas
• CONTÍNUAS
– quando os valores podem assumir pertence ao
conjunto dos números reais. Podem assumir
qualquer valor.
– Obtido por medição. Ex;
• peso de um paciente
• altura
• tempo de vôo entre duas cidades
ESCALA DE MEDIÇÃO DAS
VARIÁVEIS
• 1. ESCALA NOMINAL:
– dão nome a uma categoria ou classe.
– Não há hierarquia entre os nomes
Ex: procedência - de que cidade (Lins, Promissão, etc.)
plano de saúde: UNIMED, São Lucas, etc...
ESCALA DE MEDIÇÃO DAS
VARIÁVEIS
• 2. ESCALA ORDINAL:
– dão nome e uma ordem a uma categoria ou classe;
Ex: Grau de instrução: 1: sem instrução;
2: primeiro grau;
3: segundo grau,
4: superior;
5: mestre;
6: doutor.
• embora 3 seja maior do que 2, não significa que 3 + 2 = 5.
• Não é possível quantificar o quanto o nível 3 é melhor do que
2 ou o 4 é melhor do que 3.
ESCALA DE MEDIÇÃO DAS VARIÁVEIS
• ESCALA INTERVALAR: elimina a limitação da escala
ordinal estabelecendo intervalos iguais com o mesmo
significado.
Ex: na medição de temperatura tanto de 25º a 30º o aumento é
de 5º, como o aumento de temperatura tanto de 30º a 35º o
aumento é de 5º.
Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º
da escala de temperatura é arbitrário.
• ESCALA PROPORCIONAL: Apresenta um ZERO
absoluto.
Ex: peso. Peso Zero = ausência de peso. 60 kgs é
o dobro de 30 kgs.
Variáveis DEPENDENTES E INDEPENDENTES
• Variável Independente:
– é a que influencia, determina ou afeta outra variável;
– referida como fator determinante, condição ou causa
para ocorrência de determinada resposta.
• Variável dependente:
– a sua resposta varia em virtude dos diferentes valores
que a variável independente pode assumir;
– modificando-se a variável independente, altera-se o
valor da variável dependente.
Variáveis DEPENDENTES E INDEPENDENTES
• Variável Independente (VI): é o antecedente;
• Variável dependente(VD): é o conseqüente
Variável Independente
Idade dos animais
Deficiência alimentar
Maior pigmentação na
pelagem dos animais
Variável Dependente
comprimento
Dific. De aprendizagem
Menor adaptação em
climas quentes
Variáveis DEPENDENTES E INDEPENDENTES
• Como detectar se uma variável é dependente ou
independente ?
• Critério de sucetibilidade à influência:
– Variável dependente é alterada ou influenciada pela
variável independente:
– Ex: dependente: predisposição a problemas cardíacos
independente: sexo
Variáveis DEPENDENTES E INDEPENDENTES
• Critérios para identificar o sentido de influência
entre as variáveis dependente e independente ?
• 1) Ordem temporal:
– o que ocorre depois não pode influenciar o que
aconteceu antes. Ex:
V. independente
V. dependente
Amamentação materna
Maior resistência a

do recém-nascido
infecções na infância
Hábito de fumar
durante a gravidez

Peso do recém-nascido
Variáveis DEPENDENTES E INDEPENDENTES
• 2) Fixidez: em Ciência Biológicas, muitas variáveis
podem ser consideradas fixas, ou não saão sujeitas a
influências. Ex:
– suscetibilidade a certas doenças está associada ao sexo
do indivíduo;
– variáveis bioquímicas em animais e no homem são
dependentes da idade.
– Peso do recém-nascido está relacionado com a ordem
de nascimento.
CO-VARIÁVEIS
• Em todo experimento existe:
– variável dependente: a ser analisada;
– variável independente:
• que são fatores que influenciam os resultados da
variável dependente;
• determinam as condições sob os quais a variável
dependente é obtida.
CO-VARIÁVEIS
• Qualquer outra variável que possa interferir
no resultado deve ser mantido constante.
• Isto é possível em procedimentos
experimentais e não em processos não
controlados.
• Ex: Comparação de 2 tipos de cirurgias
executadas na rotina hospitalar:
CO-VARIÁVEIS
• Variáveis como: idade e tempo da doença
geralmente devem ser consideradas como
co-variáveis.
• Desta forma a comparação entre
tratamentos pode ser efetuada sem que elas
interfiram,
– mascarando resultados
– levando a conclusões erradas
• Esta neutralização é obtida através de
processos estatísticos adequados
• Ex: Comparação da produção de leite entre
vacas de uma mesma raça, alimentadas com
duas rações diferentes.
– O período de lactação que varia ao longo do
experimento influencia a produção
– esta influência deve ser adequadamente
neutralizada, para que os resultados não sejam
mascarados, levando a conclusões falsas.
CO-VARIÁVEIS
CONCLUSÃO
CO-VARIÁVEL: é um fator que o
pesquisador procura neutralizar
intencionalmente em uma investigação, com
a finalidade de impedir que interfira na
análise da relação entre as variáveis
independentes e dependentes
Tabela Primitiva
• Dado um levantamento de dados estatísticos
de uma variável quantitativa, como por
exemplo, a altura dos alunos da FITEO em
2004, que tenha dado os seguintes valores
(em cm.):
• 165 167 172 160 158 175 157 168
174 179 154 160 173 181 155 166
185 172 157 164 170 168 174 155
Tabela Primitiva
• Notamos que a tabela não está
numericamente organizada.
• A esta tabela denominamos TABELA
PRIMITIVA.
• com os dados dispostos desta maneira é
difícil fazer qualquer análise e tirarmos
alguma conclusão a respeito deste
levantamento.
• Para facilitar a análise vamos dispor em uma
ordem crescente ou decrescente.
ROL
• 154 155 155 157 157 158 160 160
164 165 166 167 168 168 170 172
172 173 174 174 175 179 181 185
• Concluímos que a menor estatura é de 154 e
a maior é de 185.
• A amplitude é de 185 - 154 = 31.
• A leitura da tabela fica mais clara.
• A esta tabela organizada denominamos ROL.
Estatística
• Resumindo:
• TABELA PRIMITIVA: é a tabela onde o
conjunto
de
elementos
não
foram
numericamente ordenados.
• ROL:
a tabela onde os dados foram
numericamente
ordenados
de
forma
crescente ou decrescente.
Distribuição de Freqüência
• Para facilitar a análise dos dados:
– vamos ordenar em colunas colocando o
número de vezes que aparece repetido.
• TABULAR: é registrar quantas vezes o termo
aparece no rol.
• Este processo pode ser inconveniente, pois
pode gera uma tabela muito extensa pela
quantidade de valores diferentes no
levantamento de dados
Distribuição de Freqüência
• Estaturas dos alunos de FITEO-2000
Altura freqüência
154
1
155
2
Altura freqüência
165
1
166
1
157
158
160
2
1
2
167
168
170
1
2
1
154
1
172
2
Fonte: Dados fictícios
Distribuição de Freqüência
• Estaturas dos alunos de FITEO-2004
Altura freqüência
173
1
174
2
175
179
181
1
1
1
185
1
total
24
Distribuição de Freqüência
• Para facilitar a análise dos dados obtidos,
agrupar os valores em intervalos de classes
(principalmente para variáveis contínuas).
• Assim dividimos nossa distribuição em
INTERVALOS DE CLASSE
• INTERVALO DE CLASSE:
agrupar valores.
é a forma de
Distribuição de Freqüência
ALUNOS DA FITEO DO ANO 2004
Altura
freqüência
154
158..........
5
158
162..........
3
162
166..........
2
166
170..........
4
170
174..........
4
174
178..........
3
178
182..........
2
182
186..........
1
total.........
24
Fonte: Dados fictícios
Distribuição de Freqüência
• CLASSES DE FREQÜÊNCIA
• São intervalos de variação da variável
 As
classes
são
representadas
simbolicamente por “ i ”
 Assim o intervalo 162
166 define a 3ª
classe i = 3
 A distribuição é formada por 8 classes
Distribuição de Freqüência
As classes são:
1ª classe:
2ª classe
3ª classe
4ª classe
5ª classe
6ª classe
7ª classe
8ª classe
154
158
162
166
170
174
178
182
158
162
166
170
174
178
182
186
Distribuição de Freqüência
• LIMITES DE CLASSE
• São os extremos de cada classe. Temos
• li = limite inferior da classe
• ls = limite superior da classe
• Referente à 3ª classe temos:
– 162
–
166
li = 162 inclui limite inferior
lS = 166 exclui limite superior
Distribuição de Freqüência
•
•
•
•
•
• FREQÜÊNCIA
É o número de ocorrências em que uma única
característica é observada.
FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi)
São os valores que representam o número de
dados de classe
é resultante da contagem.
Ex: Na 3ª classe a freqüência foi igual a 2, ou
seja duas pessoas têm estatura entre 162 a
166 cm (exclusive).
Distribuição de Freqüência
• FREQÜÊNCIA ACUMULADA (Fac ou Fi )
• É o valor total (soma) das freqüências dos
valores inferiores ao limite superior do
intervalo de uma das classes.
• FREQÜÊNCIA RELATIVA ( Fr )
• É dado pela razão da freqüência simples e a
freqüência total.
Fr = freqüência simples (f i)
freqüência total
Distribuição de Freqüência
FREQÜÊNCIA RELATIVA PERCENTUAL
(Fr %)
Fr % = Fr x 100
PONTO MÉDIO ( PM )
• É o ponto que divide o intervalo de classe em
duas partes iguais.
PM = li + ls
2
Distribuição de Freqüência
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT)
• AT=limite superior máximo-limite inferior
mínimo
• No nosso exemplo AT = 186 - 154 = 32
AMPLITUDE DE UM INTERVALO DE CLASSE
(h)
h = limite superior da classe - limite inferior da
classe
h = ls - li
Download

Estatística