Estatística
• tem objeto e métodos próprios
• não tem um objetivo em si mesma.
• tem como função auxiliar as outras ciências,
sendo portando considerada um método
científico de trabalho
• não é uma ciência.
Estatística
• UTILIZAÇÃO: aplicável a qualquer ramo
do conhecimento onde se manipulem dados
numéricos:
–
–
–
–
Física
Química
Biologia
Engenharia
Ciências Sociais
Ciências Administrativas, etc.
Economia
Medicina
Estatística
• Estatística pode ser dividida em duas partes:
– .Estatística Descritiva - cuida da:
• Organização
• descrição dos dados experimentais;
– .Estatística Indutiva - cuida da:
• análise
• interpretação dos dados
Estatística
• Conceitos fundamentais:
– POPULAÇÃO
– AMOSTRA
População (Universo Estatístico)
• conjunto de elementos com pelo menos
uma característica comum.
• Esta característica deve delimitar quais os
elementos que pertencem à população e
quais os que não pertencem.
• Exemplo:Vamos estudar o desempenho dos
estudantes em 2008.
– POPULAÇÃO = todos os estudantes de 2008
População - Universo Estatístico
• COMO DEFINIR UMA POPULAÇÃO?
• A quem interessa este resultado?
• Se o analista dos resultados for o
responsável pelos cursos de Administração
ou Ciências Contábeis, será que interessa a
ele o desempenho dos alunos de Fisioterapia
ou Educação Física?
• Devemos procurar as características que
interessam ao analista dos resultados
Levantamento
• definida as características da POPULAÇÃO,
o passo seguinte é o levantamento de dados
acerca das características objeto de estudo.
• PERGUNTA-SE...
• Deve-se pesquisar dados de toda a
população?
Levantamento
• Em grande parte das vezes não é
conveniente e em muitas vezes é impossível
• E Por que?
Levantamento
TEMPO: as informações devem ser
obtidas com rapidez
PRECISÃO: as informações devem ser
corretas
CUSTO: no processo de coleta,
sistematização, análise e interpretação,
o custo deve ser o menor possível.
Amostra
• Outros motivos para se tomar uma amostra
– Exame de doença contagiosa: o pesquisador
poderia infectar-se e começar a transmitir a
doença a todos os entrevistados.
– Testes destrutivos
– exame de sangue de um paciente
– trabalho extenso: anotações erradas
Amostra
• Devemos então delimitar nossas
observações a uma parte da população, isto
é, a uma amostra proveniente dessa
população.
• AMOSTRA: É um subconjunto de uma
população, necessariamente finito, pois
todos os seus elementos serão
examinados para efeito da realização do
estudo estatístico desejado.
Amostra
• A Estatística Indutiva tira conclusões sobre
populações com base nos resultados
observados em amostras extraídas dessas
populações.
• A partir do conhecimento de uma parte,
procura-se tirar conclusões sobre a
realidade, no todo.
• Logicamente a indução não traz resultado
exato, dando margem a erro.
Amostra
• A Estatística Indutiva, entretanto, irá nos
dizer até que ponto poderemos estar errando
em nossas induções e com que
probabilidade.
Amostra
• Quanto maior a amostra, mais confiáveis
serão as induções ?
• erros grosseiros e conclusões falsas podem
ocorrer devido a falhas na amostragem.
POPULAÇÃO E AMOSTRA
POPULAÇÃO:
– é uma coleção completa de todos os elementos
a serrem estudados
AMOSTRA:
– é um subconjunto da população
CENSO:
– é uma coleção da dados relativos a todos os
elementos de uma população:
Variável
• Antes de tudo, é necessário que se tenham
bem definidas quais características deverão
ser verificadas. Ex.: Alunos do unisalesiano
. (Universo Estatístico ou População).
• Dentro da população, é preciso definir quais
as características que nos interessa
averiguar.
Ex. idade, sexo, estado
civil, etc.
• A escolha da variável dependerá dos
objetivos do estudo estatístico.
Variável
• é o conjunto de resultados possíveis de um
fenômeno.
• é a característica ou propriedade da
população que está sendo medida. Ex.:
– População: moradores de uma cidade
– Variável : número de filhos
– População: alunos do unisalesiano
– Variável : sexo
Variável
– População:
– Variável :
moradores de um prédio
peso
• CLASSIFICAÇÃO DA VARIÁVEL
• pode ser:
• A) QUANTITATIVA
A 1 - DISCRETA
A.2 - CONTÍNUA
• B) QUALITATIVA
B 1 - NOMINAL
B.2 - ORDINAL
A - Variáveis Quantitativas
• quando pode ser expressa em números.
Ex:
–
–
–
–
quantidade de valores de notas de uma moeda
quantidade de sabores de refresco
duração de uma bateria de telefone celular
número de ossos existentes em um animal
A - Variáveis Quantitativas
• A.1. - Quantitativas DISCRETAS:
– quando os valores podem assumir apenas
determinados valores e resultam de uma
contagem.
– O conjunto de valores possíveis que a variável
pode assumir é finito ou infinitos enumerável.
Ex:
• valores das cédulas da moeda brasileira
• número de filhos dos casais de Lins
A - Variáveis Quantitativas
• A.2. - Quantitativas CONTÍNUAS:
– quando os valores podem assumir pertence ao
conjunto dos números reais. Podem assumir
qualquer valor.
– Obtido por medição. Ex;
• peso de um paciente
• altura
• tempo de vôo entre duas cidades
B - Variáveis Qualitativas
• quando a variável é não numérica ou
definida através de atributos, categorias. Ex:
–
–
–
–
sexo
religião
naturalidade
cor dos olhos
B - Variáveis Qualitativas
B.1. -
qualitativas NOMINAIS:
não tem ordenamento nem hierarquia;
Ex: sexo dos pacientes da clínica; tipo de
convênio utilizado.
B.2. - qualitativas ORDINAIS:
existe uma ordem, uma hierarquia;
Ex: presidente, diretor, gerente, etc...
Classificação: bom, regular, ruim.
ESCALA DE MEDIÇÃO DAS
VARIÁVEIS
• ESCALA NOMINAL:
– dão nome a uma categoria ou classe.
– Os dados não podem ser dispostos em um esquema
ordenado.
Ex: Respostas do tipo “sim”, “não” ou “indeciso”
Procedência de qual cidade (Lins, Promissão, etc.)
– não se faz cálculos (ex: tirar a média)
– algumas vezes são atribuídos números aos dados para
serem inseridas no computador: 0 - sim; 1 - não, 2 indeciso. Neste caso são apenas rótulos e não podem ser
efetuados cálculos com estes números.
ESCALA DE MEDIÇÃO DAS
VARIÁVEIS
• ESCALA ORDINAL:
– dão nome e uma ordem a uma categoria ou classe.
– Diferença entre os valores dos dados não podem ser
determinadas ou não fazem sentido.
• Ex: grau de instrução:1= sem instrução; 2 = primeiro grau; 3 =
segundo grau, 4 = superior; 5 = Mestre; 6 = Doutor.
Não mantém a propriedade dos números: embora 3 seja maior
do que 2, não significa que 3 + 2 = 5.
– Não é possível quantificar o quanto o nível 3 é melhor do
que 2 ou o 4 é melhor do que 3.
ESCALA DE MEDIÇÃO DAS
VARIÁVEIS
• ESCALA INTERVALAR: elimina a limitação da escala
ordinal estabelecendo intervalos iguais com o mesmo
significado.
Ex: na medição de temperatura tanto de 25º a 30º o aumento é
de 5º, como o aumento de temperatura tanto de 30º a 35º o
aumento é de 5º.
Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º
da escala de temperatura é arbitrário.
• ESCALA PROPORCIONAL ou NÍVEL DE RAZÃO:
Apresenta um ZERO absoluto.
Ex: peso. Peso Zero =
ausência de peso. 60 kgs é o dobro de 30 kgs.
Variáveis DEPENDENTES E
INDEPENDENTES
Variável Independente:
– é a que influencia, determina ou afeta outra variável;
– referida como fator determinante, condição ou causa
para ocorrência de determinada resposta.
Variável dependente:
– a sua resposta varia em virtude dos diferentes valores
que a variável independente pode assumir;
– modificando-se a variável independente, altera-se o
valor da variável dependente.
Variáveis DEPENDENTES E
INDEPENDENTES
• Variável Independente (VI): é o antecedente;
• Variável dependente(VD): é o conseqüente
Variável Independente
idade
sexo
Variável Dependente
comprimento
Resistência física
Variáveis DEPENDENTES E
INDEPENDENTES
• Como detectar se uma variável é dependente ou
independente ?
• Critério de sucetibilidade à influência:
– Variável dependente é alterada ou influenciada pela
variável independente:
– Ex: dependente: predisposição a problemas cardíacos
independente: sexo
Variáveis DEPENDENTES E
INDEPENDENTES
• Critérios para identificar o sentido de influência
entre as variáveis dependente e independente ?
• 1) Ordem temporal:
– o que ocorre depois não pode influenciar o que
aconteceu antes. Ex:
V. independente
V. dependente
Aumento do U$ em
Aumento dos preços

relação ao R$
dos combustíveis
Variáveis DEPENDENTES E
INDEPENDENTES
• 2) Fixidez: em Ciência Biológicas, muitas variáveis
podem ser consideradas fixas, ou não são sujeitas a
influências. Ex:
– suscetibilidade a certas doenças está associada ao sexo
do indivíduo;
– variáveis bioquímicas em animais e no homem são
dependentes da idade.
– Peso do recém-nascido está relacionado com a ordem
de nascimento.
CO-VARIÁVEIS
• Em todo experimento existe:
– variável dependente: a ser analisada;
– variável independente:
• que são fatores que influenciam os resultados da
variável dependente;
• determinam as condições sob os quais a variável
dependente é obtida.
CO-VARIÁVEIS
• Qualquer outra variável que possa interferir
no resultado deve ser mantido constante.
• Isto é possível em procedimentos
experimentais e não em processos não
controlados.
• Ex: Comparação de 2 tipos de cirurgias
executadas na rotina hospitalar:
CO-VARIÁVEIS
• Variáveis como: idade e tempo da doença
geralmente devem ser consideradas como
co-variáveis.
• Desta forma a comparação entre
tratamentos pode ser efetuada sem que elas
interfiram,
– mascarando resultados
– levando a conclusões erradas
• Esta neutralização é obtida através de
processos estatísticos adequados
• Ex: Comparação da produção de leite entre
vacas de uma mesma raça, alimentadas com
duas rações diferentes.
– O período de lactação que varia ao longo do
experimento influencia a produção
– esta influência deve ser adequadamente
neutralizada, para que os resultados não sejam
mascarados, levando a conclusões falsas.
CO-VARIÁVEIS
CONCLUSÃO
CO-VARIÁVEL: é um fator que o
pesquisador procura neutralizar
intencionalmente em uma investigação, com
a finalidade de impedir que interfira na
análise da relação entre as variáveis
independentes e dependentes
Tabela Primitiva
• Dado um levantamento de dados estatísticos
de uma variável quantitativa, como por
exemplo, a altura dos alunos da FACAC em
2004, que tenha dado os seguintes valores
(em cm.):
• 165 167 172 160 158 175 157 168
174 179 154 160 173 181 155 166
185 172 157 164 170 168 174 155
Tabela Primitiva
• Notamos que a tabela não está
numericamente organizada.
• A esta tabela denominamos TABELA
PRIMITIVA.
• com os dados dispostos desta maneira é
difícil fazer qualquer análise e tirarmos
alguma conclusão a respeito deste
levantamento.
• Para facilitar a análise vamos dispor em uma
ordem crescente ou decrescente.
ROL
• 154 155 155 157 157 158 160 160
164 165 166 167 168 168 170 172
172 173 174 174 175 179 181 185
• Concluímos que a menor estatura é de 154 e
a maior é de 185.
• A amplitude é de 185 - 154 = 31.
• A leitura da tabela fica mais clara.
• A esta tabela organizada denominamos ROL.
Estatística
• Resumindo:
• TABELA PRIMITIVA: é a tabela onde o
conjunto
de
elementos
não
foram
numericamente ordenados.
• ROL:
a tabela onde os dados foram
numericamente
ordenados
de
forma
crescente ou decrescente.
Distribuição de Freqüência
• Para facilitar a análise dos dados:
– vamos ordenar em colunas colocando o
número de vezes que aparece repetido.
• TABULAR: é registrar quantas vezes o termo
aparece no rol.
• Este processo pode ser inconveniente, pois
pode gera uma tabela muito extensa pela
quantidade de valores diferentes no
levantamento de dados
Distribuição de Freqüência
• Estaturas dos alunos de FACAC-2004
Altura freqüência
154
1
155
2
Altura freqüência
165
1
166
1
157
158
160
2
1
2
167
168
170
1
2
1
154
1
172
2
Fonte: Dados fictícios
Distribuição de Freqüência
• Estaturas dos alunos de um determinado curso
Altura freqüência
173
1
174
2
175
179
181
1
1
1
185
1
total
24
Distribuição de Freqüência
• Para facilitar a análise dos dados obtidos,
agrupar os valores em intervalos de classes
(principalmente para variáveis contínuas).
• Assim dividimos nossa distribuição em
INTERVALOS DE CLASSE
• INTERVALO DE CLASSE:
agrupar valores.
é a forma de
Distribuição de Freqüência
154
158
162
166
170
174
178
182
ALUNOS DE ANO 2004
Altura
freqüência
158..........
5
162..........
3
166..........
2
170..........
4
174..........
4
178..........
3
182..........
2
186..........
1
total.........
24
Fonte: Dados fictícios
Distribuição de Freqüência
• CLASSES DE FREQÜÊNCIA
• São intervalos de variação da variável
 As
classes
são
representadas
simbolicamente por “ i ”
 Assim o intervalo 162
166 define a 3ª
classe i = 3
 A distribuição é formada por 8 classes
Distribuição de Freqüência
As classes são:
1ª classe:
2ª classe
3ª classe
4ª classe
5ª classe
6ª classe
7ª classe
8ª classe
154
158
162
166
170
174
178
182
158
162
166
170
174
178
182
186
Distribuição de Freqüência
• LIMITES DE CLASSE
• São os extremos de cada classe. Temos
• li = limite inferior da classe
• ls = limite superior da classe
• Referente à 3ª classe temos:
– 162
–
166
li = 162 inclui limite inferior
lS = 166 exclui limite superior
Distribuição de Freqüência
•
•
•
•
•
• FREQÜÊNCIA
É o número de ocorrências em que uma única
característica é observada.
FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi)
São os valores que representam o número de
dados de classe
é resultante da contagem.
Ex: Na 3ª classe a freqüência foi igual a 2, ou
seja duas pessoas têm estatura entre 162 a
166 cm (exclusive).
Distribuição de Freqüência
• FREQÜÊNCIA ACUMULADA (Fac ou Fi )
• É o valor total (soma) das freqüências dos
valores inferiores ao limite superior do
intervalo de uma das classes.
• FREQÜÊNCIA RELATIVA ( Fr )
• É dado pela razão da freqüência simples e a
freqüência total.
Fr = freqüência simples (f i)
freqüência total
Distribuição de Freqüência
FREQÜÊNCIA RELATIVA PERCENTUAL
(Fr %)
Fr % = Fr x 100
PONTO MÉDIO ( PM )
• É o ponto que divide o intervalo de classe em
duas partes iguais.
PM = li + ls
2
Distribuição de Freqüência
AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT)
• AT=limite superior máximo-limite inferior
mínimo
• No nosso exemplo AT = 186 - 154 = 32
AMPLITUDE DE UM INTERVALO DE CLASSE
(h)
h = limite superior da classe - limite inferior da
classe
h = ls - li
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
Quantos elementos foram pesquisados?
Quantas pessoas têm altura entre 160 (inclusive) e 170 (excluindo)
Isto representa quantos porcento do total?
Quantos porcento têm altura entre 160 (inclusive ) e 180 (excluindo)?
Quantas pessoas têm altura inferior a 170?
Quantos porcento têm altura de no mínimo 160?
Quantos porcento têm altura abaixo de 180?
Qual a classe (faixa de altura) de maior freqûëncia? Quantos
porcento esta classe representa do total?
Qual a classe de menor freqüência? Quantos alunos representam?
Se for sorteado um elemento ao acaso, qual a probabilidade deste
elemento ter altura mínima de 170?
Escolhido um aluno ao acaso, sabendo-se que ele têm altura abaixo de
170, qual a probabilidade dele ter altura entre 160 (inclusive) e 170?
Escolhido um aluno ao acaso, sabendo que ele tem altura maior ou
igual a 160, qual a probabilidade dele ter altura acima de 170?
Download

CO-VARIÁVEIS - unisalesiano