Conceitos e definições de “Estatística”
- Oriunda do latim Status, ciência que cuidava das coisas do Estado
(Idades Antiga e Média), ‘contagem’ das riquezas, levantamentos
agrícolas e comerciais e, principalmente assuntos tributários e
militares.
Não existe uma definição ‘oficial’ do termo, devido à grande
abrangência do mesmo, há até mesmo controvérsias entre os
especialistas do ramo sobre quais definições são ou não corretas.
Depende do contexto em que a expressão é utilizada.
Definições de Estatística (no campo das Ciências):
1- Conjunto dos processos que têm por objetivo a observação, a
classificação formal e análise dos fenômenos coletivos, e por fim a
indução das leis a que tais fenômenos obedecem globalmente.
(Milton da Silva Rodrigues)
2- A Estatística constitui um corpo de procedimentos usados no
estudo de grandes massas e dados numéricos com o objetivo de
extrair dos mesmos fatos reduzidos e simples. (Albert Wanghi)
3- A Estatística está interessada nos métodos científicos para
coleta, organização, resumo, apresentação e análise de dados, bem
como na obtenção de conclusões válidas e na tomada de decisões
razoáveis baseadas em tais análises. ( Murray R. Spiegel)
Modernamente o que se conhece como Ciências Estatísticas, ou
simplesmente Estatística é um conjunto de técnicas e métodos de pesquisa
que entre outros tópicos envolve o planejamento do experimento a ser
realizado, a coleta qualificada dos dados, a inferência, o processamento, a
análise e a disseminação das informações
O desenvolvimento e o aperfeiçoamento de técnicas estatísticas de
obtenção e análise de informações permite o controle e o estudo
adequado de fenômenos, fatos, eventos e ocorrências em diversas áreas
do conhecimento. O objetivo é lidar racionalmente com situações
sujeitas a incertezas
Outra utilização da palavra estatística ocorre no sentido de uma
informação, na expressão de um dado numérico, na determinação de
um fato referente a um grupo de pessoas ou coisas.
Exemplos: - A inflação caiu média em 2002 foi de 5% ao mês.
- 30% dos pós-graduandos deste curso são oriundos da área das
Ciências exatas.
- Divisão da Estatística bastante utilizada:
Estatística Descritiva: Tem por objeto a coleta, a organização
e a descrição dos dados experimentais, sem tirar conclusões de
modo genérico. O seu intuito é descrever as propriedades de uma
população ou amostra.
Exemplo: Os alunos aprovados no vestibular para Medicina tem
como características: 60% são mulheres, tem altura média de
1,65 m , 80% cursou escola privada, suas notas em Português
variaram de 0.5 a 7.8, ...
Estatística Inferencial: Tem por objeto, a partir dos dados obtidos
em uma amostra, através de um conjunto de técnicas numéricas
(testes estatísticos), tirar conclusões, sugerir ou estimar leis de
comportamento da população da qual se retirou a amostra.
Portanto não há estatística inferencial quando ocorre um censo = coleta,
verificação, de todas as unidades de um determinado universo.
Só há estatística inferencial, aplicação de testes por exemplo, quando os
dados provêm de uma AMOSTRA, quando são oriundos de um censo
não há sentido em fazer comparações estatísticas, se todos foram
coletados, a verdade, verdadeiro valor, é o expresso no resultado.
A estatística inferencial permite que formulemos hipóteses a respeito das
características da nossa população que serão respondidas com base na
amostra coletada.
Exemplos: Será o % de mulheres no curso de Psicologia é significativamente superior aos demais cursos ?
- Será a altura dos alunos deste ano significativamente inferior ou
superior aos anos anteriores ?
- As alunas obtiveram médias significativamente superiores aos alunos
na matéria de Português, 4.5 contra 3.8 ?
Significativamente = Quando a chance ( em termos de probabilidade)
de dois valores serem equivalentes é muito pequena. Usualmente
menor que 5%.
Estatística
Coletar, organizar, mensurar, comparar
DADOS
Dados se expressam através das variáveis.
Variável = São as características que se medem, ou se observam,
de um determinado objeto. É o conjunto de resultados possíveis
de um fenômeno quando sujeito a variações. É o que é medido ou
observado.
Cada estudo, experimento, tem o seu conjunto de variáveis de interesse,
ou seja, os elementos, objetos, dos quais queremos saber mais, verificar
seu comportamento em determinadas situações, e chegarmos a
conclusões baseados nos resultados fornecidos pelas variáveis.
Classificação das Variáveis:
Basicamente temos dois grandes grupos:
1 - Var. Quantitativas: São aquelas cujos valores expressam-se por
números em uma escala, referem-se a quantidades, medidas.
contagens.
Também conhecidas como variáveis Numéricas.
Ex: Idade, Pressão Arterial, Salário, Altura, No. dias c/ cefaléia.
As vars. quantitativas subdividem-se em duas categorias:
1.1 - Discretas: Quando sua resposta é número inteiro, sem
frações; entre um valor e o próximo da escala, ou contagem, não
existe resposta.
Ex. No. de filhos, No.de crises epilépticas, Resultado de um teste
psicológico (Rutter).
Repare que não existe a possibilidade de se ter 1,7 filhos.
1.2 - Contínuas: Pode assumir qualquer valor dentro do seu
intervalo de variação, podem ter unidades fracionárias.
Ex. Peso, Diâmetro da bainha do axônio, IMC.
Variável contínua - Qualquer valor entre entre x e y é possível de ocorrer
x_________________________________y
Variável discreta - Somente os pontos tracejados podem ocorrer, nos
brancos não existe a ocorrência.
x_ _ _ _ _ _ _ _ _y
2 - Var. Qualitativas: São aquelas que resultam de uma classificação
em categorias mutuamente exclusivas, não são mensuráveis e sim
“observáveis”, verifica-se a que categoria a resposta pertence.
Também conhecidas como variáveis Categóricas.
Ex: Estado civil, Doença X (ter ou não), Raça, Tipos de Droga.
As vars. qualitativas também subdividem-se em dois tipos:
2.1-Ordinais: Há um sentido de ordem nas categorias da variável,
uma hierarquia nas categorias, no sentido da menor categoria para a
maior (ou vice-versa), há uma relação de grandeza (maior , menor)
entre as categorias da variável.
Ex:Classe social(A, B, C, D e E),Escala de Stress (Ausente, Pouco,
Normal, Bastante, Muito) Escolaridade (Analf., 1o. Grau, 2o.Grau)
2.2 - Nominais: Quando não há uma ordenação lógica entre as
categorias da var., as categorias independem umas das outras,
não é possível afirmar que uma categoria é maior ou menor que
a outra, apenas diferente.
Ex:Curso graduação, Sexo, Tipos de tratamento, Tabagismo.
Var. ordinal, a ordem entre as categorias existe.
A<B<C<D<E
Var. nominal, não há ordem entre as categorias.
A≠ B≠C≠D≠E
Relação entre as variáveis:
- As vars. contínuas podem ser transformadas em vars. discretas, p.exp.,
uma série de valores de Idade (3, 5, 6, 15, 18, 20, 29, 33, 39, 40, ...)
pode ser categorizada como de 0-10 = 1; de 10 a 20 = 2; e assim por
diante.
Já a ‘volta’ , sem os dados originais, é impossível.
Portanto, quando possível opte pela obtenção do valor verdadeiro, pois
a categorização é fácil de ser realizada em pacotes estatísticos.
A utilização de um ou outro tipo dependerá da análise e do pesquisador.
Veremos adiante que as vars. categóricas ordinais, em termos de
análise estatística, serão tratadas como variáveis numéricas.
-Uma diferença importante entre as vars. quantitativas discretas e as
vars. qualitativas ordinais é que nas vars. numéricas a diferença entre
um valor X e o próximo (ou anterior) é sempre o mesmo, tem a
mesma unidade.
Ex: 3 filhos, abaixo 2 filhos, acima 4 filhos, sempre a diferença
tem o mesmo valor, o mesmo peso.
Já nas vars. categóricas ordinais o valor atribuído a cada categoria
depende do pesquisador, não necessariamente a diferença entre
categorias adjacentes é a mesma.
Por exemplo, ao categorizar uma escala de reabilitação motora pode-se
designar valores não uniformes para as categorias: Total = 10;
Quase total = 7; Regular = 5; Pequena = 3; Nenhuma = 0.
Note que a diferença entre as categorias não é uma constante.
-Uma última distinção, bastante utilizada no meio acadêmico é entre
as variáveis dependentes e independentes.
- Var. Dependente: Normalmente é a var. de maior interesse do
estudo, o nome vem do fato que, geralmente, o estudo buscará
verificar como esta variável “depende” das demais, como alterações
nas outras variáveis influem na var. dependente, que é a que se quer
explicar.
- Var. Independente: São as vars. que irão tentar explicar a principal,
logo não estamos interessados de quem elas dependem e sim como as
outras dependem dela, como as variáveis independentes agem, influenciam
a variável dependente.
Mais especificamente, em toda relação entre duas variáveis haverá
uma dependente e outra independente.
Logicamente um estudo pode ter mais de uma variável dependente, bem
como independente.
Exemplo: Desejamos estudar se há diferença no índice de APGAR
entre os sexos.
Var. dependente : Índice de APGAR
Var. independente : Sexo
- Queremos saber como o stress, a ansiedade, a escolaridade e a idade
influenciam no fato de ser ou não obeso.
Var. dependente : Obesidade
Vars. independentes: stress, ansiedade, escolaridade e idade.
A distinção entre var. independente e dependente varia
conforme o experimento, podendo modificar-se até dentro do
mesmo experimento.
Qual a importância de sabermos classificar as variáveis ?
A escolha do teste estatístico a ser realizado com nossos dados
depende basicamente do tipo da variável utilizada. Diferentes
tipos de variáveis demandam diferentes testes estatísticos.
Quadro resumo da classificação
das variáveis
Contínuas: Números que podem assumir
Quantitativas
(Numéricas)
valores fracionários
Discretas: Números inteiros, sem frações
Ordinal: Cada categoria mantém uma
Qualitativas
(Categóricas)
relação de ordem com as demais.
Nominal: Cada categoria é independente
das demais, não há ordenação.
OBTENÇÃO E ARQUIVAMENTO DAS VARIÁVEIS
- Após as definições dos tipos de variáveis, temos as questões:
Como obtemos nossas variáveis ?
Como guardaremos, armazenaremos, nossas vars.?
Como conservaremos nossas vars.?
Na maioria das vezes temos um questionário, um protocolo, que já é
utilizado pelo serviço ou é padrão de determinado local, ou será
necessário desenvolver um de maneira que o mesmo contenha as vars.
que são de interesse da pesquisa.
** A escolha do questionário é de suma de importância, pois depois
do mesmo aplicado, na grande parte das situações reais, não há como
novamente reaplicá-lo, seja porquê não há como localizar novamente
os respondentes, ou a amostra é muito grande e é inviável por tempo
ou custo.
Portanto lembre-se: as variáveis que não forem medidas, observadas,
registradas e que tenha relevância para o pesquisador dificilmente o serão mais tarde. DEFINA BEM COM O SEU ORIENTADOR O QUE
SERÁ COLETADO COM ANTECEDÊNCIA PARA NÃO SOFRER
MAIS ADIANTE.
Depois de definido o seu rol de variáveis, sempre verifique se realmente
irá utilizar todas as variáveis que se dispôs a coletar, e vice-versa, se
tudo o que pretende verificar na sua pesquisa é possível com as vars,
dados, que irá coletar.
Criaremos um questionário fictício que exemplifique e abranja todos
os tipos de variáveis estudados.
QUESTIONÁRIO DO CENTRO DE INFORMÁTICA
E ESTATÍSTICA DO DEPTO DE OFTALMOLOGIA E
OTORRINOLARINGOLOGIA
No.____
Sexo: F (1) M(2) Idade:___(anos)
Grupo: Controle (1) Tratado (2)
Raça: Branco (1) Preto (2) Pardo (3) Outro (4)
Escolaridade: Analfabeto (1) 1o. Grau completo ou inc.(2) 2o. Grau
completo ou inc.(3) 3o. Grau completo ou inc. (4) Pós-grad.
Total dos anos de escolaridade:_____
Renda mensal : Menos ou até um salário mínimo (1) De 1 a 3 s.m.(2)
De 3 a 5 s.m. (3) De 5 a 10 s.m.(4) Mais de 10 s.m.
Total de renda mensal: R$______
Religião: Católica (1) Evangélico (2) Espírita (3) Outras (4)
Praticante: Sim (1) Não (2)
Estado civil: Solteiro (1) Casado (2) Separado (3) Viúvo (4) Amasiado (5)
Outros (6)
* Estas variáveis são bastante conhecidas como vars. demográficas.
Peso:___(em kg) Altura:___(em metros)
Pressão arterial: antes Diastólica: ___ Sistólica: ___
Pressão arterial depois:Diastólica: ___ Sistólica: ___
Peso inicial:___ 1 sem. após:____2 sem. após:___ 3 sem.após____
Número de cistos:____Sente dor: Diariamente(5), Dia sim, dia não(4)
Semanalmente(3) Mensalmente (2) Nunca (1)
Tabagismo: Sim (1) Não (2) Pratica Esporte :Sim(1) Não (2)
Com que frequência:__________
Outras doenças: AIDS: Sim (1) Não (2)
Doenças neurológicas: Sim (1) Não (2)
DST: Sim (1) Não (2)
Questões, “variáveis”, que possam ter mais de uma resposta, por exemplo:
Assinale qual dos sintomas abaixo você sente?
Cada sintoma da lista passa a ser tratada como uma variável binária,
Sim ou Não, Presente ou Ausente.
Como nossas variáveis, nosso dados, nossas informações passarão
do papel, dos questionários, das fichas, para o computador para que
possamos utilizar os pacotes, os softwares estatísticos ? !
Utilização dos programas conhecidos como “planilhas eletrônicas”,
por exemplo, EXCEL, ACESS, DBASE, LOTUS,.... Adotaremos
o EXCEL, pois é atualmente o mais utilizado e encontrado em quase
todos os computadores que utilizam o sistema WINDOWS.
Quando “abrimos” uma tela do EXCEL temos a seguinte tela:
A figura mostra uma planilha em branco, sem nenhum
dado digitado.
O princípio básico que é necessário sempre lembrar e
utilizar é:
As colunas (A, B, C,...) são as variáveis, e as linhas (1, 2, 3 , ...)
são os sujeitos,os indivíduos,as observações, as unidades
amostrais
Portanto na coluna A, exemplificando com o nosso questionário,teremos
os dados referentes ao Sexo (0 ou 1), na coluna B os valores das Idades
e assim por diante. Na linha 1 teremos os dados referentes somente e somente ao sujeito 1, seu sexo, sua idade e assim por diante; na linha 2 só
anotações do segundo indivíduo.
Suj.1: Sexo:M(1) F(2)
Idade: 34 Renda:200
Grupo : (1) (2)
Relig.: Catoc.(1)
Evang. (2) Espir. (3)
Pressão antes:120
Pressão depois:110
Portanto na coluna X
somente dados da var.
X; e na linha Y só dados do sujeito Y
Suj.2: Sexo:M(1) F(2)
Idade: 23 Renda:250
Grupo : (1) (2)
Relig.: Catoc.(1)
Evang. (2) Espir. (3)
Pressão antes:120
Pressão depois:100
Download

Aula 1 - FMRP/USP