Conceitos e definições de “Estatística” - Oriunda do latim Status, ciência que cuidava das coisas do Estado (Idades Antiga e Média), ‘contagem’ das riquezas, levantamentos agrícolas e comerciais e, principalmente assuntos tributários e militares. Não existe uma definição ‘oficial’ do termo, devido à grande abrangência do mesmo, há até mesmo controvérsias entre os especialistas do ramo sobre quais definições são ou não corretas. Depende do contexto em que a expressão é utilizada. Definições de Estatística (no campo das Ciências): 1- Conjunto dos processos que têm por objetivo a observação, a classificação formal e análise dos fenômenos coletivos, e por fim a indução das leis a que tais fenômenos obedecem globalmente. (Milton da Silva Rodrigues) 2- A Estatística constitui um corpo de procedimentos usados no estudo de grandes massas e dados numéricos com o objetivo de extrair dos mesmos fatos reduzidos e simples. (Albert Wanghi) 3- A Estatística está interessada nos métodos científicos para coleta, organização, resumo, apresentação e análise de dados, bem como na obtenção de conclusões válidas e na tomada de decisões razoáveis baseadas em tais análises. ( Murray R. Spiegel) Modernamente o que se conhece como Ciências Estatísticas, ou simplesmente Estatística é um conjunto de técnicas e métodos de pesquisa que entre outros tópicos envolve o planejamento do experimento a ser realizado, a coleta qualificada dos dados, a inferência, o processamento, a análise e a disseminação das informações O desenvolvimento e o aperfeiçoamento de técnicas estatísticas de obtenção e análise de informações permite o controle e o estudo adequado de fenômenos, fatos, eventos e ocorrências em diversas áreas do conhecimento. O objetivo é lidar racionalmente com situações sujeitas a incertezas Outra utilização da palavra estatística ocorre no sentido de uma informação, na expressão de um dado numérico, na determinação de um fato referente a um grupo de pessoas ou coisas. Exemplos: - A inflação caiu média em 2002 foi de 5% ao mês. - 30% dos pós-graduandos deste curso são oriundos da área das Ciências exatas. - Divisão da Estatística bastante utilizada: Estatística Descritiva: Tem por objeto a coleta, a organização e a descrição dos dados experimentais, sem tirar conclusões de modo genérico. O seu intuito é descrever as propriedades de uma população ou amostra. Exemplo: Os alunos aprovados no vestibular para Medicina tem como características: 60% são mulheres, tem altura média de 1,65 m , 80% cursou escola privada, suas notas em Português variaram de 0.5 a 7.8, ... Estatística Inferencial: Tem por objeto, a partir dos dados obtidos em uma amostra, através de um conjunto de técnicas numéricas (testes estatísticos), tirar conclusões, sugerir ou estimar leis de comportamento da população da qual se retirou a amostra. Portanto não há estatística inferencial quando ocorre um censo = coleta, verificação, de todas as unidades de um determinado universo. Só há estatística inferencial, aplicação de testes por exemplo, quando os dados provêm de uma AMOSTRA, quando são oriundos de um censo não há sentido em fazer comparações estatísticas, se todos foram coletados, a verdade, verdadeiro valor, é o expresso no resultado. A estatística inferencial permite que formulemos hipóteses a respeito das características da nossa população que serão respondidas com base na amostra coletada. Exemplos: Será o % de mulheres no curso de Psicologia é significativamente superior aos demais cursos ? - Será a altura dos alunos deste ano significativamente inferior ou superior aos anos anteriores ? - As alunas obtiveram médias significativamente superiores aos alunos na matéria de Português, 4.5 contra 3.8 ? Significativamente = Quando a chance ( em termos de probabilidade) de dois valores serem equivalentes é muito pequena. Usualmente menor que 5%. Estatística Coletar, organizar, mensurar, comparar DADOS Dados se expressam através das variáveis. Variável = São as características que se medem, ou se observam, de um determinado objeto. É o conjunto de resultados possíveis de um fenômeno quando sujeito a variações. É o que é medido ou observado. Cada estudo, experimento, tem o seu conjunto de variáveis de interesse, ou seja, os elementos, objetos, dos quais queremos saber mais, verificar seu comportamento em determinadas situações, e chegarmos a conclusões baseados nos resultados fornecidos pelas variáveis. Classificação das Variáveis: Basicamente temos dois grandes grupos: 1 - Var. Quantitativas: São aquelas cujos valores expressam-se por números em uma escala, referem-se a quantidades, medidas. contagens. Também conhecidas como variáveis Numéricas. Ex: Idade, Pressão Arterial, Salário, Altura, No. dias c/ cefaléia. As vars. quantitativas subdividem-se em duas categorias: 1.1 - Discretas: Quando sua resposta é número inteiro, sem frações; entre um valor e o próximo da escala, ou contagem, não existe resposta. Ex. No. de filhos, No.de crises epilépticas, Resultado de um teste psicológico (Rutter). Repare que não existe a possibilidade de se ter 1,7 filhos. 1.2 - Contínuas: Pode assumir qualquer valor dentro do seu intervalo de variação, podem ter unidades fracionárias. Ex. Peso, Diâmetro da bainha do axônio, IMC. Variável contínua - Qualquer valor entre entre x e y é possível de ocorrer x_________________________________y Variável discreta - Somente os pontos tracejados podem ocorrer, nos brancos não existe a ocorrência. x_ _ _ _ _ _ _ _ _y 2 - Var. Qualitativas: São aquelas que resultam de uma classificação em categorias mutuamente exclusivas, não são mensuráveis e sim “observáveis”, verifica-se a que categoria a resposta pertence. Também conhecidas como variáveis Categóricas. Ex: Estado civil, Doença X (ter ou não), Raça, Tipos de Droga. As vars. qualitativas também subdividem-se em dois tipos: 2.1-Ordinais: Há um sentido de ordem nas categorias da variável, uma hierarquia nas categorias, no sentido da menor categoria para a maior (ou vice-versa), há uma relação de grandeza (maior , menor) entre as categorias da variável. Ex:Classe social(A, B, C, D e E),Escala de Stress (Ausente, Pouco, Normal, Bastante, Muito) Escolaridade (Analf., 1o. Grau, 2o.Grau) 2.2 - Nominais: Quando não há uma ordenação lógica entre as categorias da var., as categorias independem umas das outras, não é possível afirmar que uma categoria é maior ou menor que a outra, apenas diferente. Ex:Curso graduação, Sexo, Tipos de tratamento, Tabagismo. Var. ordinal, a ordem entre as categorias existe. A<B<C<D<E Var. nominal, não há ordem entre as categorias. A≠ B≠C≠D≠E Relação entre as variáveis: - As vars. contínuas podem ser transformadas em vars. discretas, p.exp., uma série de valores de Idade (3, 5, 6, 15, 18, 20, 29, 33, 39, 40, ...) pode ser categorizada como de 0-10 = 1; de 10 a 20 = 2; e assim por diante. Já a ‘volta’ , sem os dados originais, é impossível. Portanto, quando possível opte pela obtenção do valor verdadeiro, pois a categorização é fácil de ser realizada em pacotes estatísticos. A utilização de um ou outro tipo dependerá da análise e do pesquisador. Veremos adiante que as vars. categóricas ordinais, em termos de análise estatística, serão tratadas como variáveis numéricas. -Uma diferença importante entre as vars. quantitativas discretas e as vars. qualitativas ordinais é que nas vars. numéricas a diferença entre um valor X e o próximo (ou anterior) é sempre o mesmo, tem a mesma unidade. Ex: 3 filhos, abaixo 2 filhos, acima 4 filhos, sempre a diferença tem o mesmo valor, o mesmo peso. Já nas vars. categóricas ordinais o valor atribuído a cada categoria depende do pesquisador, não necessariamente a diferença entre categorias adjacentes é a mesma. Por exemplo, ao categorizar uma escala de reabilitação motora pode-se designar valores não uniformes para as categorias: Total = 10; Quase total = 7; Regular = 5; Pequena = 3; Nenhuma = 0. Note que a diferença entre as categorias não é uma constante. -Uma última distinção, bastante utilizada no meio acadêmico é entre as variáveis dependentes e independentes. - Var. Dependente: Normalmente é a var. de maior interesse do estudo, o nome vem do fato que, geralmente, o estudo buscará verificar como esta variável “depende” das demais, como alterações nas outras variáveis influem na var. dependente, que é a que se quer explicar. - Var. Independente: São as vars. que irão tentar explicar a principal, logo não estamos interessados de quem elas dependem e sim como as outras dependem dela, como as variáveis independentes agem, influenciam a variável dependente. Mais especificamente, em toda relação entre duas variáveis haverá uma dependente e outra independente. Logicamente um estudo pode ter mais de uma variável dependente, bem como independente. Exemplo: Desejamos estudar se há diferença no índice de APGAR entre os sexos. Var. dependente : Índice de APGAR Var. independente : Sexo - Queremos saber como o stress, a ansiedade, a escolaridade e a idade influenciam no fato de ser ou não obeso. Var. dependente : Obesidade Vars. independentes: stress, ansiedade, escolaridade e idade. A distinção entre var. independente e dependente varia conforme o experimento, podendo modificar-se até dentro do mesmo experimento. Qual a importância de sabermos classificar as variáveis ? A escolha do teste estatístico a ser realizado com nossos dados depende basicamente do tipo da variável utilizada. Diferentes tipos de variáveis demandam diferentes testes estatísticos. Quadro resumo da classificação das variáveis Contínuas: Números que podem assumir Quantitativas (Numéricas) valores fracionários Discretas: Números inteiros, sem frações Ordinal: Cada categoria mantém uma Qualitativas (Categóricas) relação de ordem com as demais. Nominal: Cada categoria é independente das demais, não há ordenação. OBTENÇÃO E ARQUIVAMENTO DAS VARIÁVEIS - Após as definições dos tipos de variáveis, temos as questões: Como obtemos nossas variáveis ? Como guardaremos, armazenaremos, nossas vars.? Como conservaremos nossas vars.? Na maioria das vezes temos um questionário, um protocolo, que já é utilizado pelo serviço ou é padrão de determinado local, ou será necessário desenvolver um de maneira que o mesmo contenha as vars. que são de interesse da pesquisa. ** A escolha do questionário é de suma de importância, pois depois do mesmo aplicado, na grande parte das situações reais, não há como novamente reaplicá-lo, seja porquê não há como localizar novamente os respondentes, ou a amostra é muito grande e é inviável por tempo ou custo. Portanto lembre-se: as variáveis que não forem medidas, observadas, registradas e que tenha relevância para o pesquisador dificilmente o serão mais tarde. DEFINA BEM COM O SEU ORIENTADOR O QUE SERÁ COLETADO COM ANTECEDÊNCIA PARA NÃO SOFRER MAIS ADIANTE. Depois de definido o seu rol de variáveis, sempre verifique se realmente irá utilizar todas as variáveis que se dispôs a coletar, e vice-versa, se tudo o que pretende verificar na sua pesquisa é possível com as vars, dados, que irá coletar. Criaremos um questionário fictício que exemplifique e abranja todos os tipos de variáveis estudados. QUESTIONÁRIO DO CENTRO DE INFORMÁTICA E ESTATÍSTICA DO DEPTO DE OFTALMOLOGIA E OTORRINOLARINGOLOGIA No.____ Sexo: F (1) M(2) Idade:___(anos) Grupo: Controle (1) Tratado (2) Raça: Branco (1) Preto (2) Pardo (3) Outro (4) Escolaridade: Analfabeto (1) 1o. Grau completo ou inc.(2) 2o. Grau completo ou inc.(3) 3o. Grau completo ou inc. (4) Pós-grad. Total dos anos de escolaridade:_____ Renda mensal : Menos ou até um salário mínimo (1) De 1 a 3 s.m.(2) De 3 a 5 s.m. (3) De 5 a 10 s.m.(4) Mais de 10 s.m. Total de renda mensal: R$______ Religião: Católica (1) Evangélico (2) Espírita (3) Outras (4) Praticante: Sim (1) Não (2) Estado civil: Solteiro (1) Casado (2) Separado (3) Viúvo (4) Amasiado (5) Outros (6) * Estas variáveis são bastante conhecidas como vars. demográficas. Peso:___(em kg) Altura:___(em metros) Pressão arterial: antes Diastólica: ___ Sistólica: ___ Pressão arterial depois:Diastólica: ___ Sistólica: ___ Peso inicial:___ 1 sem. após:____2 sem. após:___ 3 sem.após____ Número de cistos:____Sente dor: Diariamente(5), Dia sim, dia não(4) Semanalmente(3) Mensalmente (2) Nunca (1) Tabagismo: Sim (1) Não (2) Pratica Esporte :Sim(1) Não (2) Com que frequência:__________ Outras doenças: AIDS: Sim (1) Não (2) Doenças neurológicas: Sim (1) Não (2) DST: Sim (1) Não (2) Questões, “variáveis”, que possam ter mais de uma resposta, por exemplo: Assinale qual dos sintomas abaixo você sente? Cada sintoma da lista passa a ser tratada como uma variável binária, Sim ou Não, Presente ou Ausente. Como nossas variáveis, nosso dados, nossas informações passarão do papel, dos questionários, das fichas, para o computador para que possamos utilizar os pacotes, os softwares estatísticos ? ! Utilização dos programas conhecidos como “planilhas eletrônicas”, por exemplo, EXCEL, ACESS, DBASE, LOTUS,.... Adotaremos o EXCEL, pois é atualmente o mais utilizado e encontrado em quase todos os computadores que utilizam o sistema WINDOWS. Quando “abrimos” uma tela do EXCEL temos a seguinte tela: A figura mostra uma planilha em branco, sem nenhum dado digitado. O princípio básico que é necessário sempre lembrar e utilizar é: As colunas (A, B, C,...) são as variáveis, e as linhas (1, 2, 3 , ...) são os sujeitos,os indivíduos,as observações, as unidades amostrais Portanto na coluna A, exemplificando com o nosso questionário,teremos os dados referentes ao Sexo (0 ou 1), na coluna B os valores das Idades e assim por diante. Na linha 1 teremos os dados referentes somente e somente ao sujeito 1, seu sexo, sua idade e assim por diante; na linha 2 só anotações do segundo indivíduo. Suj.1: Sexo:M(1) F(2) Idade: 34 Renda:200 Grupo : (1) (2) Relig.: Catoc.(1) Evang. (2) Espir. (3) Pressão antes:120 Pressão depois:110 Portanto na coluna X somente dados da var. X; e na linha Y só dados do sujeito Y Suj.2: Sexo:M(1) F(2) Idade: 23 Renda:250 Grupo : (1) (2) Relig.: Catoc.(1) Evang. (2) Espir. (3) Pressão antes:120 Pressão depois:100