Bento Janeiro, 2009 • ESTUDOS CORRELACIONAIS • CORRELAÇÕES • “ABSTRACT” • CONTEÚDOS DUM RESUMO • PARTE PRÁTICA: ESTUDO CORRELACIONAL Os estudos correlacionais utilizam-se para estudar fenómenos através do estabelecimento de relações. ?? • QUAL A CORRELAÇÃO QUE INDICA A MAIOR RELAÇAO ENTRE DUAS VARIÁVEIS? a. +.85 ou -.85 b. +.56 ou -.74 ?? • Um Oficial da polícia encontrou uma correlação de .70 entre o número de bares nalgumas cidades do Continente e o número de crimes praticados nessa cidades. Ele concluiu que legislação para diminuir o número de bares reduziria o crime. O que diria sobre a conclusão do Oficial da policia? ?? • Como compararia a correlação de .90 com .45 em termos de magnitude? ?? Um investigador demonstrou uma correlação de +.60 entre as classificações duns Directores de escolas sobre a maneira de vestir dos professores e os resultados académicos dos alunos em 150 escolas primárias. Ele concluiu que encorajando os professores a vestirem-se melhor aumentaria a realização académica. O TEMPO E O PROCESSO EDUCATIVO O QUE “CAUSA” UMA PESSOA SER EDUCADA? O TEMPO E O PROCESSO EDUCATIVO A MENTE HUMANA QUER SABER – NÃO APENAS SABER ACERCA DAS COISAS, MAS SABER O COMO, O PORQUÊ E POR QUE AS COISAS OCORREM DUMA MANEIRA E NÃO DOUTRA. O QUE CAUSA AS NUVENS E A PRECIPITAÇÃO? O QUE CAUSA A APRENDIZAGEM E POR QUE OCORRE NUNS ALUNOS E NÃO NOUTROS? O TEMPO E O PROCESSO EDUCATIVO Os Educadores desejariam descobrir relações VÁLIDAS de causaefeito na educação. Mas na maior parte dos casos, a educação ocorre demasiado caoticamente para ser explicada em termos de causa-efeito. Por isso, os Educadores contam com as evidências correlacionais para muito do que sabem acerca das condições e das práticas que afectam a educação. Conceitos • Variável Variável:: Todo o elemento ou característica que varia em determinado fenómeno. fenómeno. Esse elemento pode ser observado, registado e mensurado mensurado.. As variáveis são portanto, aspectos observáveis de um fenómeno, os quais podem apresentar variações, mudanças e diferentes valores em relação a dado fenómeno e entre fenómenos.. fenómenos • Variável de critério: critério: variável que está sendo predita (dependente) nos estudos que estudam correlações correlações.. • Variável preditora: preditora: Em correlações, a variável (ex. (ex. motivação) usada na tentativa de predizer a variável de critério (ex. (ex. progresso de aprendizagem) (independente). (independente). • Variáveis qualitativas: qualitativas: estão relacionadas com categorias não susceptíveis de medida mas apenas de classificação, assumindo diferentes modalidades (ex. (ex. cor dos olhos).. olhos) • Variáveis quantitativas: quantitativas: Relacionadas com características que tomam valores numéricos e que são susceptíveis de medida (exº peso em kg) • Variáveis quantitativas discretas : quando assumem uma realidade numerável de valores em que os decimais não fazem sentido (ex. (ex. número de filhos por agregado familiar). familiar). • Variáveis quantitativas contínuas: contínuas: quando podem assumir qualquer valor num intervalo de números reais (ex. (ex. rendimento por agregado familiar) CONCEITOS • Coeficiente de correlação correlação:: um índice que resume o grau de relação entre duas variáveis. variáveis. Descreve a magnitude e a direcção da relação entre duas variáveis. variáveis. Os coeficientes de correlação costumam variar de +1,00 (para uma relação directa perfeita), passando por 0,00 (ausência de relação) e chegando a -1,00 (para uma relação inversa perfeita) perfeita).. • Coeficiente de correlação produtoproduto-momento (r) (r):: O coeficiente de correlação mais utilizado, designando a magnitude da relação entre duas variáveis, mensuradas em, pelo menos, uma escala de intervalo intervalo;; também chamado de r de Pearson. • Investigação ex post facto: Investigação realizada após terem ocorrido as alterações na variável independente, no curso natural dos acontecimentos;; uma forma de pesquisa não experimental em que são acontecimentos inferidas as explicações causais, após o facto. facto. • Rho de Spearman Spearman:: Um coeficiente de correlação que indica a magnitude de uma relação entre variáveis mensuradas em uma escala ordinal ordinal.. • Test t: Teste estatístico paramétrico, utilizado para a análise da diferença entre duas médias. médias. CONCEITOS • Testes paramétricos os valores da variável estudada devem ter distribuição normal ou aproximação normal (Teste t-studente, ANOVA).. Já os testes nãoANOVA) não-paramétricos paramétricos,, também chamados por testes de distribuição livre, não têm exigências quanto ao conhecimento da distribuição da variável na população. população.(QuiQuiquadrado,, Mannquadrado Mann-Whitney, KruskalKruskal-Wallis Wallis)). • p< p<..05 05;; p< p<..01 01.. Níveis de probabilidade (significância) especialmente usados por investigadores quando testam hipóteses hipóteses.. O .05 indica menos que 5% de probabilidade que o resultado é devido a erro de amostragem;; O .01 indica menos que 1% de probabilidade. amostragem probabilidade. CONCEITOS ESCALAS Associados às variáveis existem vários tipos de escala, correspondendo os dois primeiros a variáveis qualitativas e os dois últimos a variáveis quantitativas. Nominal (Nominal): Dados classificados por categorias não ordenadas (ex. sexo, clube de futebol, turma a que pertence, estado civil, religião, etc.). Ordinal (Ordinal): Dados classificados por categorias ordenadas – não existe distância equivalente nos graus de hierarquia (ex. nível de escolaridade: primário, secundário e superior; nível sociosocio-económico: classe alta, média e baixa). Intervalar (Scale): Dados expressos numa escala numérica com origem arbitrária. Intervalos iguais mas o zero é arbitrário (Ex. testes de aptidão, testes de inteligência, temperatura, etc.). Dados podem ser subtraídos e somados mas não divididos ou multiplicados. Não há ponto zero verdadeiro. Razão (Scale): Dados expressos numa escala numérica com origem fixa; supõem zero absoluto em termos de medida (exemplos: idade (anos),classificação num teste (0 a 20), peso, rendimento mensal do agregado familiar (euros), tempo de realização de uma determinada prova (minutos). DOIS TIPOS BÁSICOS DE INVESTIGAÇÃO • Experimental (EXP) e PostPost-facto (P/F) No método experimental, experimental, o investigador manipula um estímulo ou variável com o objectivo de verificar se se produz uma mudança na resposta por parte de um grupo de sujeitos sujeitos.. Permite afirmar a existência de relações causa causa--efeito efeito.. Na investigação postpost-facto facto,, no entanto, o investigador não manipula um estímulo. estímulo. Em vez disso, as respostas de um grupo de sujeitos são medidas para uma variável e comparadas com as respostas medidas numa segunda variável. variável. A investigação post post-facto não permite inferências directas de causa e efeito efeito.. Investigação correlacional • A investigação correlacional preocupa preocupa--se em determinar as relações que existem entre as variáveis.. Não há manipulação das variáveis – variáveis apenas uma investigação da extensão em que as variáveis estão relacionadas relacionadas.. Quando há uma relação entre duas variáveis, dizemos que estão correlacionadas.. A magnitude e a direcção da correlacionadas relação são descritas por meio de um index quantitativo chamado coeficiente de correlação Investigação correlacional • A IC é essencialmente exploratória – um investigador tenta identificar o padrão das relações existentes entre duas ou mais variáveis. variáveis. A informação que se ganha deste tipo de estudos: estudos: a) Compreender um fenómeno complexo b) construir uma teoria acerca de um fenómeno comportacional.. O investigador deve ter presente que a comportacional escolha das variáveis para este tipo de estudo devem ser baseadas em teoria teoria,, em investigações prévias ou nas suas observações observações.. • A partir da teoria fenomenológica podemos fazer a hipótese – há uma relação positiva entre as auto auto-percepções dos alunos do 1º ano e o seu desempenho na leitura.. leitura Relação entre dimensão da turma e o resultado académico.. académico IMPORTÂNCIA DA INVEST. DE CORRELAÇÃO A investigação correlacional na educação procura traços, capacidade, ou condições que coco-variam, ou se correlacionam, com outras outras.. A correlação ajuda ajuda--nos: nos: • Compreender certos eventos relacionados, • • condições, e comportamentos. Predizer condições futuras ou comportamentos numa variável a partir do que nós sabemos de uma outra variável. Por vezes, obter fortes sugestões de que uma variável está “causando” outra. PRECAUÇÕES RELATIVAS A CAUSCAUSEFEITO . . Correlação positiva entre o número de revólveres em uma área geográfica e o número de assassinatos nessa área. NATUREZA DA CORRELAÇÃO • Correlação positiva e negativa Atentem nas seguintes afirmações: 1. Quanto mais velho, menos memória. 2. Quanto mais se dá às crianças, mais elas esperam. 3. As pessoas mais altas tendem a ter mais sucesso nas suas carreiras. 4. Quanto mais castigos físicos se dão às crianças mais agressivas se tornam quando adultas. NATUREZA DA CORRELAÇÃO 5. Bons músicos são normalmente bons em matemática. 6. Pessoas boas em matemática tendem a ser fracas em literatura. 7. Quanto mais praticar guitarra, menos erros cometo. NATUREZA DA CORRELAÇÃO 8. Aquele rapaz pesa muito porque é alto alto.. 9. A temperatura global tem aumentado porque o número de automóveis em circulação tem crescido nos últimos anos anos.. 10 10.. A produção agrícola do ano transacto foi escassa pois choveu pouco no ano passado.. passado 11 11.. A riqueza de um país é proporcional ao nível de escolaridade da sua população. população. NATUREZA DA CORRELAÇÃO Estes são exemplos de relações conhecidas como CORRELAÇÕES CORRELAÇÕES.. É um processo de associação entre variáveis e, para o qual, a estatística pode dar um importante contributo. Em cada afirmação é proposto que duas variáveis são relacionadas no sentido de que quando muda uma a outra também muda num sentido previsto. previsto. Há duas direcções nas quais as mudanças podem ocorrer produzindo o que é conhecido como CORRELAÇÃO POSITIVA E CORRELAÇÃO NEGATVA. NEGATVA. NATUREZA DA CORRELAÇÃO Correlação positiva ocorre quando uma variável aumenta a outra também aumenta aumenta:: por exemplo – quanto mais tempo passar a estudar melhores notas tenho.. Quanto mais calorias um indivíduo ingerir, mais tenho peso irá ganhar. ganhar. Correlação negativa ocorre quando uma variável diminui a outra aumenta aumenta.. Por exemplo – quanto mais peso transporto mais devagar eu ando. Quanto mais exercício praticar, mais peso irei perder. perder. Correlação nula ocorre quando não há relação: relação: número de jóias possuídas e peso da pessoa. pessoa. Distância percorrida até à Universidade e a nota obtida na disciplina de Investigação.. Investigação As rain comes down so umbrellas go up NATUREZA DA CORRELAÇÃO Correlações podem ser estabelecidas com unidades, scores, grupos ou coisas: • Relação entre resultados em matemática e resultados em literatura. • Relação entre recursos das escolas número de aprovações. • Relação entre temperatura numa semana e número de suicídios nessa semana. TRÊS QUESTÕES 1. Existe uma relação entre as variáveis? 2. Em que sentido se estabelece essa relação? 3. Qual a sua magnitude? OBJECTIVOS DOS ESTUDOS CORRELACIONAIS a) Estudar/estabelecer relações entre as variáveis presentes b) Predizer o comportamento de uma das variáveis a partir do comportamento da outra variável (estudos de predição) Exº Correlação entre nível social e desempenho escolar Correlação entre publicidade e nível de alcoolismo entre os jovens CRITÉRIOS PARA ANÁLISE DOS INDICES DE CORRELAÇÃO Coeficiente Entre 0 e 0,20 Interpretação Entre 0,21 e 0,40 Correlação praticamente nula Correlação baixa Entre 0,41 e 0,70 Correlação moderada Entre 0,71 e 0,90 Correlação forte Entre 0,91 e 1 Correlação muito forte Correlação entre o tamanho do cérebro e a inteligência: r = +44 (Rushton e Ankey, 1996); r = +51; r = + 21 (Rushton, 1997). SENTIDO DA CORRELAÇÃO Correlação entre os resultados dos exames do 12º ano e a média na Universidade. SENTIDO DA CORRELAÇÃO Quantidade de exercício físico praticado e peso. SENTIDO DA CORRELAÇÃO Correlação entre os resultados num teste e o peso. Coeficiente de correlação de Pearson r • Este coeficiente é o mais poderoso e apenas pode ser utilizado em variáveis quantitativas – de nível intervalar ou superior.. É um coeficiente de correlação superior paramétrico.. paramétrico (Exº Número de horas dedicadas ao trabalho e a nota obtida na avaliação do desempenho (0 a 20 20)). Coeficiente de correlação de Pearson CORRELAÇÕES __________________________________ Horas Pearson Correlation 1 .924** Sig. (2 tailed) .000 N 20 20 ________________________________ NOTA Pearson Correlation .924 1 Sig. (2(2-tailed) .000 _________ N_________________20____20 **Correlation is significant a the 0.01 Level (2(2-tailed) r = .924, p< 0.01 Coeficiente de determinação – R² = .854. O número de horas de trabalho explica 85.4% da variância da nota da avaliação do desempenho. Deste modo, ainda restam 15% da variável nota por explicar. COEFICIENTE DE CORRELAÇÃO variância Karl PEARSON 1857 - 1936 COEFICIENTE DE CORRELAÇÃO variância Charles SPEARMAN 1863 - 1945 VALOR DE p • p< 0.05 - MENOS DE 5 em 100 ou 1 em 20 • P< 0.05 - Os nossos resultados são estatisticamente significativos • Quanto mais baixo (i.e. perto do zero) o valor de p é, mais significativo são os nossos resultados e maior a nossa fundamentação para rejeitar a hipótese nula. • Quando o resultado é muito baixo (p < .01) então os resultados são muito estatisticamente significativos. • Se o valor de p é mais alto que 0.05 (p > 0.05) 0.05) a hipótese nula não é rejeitada. Em tal caso concluiríamos que os nossos resultados não são significativos. • p = 0.004 (muito significativo). Há apenas 4 possibilidades em 1000 que a • • hipótese nula seja verdadeira; Logo, há 996 possibilidades em 1000 que a minha hipótese alternativa seja verdadeira. p = .049 ? P = .051? Exemplos de resultados Não significativo Significativo Não há associação (ou muito pequena) entre “esquerdismo” e o risco de problemas de leitura (Bishop, 1990) Problemas de leitura estão fortemente associados com dificuldades em processar sons durante a fala (Snowling, 2000). Alta auto estima não impede jovens de fumar, beber, envolver-se em drogas ou sexo prematuro (Baumeister et al., 2003). Tudo o resto sendo igual, os atletas que usam equipamentos vermelhos têm probabilidades significativamente mais altas de ganhar do que aqueles que usam outras cores (Hill and Barton, 2005). Os resultados nulos são informativos, desde que provenham de estudos bem desenhados e conduzidos. Passos na organização da investigação correlacional 1. Identificação das variáveis a serem 2. 3. 4. 5. 6. exploradas Hipóteses ou questões Meio pelos quais as variáveis serão medidas ou designadas Selecção da amostra Recolha de dados Análise dos dados Suponhamos que queremos identificar os factores que predizem o grau de sucesso de novos professores durante o seu primeiro ano na sala de aula. Podíamos chamar esta investigação de “Factores contributivos para o sucesso no 1º ano de ensino” 1. SELECÇÃO DAS VARIÁVEIS: Variável de critério- sucesso no 1º ano de ensino; variável de predição – traço ou condição que se espera obter. As variáveis a serem exploradas na investigação correlacional são sugeridas pelo problema que está sendo investigado. Você determina as relações que quer estudar (ex. capacidade de leitura e a capacidade de escrita). No nosso exemplo, a variável de critério é vaga – tem de ser mensurável ou ordenável ou objectivamente observável: aprendizagem dos alunos, avaliações feitas pelo director, popularidade nos estudantes, popularidade nos colegas, opiniões dos pais, envolvimento em programas, etc. A variável preditiva pode ser qualquer traço mensurável ou observável, comportamento, ou experiência que você acredite pode prever sucesso no primeiro ano de ensino (traços de personalidade, média final da universidade, nota de estágio, capacidade de comunicação, etc.). ? Especifique um traço mensurável ou observável que acredita evidenciar sucesso no primeiro ano de ensino ? Identifique algumas variáveis que você acredita podem predizer a variável de critério 2. Questões ou hipóteses. hipóteses. Depois de as variáreis estarem definidas, desenvolvemdesenvolvem-se as questões de investigação e/ou as hipóteses hipóteses.. Exº 1. O grau de sucesso no 1º ano de ensino pode ser previsto duma maneira válida? Exº 2. Até que nível pode o sucesso n 1º ano de ensino ser previsto com base nas avaliações durante o estágio? Hipótese:: Não existe nenhuma relação entre o Hipótese sucesso no 1º ano de ensino e as avaliações anteriormente tidas no ano de estágio ? Seleccione uma variável preditora e use-a para: 1. Formular a pergunta de investigação 2. Formular a hipótese de pesquisa 3. Avaliar e quantificar as variáveis A ambas as variáveis (de critério e preditoras) devem ser atribuídos scores, ordenadas, ou dicotomizada como género, destria, ou altoalto-baixo baixo.. É preferível que todas as variáveis sejam mensuráveis mensuráveis… … Como trataria as variáveis variáveis:: a) avaliação dos directores? b) Popularidade com alunos? 4. SELECCIONAR A AMOSTRA AMOSTRA.. Seleccionar uma amostra de professores dos quais possamos obter dados dados.. É preferível que a avaliação seja feita no fim do 1º ano ou no início do 2º ano. ano. Para que as correlações da amostra possam ser generalizáveis à população, a amostra deve incluir pelo menos 30 casos e seleccionados aleatoriamente aleatoriamente.. Na maior parte dos casos, uma amostra de conveniência seria suficiente, consistindo, talvez, nos professore do 2º ano de ensino em várias escolas da Região Região.. 5. RECOLHA DE DADOS Recolhidos a partir da amostra e avaliados de acordo com a s variáveis de critério e preditora. Pelo menos temos que ter dois resultados para cada pessoa da amostra. Prof. João Carlos Pred. 32 29 Critério 47 43 6. ANÁLISE DOS DADOS Um dos muitos usos das correlações é fazer previsões da variável de critério a partir da variável previsível. previsível. Há programas de computador que fazem isto muito rapidamente.. Quase todas as variáveis, até mesmo as rapidamente que parecem não relacionadas como, por exemplo, o sucesso no ensino e o número de implantes, mostrarão um pequeno coeficiente de correlação correlação.. Correlações são testadas para significância para determinar se as observações observadas poderiam ter ocorrido por erros na selecção da amostra amostra.. Se uma correlação foi encontrada estatisticamente significativa, podemos dizer que não houve erro na amostra e o resultado se pode aplicar á população 6. ANÁLISE DOS DADOS (Cont. ) Coeficiente são considerados altos se +/+/70 ou acima, moderados se entre +/+/- 40 e +/ +/-- 60, baixos se abaixo de +/ +/-- 20. Quanto mais baixos o coeficiente menos válidas são as previsões de uma variável a partir de outra. OS QUATRO TESTES MAIS COMUNS • O teste t • A razão F • r de Pearson • Qui quadrado Teste t O teste t, ou razão t, é um método utilizado para testar a hipótese da diferença quando são utilizados apenas dois grupos. grupos. Responde á questão: questão: Há diferença significativa entre os dois grupos? Utiliza--se na investigação experimental e na post facto. Utiliza Na investigação post facto, o teste t pode ser utilizado para determinar se dois grupos reconhecidamente diferentes numa dada característica são também diferentes numa segunda. segunda. Por exemplo, para verificar se as pessoas criadas na cidade têm um QI superior às que cresceram no campo, seriam constituídos dois grupos diferenciados segundo o local onde os seus elementos passaram a infância infância.. Ambos os grupos seriam avaliados por testes de QI QI.. E o teste t poderia dizerdizer-nos se os QI médios dos dois grupos diferem significativamente significativamente.. Teste t (Cont.) O valor da razão t necessário para estabelecer a significância depende da dimensão dos dois grupos--amostras grupos amostras.. Por exemplo, se os dois grupos são compostos por 50 pessoas cada, é necessário um valor t igual a 1,98 para indicar significância ao nível de 0,05 05.. Se, no entanto, os grupos forem compostos por 5 pessoas cada, o valor t necessário para atingir a significância a menos de 0,05 é de 2,31 31.. São utilizadas tabelas estatísticas para indicar com precisão quais os valores de t necessários para qualquer dimensão do grupo. grupo. r de Pearson O coeficiente r de Pearson ou correlação produto--momento, é um teste estatístico produto utilizado para testar a hipótese da associação. associação. É usado na investigação P/F e na análise de pistas causais e indica indica--nos se existe ou não uma relação entre dois conjuntos de medições. medições. Se existe uma relação significativa, o r de Pearson também exprime a proximidade dessa associação.. Os valores de r variam desde +1,00 associação passando por 0, até -1,00 00.. Quanto o r mais se afasta do 0 mais forte é a relação entre as duas variáveis.. variáveis r de Pearson (Cont.) • • • O r nunca pode ser usado para inferir directamente relações causais causais.. Um investigador quer descobrir se existe relação entre velocidade de leitura e os resultados escolares.. Selecciona um elevado número de escolares alunos e compara as suas pontuações num teste de velocidade de leitura com a média das suas notas (Investigação P/F) P/F).. Obtém um r = 0,70 70.. Que significa? Que previsão se pode fazer? Pode se afirmar que há uma causacausa-efeito? KISS • Ao conceber as investigações educacionais convém ter presente esta SIGLA (Keep It Simple and Sweet) Sweet). •O plano de investigação deve ser suficientemente simples para poder produzir resultados que respondam de facto às questões que estiveram na base da investigação. investigação. • O computador, de facto, é muitas vezes capaz de triturar muito mais dados do que aqueles que o investigador alguma vez conseguirá interpretar.. interpretar PONTOS A CONSIDERAR NO RESUMO DUM ESTUDO • Quais os principais objectivos da investigação? • Quem foi avaliado (amostra, dimensões amostrais, características • • • • • especiais)? Como foram seleccionados os participantes? Quais os procedimentos de avaliação utilizados? A que condições foram os participantes expostos (caso existam)? Qual o desenho subjacente à investigação? Quais os principais resultados, conclusões e implicações teóricas e/ou práticas? ************ • No geral, o resumo é preciso, específico, coerente e legível? • Há indicação a propósito das palavraspalavras-chave? Bento Janeiro, 2009