Testes de Hipóteses Testes de hipóteses • Testes paramétricos • Testes não paramétricos Testes paramétricos Requisitos O primeiro requisito para utilizar a estatística paramétrica exige que seja possível realizar operações numéricas sobre os dados experimentais. Não é suficiente que se possa apenas ordenar os dados, como nos testes paramétricos. As variáveis devem ser naturalmente numéricas, como uma escala contínua de tempos de leitura, ou a nota de um exame. O segundo requisito obriga a que os resultados se distribuam normalmente. No entanto, como os testes paramétricos são bastante robustos, podem ser utilizados mesmo quando este pressuposto é violado, a menos que os dados tenham uma distribuição muito diferente da normal. O terceiro requisito designa-se por homogeneidade da variância. Isto significa que a variabilidade dos resultados em cada situação deve ser sensivelmente a mesma. No entanto, este requisito perde a relevância se o número de sujeitos for o mesmo em cada situação experimental. Testes não paramétricos Os testes não paramétricos não necessitam de requisitos tão fortes, como os testes paramétricos, para serem utilizados. São úteis em situações em que as amostras são pequenas, e onde a distância a esses requisitos é grande. A desvantagem destes testes, face aos testes paramétricos, é não encontrarem tantas diferenças entre os dados, quando elas realmente existem. Testes paramétricos Testes t Testes t Numa dada situação de teste, a variabilidade total dos resultados é igual à variabilidade devida às variáveis independentes mais a variabilidade devida a variáveis desconhecidas. A esta última dá-se o nome de erro. Um investigador deseja, naturalmente, que uma grande proporção da variabilidade total dos resultados seja devida à manipulação das variáveis independentes, enquanto uma proporção relativamente pequena seja devida a outras variáveis (erro). Testes t As proporções destas variabilidades podem ser expressas como um rácio. Variabilidade prevista pelas variáveis independentes Variabilidade devida ao erro Se a percentagem de probabilidades de obter um determinado rácio devido ao acaso for baixa (5% ou 1%), a hipótese nula pode ser rejeitada e os resultados da investigação podem ser interpretados como suportando as previsões efectuadas pela hipótese de teste. Testes t A Hipótese de Teste A primeira coisa que é necessário que aconteça numa hipótese de teste é que ela preveja uma relação entre dois, ou mais, acontecimentos. Exemplo 1: “O saldo médio dos clientes do Norte é superior ao saldo médio dos clientes do Sul.” Exemplo 2: “O volume de empréstimos bancários diminui em épocas de crise económica.” Tais factos são conhecidos como variáveis porque variam na situação de teste. A Hipótese de Teste Um aspecto particularmente importante a considerar, de forma a que se possa testar uma hipótese de teste, é o de que os efeitos previstos possam ocorrer ou não ocorrer. Tendo em consideração os exemplos anteriores, deve ser possível: 1. 2. Observar-se uma diferença nos saldos dos clientes do Norte e do Sul, ou não. Observar-se uma diferença nos volumes de empréstimos bancários, em épocas de crise económica face a épocas de crescimento, ou não. Esta é a regra básica em investigação: Se não existe a possibilidade de um teste rejeitar a hipótese de teste, então não existe qualquer interesse em realizar o teste. A Hipótese Nula Em consequência, uma hipótese de teste tem que ser sempre testada em função de uma hipótese nula, a qual indica que o investigador não encontrará os resultados de teste que espera. Segundo a hipótese nula, quaisquer resultados obtidos num teste são devidos a flutuações ocasionais e não aos efeitos previstos da variável em que o investigador está interessado. Nos nossos exemplos, a hipótese nula afirma que: 1. 2. Não há diferença nos saldos dos clientes do Norte e do Sul. Não há diferença nos volumes de empréstimos bancários, em épocas de crise económica face a épocas de crescimento. Identificação de variáveis Numa situação de teste deparamos com variáveis de duas ordens diferentes: Variáveis independentes – São as que definem as situações ou categorias a testar. Variáveis dependentes – São aquelas cujos valores são avaliados e comparados durante o teste. Nos nossos exemplos: 1. 2. Variável independente: região (Norte ou Sul); variável dependente: saldo. Variável independente: época (crise ou crescimento); variável dependente: empréstimos bancários. Situações de teste Nos testes de hipóteses podemos deparar com duas situações de teste: Dados não relacionados – Quando as categorias da variável dependente, definidas pela variável independente, provêm de indivíduos ou situações distintas. Dados relacionados – Quando os indivíduos ou situações em estudo nas diversas categorias são os mesmos. Nos nossos exemplos: 1. 2. Não relacionados, pois os indivíduos são distintos nas duas categorias (clientes do Norte e clientes do Sul). Relacionados, pois os clientes são os mesmos nas duas situações de teste (crise e crescimento económico). Procedimento O procedimento seguinte é comum a todos os testes de hipóteses: • Formular a hipótese de teste em termos dos resultados previstos face aos valores de uma determinada variável independente. • Implicitamente, a hipótese nula postula que os resultados da investigação são devidos, não aos efeitos previstos pela hipótese de teste, mas a diferenças aleatórias de outras variáveis irrelevantes. • Decida qual o teste estatístico apropriado. • Efectue os cálculos apropriados aos seus dados. • Consulte a tabela estatística apropriada (tendo em conta os graus de liberdade, e se é um teste unicaudal ou bicaudal) para verificar se a probabilidade de o seu teste ser devido ao acaso é inferior a 5% ou a 1%. • Com base nisso, decida se tem que aceitar a hipótese nula, de os seus dados serem devidos ao acaso; ou se pode rejeitar a hipótese nula e interpretar os seus resultados como suportando a hipótese experimental. Cálculo O valor do teste t, para dados não relacionados, obtém-se a partir da expressão: t M1 M 2 2 2 x x x2 1 x2 2 2 n 1 n1 2 1 1 n n n1 1 n2 1 2 1 Em que M1 e M2 representam as médias dos valores da variável dependente para as duas categorias. Cálculo O valor do teste t, para dados relacionados, obtém-se a partir da expressão: t d N d 2 d N 1 2 Em que d representa a diferença entre os valores das duas categorias da variável para cada caso, e N é o número de casos. Consulta da tabela A tabela de valores críticos do teste t tem diversos parâmetros de entrada: • O número de graus de liberdade: gl n1 1 n2 1 (não relacionado) gl N 1 (relacionado) • A direccionalidade do teste: unicaudal, se a comparação é efectuada apenas num sentido (média maior ou menor); bicaudal, se a comparação é efectuada nos dois sentidos (média igual ou diferente). • O nível de significância do teste que, tipicamente, tem os valores de 5% ou 1%, e é escolhido pelo investigador no início do processo de teste de hipóteses. Decisão A comparação do valor de teste calculado com o valor crítico obtido na tabela permite decidir se se deve aceitar ou rejeitar a hipótese nula. • Rejeita-se a hipótese nula quando o valor calculado do teste t é superior ao valor crítico do teste t consultado na tabela. • Aceita-se a hipótese nula quando o valor calculado do teste t é inferior ao valor crítico do teste t consultado na tabela. gl 0,20 Nível de significância para testes unicaudais 0,05 0,025 0,01 Nível de significância para testes bicaudais 0,10 0,05 0,02 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645 0,10 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326 0,005 0,0005 0,01 0,001 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,556 636,619 31,598 12,941 8,610 6,859 5,959 5,405 5,041 4,781 4,587 4,437 4,318 4,221 4,140 4,073 4,015 3,965 3,922 3,883 3,850 3,819 3,792 3,767 3,745 3,725 3,707 3,690 3,674 3,659 3,646 3,551 3,460 3,373 3,291 Tabela t Consulte esta tabela Exemplo Vamos testar a hipótese do nosso 1º exemplo: “O saldo médio dos clientes do Norte é superior ao saldo médio dos clientes do Sul.” A hipótese nula indica que não há diferença entre os saldos médios dos clientes do Norte e do Sul. Escolhemos um nível de significância de 5% para o teste. Exemplo Supor os valores dos saldos médios de 10 clientes do Norte e 10 clientes do Sul, considerando que são a totalidade da população: Grupo 1 (Norte) Grupo 2 (Sul) Resultados Quadrado dos resultados Resultados Quadrado dos resultados Cliente x1 x 12 x2 x 22 1 10 100 2 4 2 5 25 1 1 3 6 36 7 49 4 3 9 4 16 5 9 81 4 16 6 8 64 5 25 7 7 49 2 4 8 5 25 5 25 9 6 36 3 9 10 5 25 4 16 Total (S ) 64 450 37 165 Média 6,4 3,7 Consulte esta tabela Exemplo O cálculo da estatística de teste resulta em: t 6,4 3,7 642 372 450 165 10 10 1 1 99 10 10 3,096 Exemplo O valor crítico do teste t deve ser consultado na tabela: • Para um número de graus de liberdade de 18 [gl=(10-1)+(10-1)] • Para um teste unicaudal, com um nível de significância de 5% O valor crítico obtido é de 1,734. Exemplo Uma vez que o valor calculado do teste t (3,096) é superior ao valor crítico do teste t consultado na tabela (1,734), podemos rejeitar a hipótese nula. Assim, concluímos que os saldos médios dos clientes do Norte são superiores aos saldos médios dos clientes do Sul, ou seja, que a diferença que existe nos seus saldos médios é estatisticamente significativa. SPSS Vejamos, agora, como utilizar o SPSS para resolver o mesmo problema. Uma das questões mais importantes, no SPSS, é saber organizar a informação. Cada variável deve ser colocada numa coluna. Assim, a variável dependente saldo ocupa uma coluna e a variável independente região ocupa outra coluna. SPSS De notar que a variável região é uma variável numérica, apesar de parecer ser do tipo texto. Acontece que foi estabelecida a relação: 1 – Norte 2 – Sul Consulte esta tabela SPSS Inserir os dados, como indicado anteriormente. Na barra de menus escolher: Analyze Compare Means Independent Samples T Test… SPSS Seleccionar a variável, ou variáveis, cuja média se pretende testar e colocá-la na lista de variáveis de teste. Seleccionar a variável que define os grupos de casos e movê-la para a lista de variáveis de agrupamento. Premir o botão Define Groups para indicar a forma como os grupos são definidos. SPSS Depois, premir o botão OK. SPSS Obtém-se o quadro: Independent Samples Test Levene's Test for Equality of Variances t-test for Eq uality of Means F Sig . t df Sig . (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper Equal variances assumed ,423 ,524 3,095 18 ,006 2,70 ,87 ,87 4,53 Equal variances not assumed 3,095 17,438 ,006 2,70 ,87 ,86 4,54 Consulte esta tabela SPSS Nesse quadro pode ler-se que o valor do teste t é 3,095. Mas mais importante que esse facto é o parâmetro da significância (Sig.) que, como se pode ver, vale 0,006. Este valor é bastante inferior ao valor de significância escolhido por nós inicialmente (5%). Uma vez que a significância obtida é inferior a 5%, rejeita-se a hipótese nula.