Estatística II Sociologia e Sociologia e Planeamento ISCTE SOCIOLOGIA E SOCIOLOGIA E PLANEAMENTO Ano Lectivo 2003/2004 (2º Semestre) ESTATÍSTICA II (Interpretação de Outputs de SPSS) Intervalo de Confiança para a Média Populacional Ensaio de Hipóteses para a Média Populacional Helena Carvalho ISCTE, 2004 1 Estatística II Sociologia e Sociologia e Planeamento INTERVALO DE CONFIANÇA PARA A MÉDIA DA POPULAÇÃO – VIA SPSS – Para obter um intervalo de confiança para a média da população com desvio-padrão desconhecido existem duas opções no SPSS: Opção A: Analyze Î Descriptive Statistics Î Explore Esta opção pode usar-se nas seguintes situações: 1. Dispõe-se de uma pequena amostra (n≤30) e a variável em estudo segue uma distribuição normal; 2. Dispõe-se de uma grande amostra (n>30) e a variável em estudo segue uma distribuição normal ou qualquer. Problema em análise: “De uma amostra de 152 alunos inscritos na cadeira de Estatística II dos cursos de Sociologia e Sociologia e Planeamento do ISCTE em 2003/04, obteve-se a média e o desvio-padrão da nota esperada no final do semestre, respectivamente, iguais, a 11,69 valores e 2,232 valores: Descriptive Statistics Que nota espera vir a ter em Estatística II? N Mean Std. Deviation 152 11,69 2,232 Sabendo que no ISCTE, as notas esperadas nas cadeiras seguem uma distribuição normal, pretende-se saber qual o intervalo de confiança a 95% para o verdadeiro valor da média da nota esperada na cadeira, da população (a totalidade de alunos inscritos na cadeira)”1 1 In Carlos Lourenço (2004), Estimação, Intervalo de Confiança para a Média, Textos de apoio das aulas, p.9. Helena Carvalho ISCTE, 2004 2 Estatística II Sociologia e Sociologia e Planeamento Analyze Î Descriptive Statistics Î Explore Variável a analisar Para o efeito basta solicitar as estatísticas clicar em Faz-se se se pretender alterar o nível de confiança, que por defeito é de 95% e E obtém-se o seguinte output: Helena Carvalho ISCTE, 2004 3 Estatística II Sociologia e Sociologia e Planeamento Case Processing Summary Cases Valid Que nota espera vir a ter em Estatística II? Missing Total N Percent N Percent N Percent 152 92,7% 12 7,3% 164 100,0% Descriptives Que nota espera vir a ter em Estatística II? Statistic 11,69 Mean 95% Confidence Interval for Mean Lower Bound 11,34 Upper Bound 12,05 5% Trimmed Mean 11,56 Median 11,50 Variance 4,981 Std. Deviation 2,232 Minimum 1 Maximum 20 Range 19 Interquartile Range Skewness Kurtosis Std. Error ,181 3,00 ,382 ,197 3,612 ,391 São os limites do intervalo de confiança a 95% Interpretação: Helena Carvalho ISCTE, 2004 4 Estatística II Sociologia e Sociologia e Planeamento Opção B: Analyze Î Compare Means Î One-Sample T Test Esta segunda opção para obter – via SPSS – um intervalo de confiança para a média da população está associada ao menu que permite realizar um ensaio de hipóteses para a média da população. Assim vai exemplificar-se, em simultâneo: - o intervalo de confiança para a média da população - e o teste para a média da população. INTERVALO DE CONFIANÇA PARA µ E ENSAIO DE HIPÓTESES PARA µ Apesar do problema em análise utilizar uma grande amostra (uma amostra de 152 alunos do 2º ano dos cursos de Sociologia e de Sociologia e Planeamento) e uma variável (nota a obter em Estatística II) que segue distribuição normal, o menu Compare Means Î One-Sample T Test Pode ser usado, e à semelhança do que foi dito anteriormente, quando: 1. se dispõe de uma pequena amostra (n≤30) e a variável em estudo segue uma distribuição normal; 2. se dispõe de uma grande amostra (n>30) e a variável em estudo segue uma distribuição normal ou qualquer. Problema em análise: Em certa aula de Estatística II, os alunos resolvem fazer previsões sobre a média das notas dessa disciplina. Os alunos não estão propriamente de acordo, apesar de estarem todos optimistas. Um grupo de alunos recorda a média obtida em Estatística I: 8,85 valores Descriptive Statistics Que nota obteve em Estatística I? N Mean Std. Deviation 114 8,85 3,806 e afirma (com muita convicção) que a média de Estatística II vai ser positiva e de 13 valores. Helena Carvalho ISCTE, 2004 5 Estatística II Sociologia e Sociologia e Planeamento Admita-se então que se vai ensaiar a hipótese da nota média na cadeira de Estatística II ser de 13 valores, em alternativa vai considerar-se que não existe nenhuma nota privilegiada. Assim ter-se-á: Ho: µ = 13 Ha: µ ≠ 13 o que implica um teste bilateral. Para efectuar o teste à média da população e o intervalo de confiança para a média da população, no SPSS, procede-se da seguinte forma: Analyze Î Compare Means Î One-Sample T Test clicar em Faz-se Helena Carvalho ISCTE, 2004 Variável cuja média vai Valor a ser testado ser testada (hipótese nula) se se pretender alterar o nível de confiança, que por defeito é de 95% e e obtém-se o seguinte output: 6 Estatística II Sociologia e Sociologia e Planeamento T-Test One-Sample Statistics Que nota espera vir a ter em Estatística II? N Mean Std. Deviation Std. Error Mean 152 11,69 2,232 ,181 Média da amostra Desvio-padrão (corrigido) da amostra Erro padrão da média – corresponde ao desvio-padrão dividido pela n (n=nº de casos) 2,232 152 = 0,181 Valor de µ em teste One-Sample Test Test Value = 13 Que nota espera vir a ter em Estatística II? t df Sig. (2-tailed) Mean Difference -7,218 151 ,000 -1,31 n-1 graus de liberdade df = n-1 ⇒ 152 -1 95% Confidence Interval of the Difference Lower Upper -1,66 -,95 Diferença entre a média amostral e a média teórica em teste Valor da estatística de teste: t = 11,69 − 13 −1,31 = = − 7,218 2,232 0,181 152 Significância (ou probabilidade) associada ao valor da estatística de teste. Valor a partir do qual se toma a decisão sobre rejeitar ou não rejeitar H0, em função do α pré-definido Interpretação: Helena Carvalho ISCTE, 2004 7 Estatística II Sociologia e Sociologia e Planeamento Veja-se agora os resultados relativos ao intervalo de confiança One-Sample Test Test Value = 13 Que nota espera vir a ter em Estatística II? t df Sig. (2-tailed) Mean Difference -7,218 151 ,000 -1,31 95% Confidence Interval of the Difference Lower Upper -1,66 -,95 O SPSS calcula o intervalo de confiança para a diferença entre a desconhecida média populacional e o valor apresentado para teste. Assim ter-se-á um intervalo de confiança para a diferença: µ − µo Os limites desse intervalo obtém-se da seguinte forma: [I 0,95 ] µ* − µo = ⎤⎥ (11,69 − 13 ) − t0,025 × 2,323 ; (11,69 − 13 ) + t0,025 × 2,323 ⎡⎢ ⎦ 2 152 ⎣ 152 [I 0,95 ] µ* − µo = ] − 1,31− 1,96 × 0,181 ; − 1,31+ 1,96 × 0,181[ [I 0,95 ] µ* − µo = ] − 1,31− 0,35 ; − 1,31+ 0,35 [ e finalmente [I 0,95 ] µ* − µo = ] − 1,66 ; − 0,95 [ Como obter então o intervalo de confiança para a média das notas de Estatística II da população (os alunos do 2º ano dos cursos de Sociologia e de Sociologia e Planeamento), a partir dos dados disponibilizados pelo SPSS neste intervalo de confiança para a diferença? Como o SPSS calcula o intervalo de confiança para a diferença µ − µ0 , subtraindo à média da amostra (11,69) o valor de µo , neste caso µo = 13 [I 0,95 ] µ* − µo = ⎤⎥ (11,69 − 13 ) − t0,025 × 2,323 ; (11,69 − 13 ) + t0,025 × 2,323 ⎡⎢ ⎦ 152 152 ⎣ então basta voltar a somar (aos limites do intervalo calculado pelo SPSS) o valor subtraído ( µo = 13 ) e terse-á então: 2 Apesar de estar em estudo uma grande amostra os valores críticos estão designados por − t0,025 e por t 0,025 porque o SPSS usa sempre a distribuição t de Student, a qual, como é sabido, é aproximadamente igual à normal em grandes amostras. Helena Carvalho ISCTE, 2004 8 Estatística II Sociologia e Sociologia e Planeamento [I 0,95 ] µ* = ] − 1,66 + 13 ; − 0,95 + 13 [ obtendo-se [I 0,95 ] µ* = ] 11,34 ; 12,05 [ Como pode verificar-se, obtém-se exactamente os mesmos limites que estão no output da pág.4. INTERVALO DE CONFIANÇA PARA µ E ENSAIO DE HIPÓTESES PARA µ – PEQUENA AMOSTRA E ASSUMINDO QUE A VARIÁVEL SEGUE UMA DISTRIBUIÇÃO NORMAL – Problema em análise3: “Pretende-se saber qual o intervalo de confiança a 95% para o verdadeiro valor da média da nota esperada na cadeira, da população (a totalidade de alunos inscritos na turma SA1...).” Um grupo de alunos da turma SA1 manifesta uma enorme convicção em melhorar a nota média na cadeira do 2º semestre. Defendem que a sua turma vai obter uma nota média de 12 valores. Não obstante, as opiniões dividem-se, pois há quem afirme mesmo que vai ser maior que 12 valores. Vai então fazer-se um ensaio de hipóteses com as seguintes hipóteses: Ho: µ = 12 Ha: µ > 12 Execução no SPSS: Como neste caso vai ser analisada somente a amostra de alunos da turma SA1, pode optar-se por seleccionar apenas essa turma. Para o efeito seguem-se estas etapas: 3 À semelhança da aplicação anterior vai retomar-se o exemplo desenvolvido nos textos de apoio às aulas, op. cit., págs.12-13. Helena Carvalho ISCTE, 2004 9 Estatística II Sociologia e Sociologia e Planeamento Data Î Select cases 1ºpasso 2º passo 1: código da turma SA1 Faz-se e e ficam apenas seleccionados os alunos que integram a amostra (n=25) da turma SA1. Para efectuar o teste à média da população e o intervalo de confiança para a média da população procede-se tal como no exemplo anterior: Helena Carvalho ISCTE, 2004 10 Estatística II Sociologia e Sociologia e Planeamento Analyze Î Compare Means Î One-Sample T Test Ho : µ = 12 One-Sample Statistics Que nota espera vir a ter em Estatística II? N Mean Std. Deviation Std. Error Mean 25 12,24 2,350 ,470 Interpretação: Helena Carvalho ISCTE, 2004 11 Estatística II Sociologia e Sociologia e Planeamento Valor em teste One-Sample Test Test Value = 12 Que nota espera vir a ter em Estatística II? t= t df Sig. (2-tailed) Mean Difference ,511 24 ,614 ,24 12,24 − 12 0,24 = = 0,511 2,350 0,47 25 95% Confidence Interval of the Difference Lower Upper -,73 1,21 X − µo = 12,24 − 12 Interpretação: Quanto ao intervalo de confiança para µ vai ter de se calcular os seus limites fazendo a mesma operação exemplificada na aplicação anterior. A partir deste intervalo para a diferença [I 0,95 ] µ* − µ o = ] − 0,73 ; 1,21 [ 4 basta somar o valor 12 (valor em teste) aos limites obtidos, como se exemplifica [I 0,95 ] µ* = ] − 0,73 + 12 ; 1,21 + 12 [ 4 Estes limites foram assim obtidos [I 0,95 ] µ* − µo = ] (12,24 − 12 ) − t0,025 ; (24 ) × 0,47 ; (12,24 − 12 ) + t0,025 ; (24 ) × 0,47 [ [I 0,95 ] µ* − µo = ] 0,24 − 2,060 × 0,47 ; 0,24 + 2,060 × 0,47 [ [I 0,95 ] µ* − µo = ] − 0,73 ; 1,21 [ Este desenvolvimento pode ser acompanhado com os cálculos apresentados nos textos de apoio às aulas, op. cit., pág.13. Helena Carvalho ISCTE, 2004 12 Estatística II Sociologia e Sociologia e Planeamento e obtém-se então os limites para o intervalo de confiança a 95% para a média das notas da turma SA1: [I 0,95 ] µ* = ]11,27 ; 13,21 [ Como pode recordar-se, são exactamente os limites que se obteriam se se fizesse o intervalo de confiança através do comando Explore5 Descriptives Que nota espera vir a ter em Estatística II? Mean 95% Confidence Interval for Mean Lower Bound 11,27 Upper Bound 13,21 5% Trimmed Mean 12,04 Median 12,00 Variance 5,523 Std. Deviation 2,350 Minimum 10 Maximum 18 Range Interquartile Range 5 Statistic 12,24 Std. Error ,470 8 3,50 Skewness 1,110 ,464 Kurtosis 1,004 ,902 Analyze Î Descriptive Statistics Î Explore Helena Carvalho ISCTE, 2004 13