Inferência Estatística Com utilização do programa SPSS 13.0 Teste de Hipóteses Prof. Salvatore B. Virgillito Testes de Hipóteses • Os Testes de Hipóteses são uma decorrência da Teoria de • • Intervalos de Confiança. Ambas as teorias fazem parte da Estatística Indutiva. Os testes de Hipóteses podem ser divididos em dois grupos: os testes paramétricos, assim chamados por se referirem às hipóteses sobre os parâmetros populacionais e aqueles chamados não-paramétricos pois na verdade se referem exclusivamente à forma da distribuição, ou em outras palavras, dada uma distribuição de freqüências, determinar a que tipo de distribuição de probabilidades esta “adere” melhor. Os testes de Hipóteses assim como os de estimação, baseiam-se em estimadores amostrais para validar as generalizações feitas para as populações. Conceituação • Freqüentemente os pesquisadores utilizam-se desta ferramenta estatística • • • para testarem a veracidade ou não de afirmações feitas sem o devido suporte técnico. Por exemplo, um administrador financeiro pode ter a impressão que seus desembolsos para compra de matéria prima estão mais altos que a média do ano anterior. Outro caso simples poderia ser o aumento do custo do dinheiro para empréstimos para um setor produtivo em relação à outro setor, ou seja a média dos juros cobrados numa indústria em comparação aos cobrados para outra indústria. Ainda, a rejeição de lotes de peças por comparação entre as médias dos diâmetros das peças em dois lotes. Através dos Testes de Hipóteses, testa-se uma hipótese existente Ho inicialmente tida como verdadeira e daí, a partir de uma amostra válida colhida dentro da população de teste, tentar-se-á provar se a hipótese inicial é verdadeira para a população ou abandonar-se-á esta, substituindo-a pela hipótese alternativa H1. Hipóteses • • Sejam portanto as duas amostras, cuja distribuição de freqüências esta indicada abaixo com as respectivas médias. O teste de Hipótese é assim indicado: – – Ho : a verdadeira mé média é H1 : a verdadeira mé média é = 14. = 18. µ0 µ1 µ0 • • µ1 Note-se que uma variável em estudo que esteja entre os valores aproximados de 15 a 17, a princípio pela análise gráfica, pode pertencer ao grupo da esquerda ( cuja média é 14 ) ou ao grupo da direita ( cuja média é 18 ). Portanto se Ho for verdadeira (média igual a 14) , vale o gráfico da esquerda, caso contrário prevalece a outra hipótese de que a média seja igual a 18 e portanto, será verdadeira H1 e valerá o gráfico da direita. Hipóteses • Representa-se esta afirmação em termos de Probabilidade: 1−α 1− β β α Nível de significância • Também chamada de probabilidade de rejeitar-se H0 sendo esta • • escolhida pelo observador analista. Os níveis mais utilizados são: 10%, 5% e 1%. Sua representação gráfica é dada por: 1−α α Poder de um Teste • O poder de um teste é também chamada de probabilidade 1-Beta e representa-se graficamente: 1−α 1− β β • • • α Quanto menor for o nível de significância (alfa) maior será o de Beta e assim menor será a área 1-Beta o que diminui o poder do teste. Ao contrário, quanto maior for o nível de significância (alfa) menor será o de (Beta) e conseqüentemente maior será a área 1-Beta que denomina-se poder do teste . Isto significa que se aumentarmos o grau de significância aumentando Alfa (de 1% para 5% ou até mesmo para 10%) e se com isto H0 não for rejeitada, isto é, se ainda assim a hipótese H0 estiver contida na área (1- alfa) e não na área de rejeição, teremos a certeza de que a variável em estudo pertence ao grupo de H0 e não pertence ao grupo de H1 o que aumenta o poder to teste. Valor Crítico de um Teste Valor Crítico para testes Unilaterais. Suponha então a probabilidade de rejeição de 5% o valor crítico de corte denominado xc será dado por: Zα = Z 50%−5% = Z 045 = ±1,64 , dependendo se o teste unilateral for a direita (positivo) ou a esquerda (negativo). + 1,64 α = 5% Valor Crítico de um Teste Valor Crítico para teste Bilaterais Supondo-se o mesmo nível de significância de 5% o valor crítico de corte denominado xc será dado por: Z 1−α = Z 95% = Z 0475 = ±1,96 2 2 para cada lado da curva de densidade de probabilidade. - 1,96 α = 2, 5% + 1,96 α = 2, 5% Valor de Comparação Valor de comparação Z teste O valor de comparação Z teste é expresso pelo quociente entre a média amostral populacional amostral σ n µ0 , x e a média da hipótese H 0 que está sendo testada, e o desvio padrão da média . Sua fórmula será então : Z teste = x − µ0 σ n xc , escreve-se P ( Z teste ≥ xc ) , então Quando Z teste for maior que rejeição dada pelo nível de significância H0 . α Z teste estará na área de e portanto devemos rejeitar a hipótese inicial Quando um teste for significante ao nível 5%, isto não quer dizer necessariamente que deva ser significante nos outros níveis 1% e 0,1%. Erros de Decisão Erros de decisão Nas diversas hipóteses que podem ser formuladas, erros são sempre possíveis de acontecer, ou por estabelecimento errôneo de uma hipótese ou por má interpretação de resultados. Admita-se que existam quatro possibilidades, duas corretas e duas incorretas: • Aceitar Ho quando esta for verdadeira (correta) representa-se por 1 − α . • Rejeitar Ho quando esta for falsa (correta) representa-se por 1 − β . • • Aceitar Ho quando esta for falsa (erro Tipo II) representa-se por β. Rejeitar Ho quando esta for verdadeira (erro Tipo I) representa-se por α . A aceitação de Ho leva automaticamente à rejeição da hipótese alternativa H1 e vice-versa, a aceitação de H1 leva a rejeição de Ho . Define-se portanto Região Crítica como sendo um intervalo de valores que a variável testada pode assumir e que leve a rejeição da hipótese testada Ho . Erros de decisão 1−α 1− β β Aceitar H0 Decisão Rejeitar H0 α Realidade H0 verdadeira H0 falsa Decisão Correta Erro Tipo II (1 − α ) (β ) Decisão Correta Erro Tipo I (α ) (1 − β ) H0 – Hipótese Nula – hipótese a ser testada. H1 – Hipótese Alternativa. Testes Bilaterais para Média Populacional com σ (desvio-padrão populacional) conhecido. Uma empresa metalúrgica fabricante de peças automotivas afirma que seus anéis para pistões quando instalados tem diâmetro médio de 13 cm (H o, média = 13cm). Numa amostra de 138 anéis de pistão constatou-se que o diâmetro médio era de 12,97cm com desvio-padrão de 0,17cm. Verificar se a afirmação do fabricante é verdadeira ao nível de significância 5%. Note o leitor que, por não termos certeza se a média é maior ou menor temos que supor que ela é “diferente” de 13cm. Portanto o teste é do tipo bilateral. Hipótese inicial a ser testada Hipótese alternativa H o, média = 13 cm H 1, média < ou > que 13cm Z 1−α = Z 95 % = Z 0475 = ±1,96 2 2 Cálculo do Valor Crítico de Teste. Z teste = x − µ0 σ n = 12,97 − 13 = −2,07 0,17 - 1,96 + 1,96 138 α = 2,5% α = 2,5% Como o valor crítico de teste é menor que –1,96 conclui-se que ele está dentro da área de rejeição da Hipótese inicial Ho. Portanto a Hipótese inicial deverá ser rejeitada, ou seja não se pode afirmar que os anéis de pistão, uma vez instalados atendam as especificações demandadas pela fábrica de motores. Testes Unilaterais à Direita para Média Populacional com σ (desvio-padrão populacional) conhecido. Vamos supor agora que a amostra tivesse revelado que a média dos diâmetros era de 13,03cm e que o desvio-padrão continuava 0,17cm. Sendo assim deveríamos conduzir um teste unilateral à direita pois a amostra revelou um valor superior ao afirmado pelo fabricante das peças. Hipótese inicial a ser testada Hipótese alternativa Ho, média = 13 cm H1, média > que 13cm Z 5% = Z 045 = +1,64 Cálculo do Valor Crítico de Teste. Z teste = x − µ0 σ n = 13,03 − 13 = +2,07 0,17 138 +1,64 Como o valor crítico de teste é maior que +1,64 conclui-se que ele também está dentro da área de rejeição da Hipótese inicial Ho. Portanto a Hipótese inicial deverá ser rejeitada, ou seja não se pode afirmar que os anéis de pistão, uma vez instalados atendam as especificações demandadas pela fábrica de motores, pois tudo se passa como se os diâmetros fossem maiores que 13cm. Sensibilidade dos testes de Hipóteses Suponha que no exemplo anterior a amostra tivesse revelado um diâmetro médio de 13,02 ao invés de 13,03, e ainda que o desvio-padrão tivesse sido o mesmo. Testar portanto, ao nível de significância de 5%, a afirmação do fabricante das peças de que o verdadeiro diâmetro é 13cm.. Desta forma o cálculo do Z de teste seria: Z teste = x − µ0 σ n = 13,02 − 13 = +1,382 0,17 138 Este valor encontrado colocaria o Z de teste dentro da área de ACEITAÇÃO da Hipótese inicial pois seria menor que + 1,64. Portanto este fato revela que os testes devem ser conduzidos com muita parcimônia pelo analista. As medições técnicas nestes casos assim como o cálculo da média e do desvio-padrão, devem ser conduzidos com muita precisão pois em se tratando de peças, um lote inteiro poderia ser rejeitado com prejuízo para as partes envolvidas. Exercícios • Lista Exercícios 3, no site