O Teste de Lilliefors Renato Gonçalves de Araújo Bruno Isaú Pedrosa História O teste de Lilliefors, criado por Hubert Lilliefors, professor de Estatística na Universidade George Washington, e se trata uma adaptação do teste de KolmogorovSmirnov. Teste de Aderência O objetivo de um teste de aderência é verificar se os dados de uma amostra comportam-se de acordo com uma distribuição teórica. Teste de Aderência. O Teste de Lilliefors O teste de Lilliefors é usado para verificar a aderência dos dados a uma distribuição normal qualquer, isto é, sem a especificação de seus parâmetros. É bastante parecido com o teste de Aderência de Kolmogorov-Smirnov, pois também avaliamos as distribuições acumuladas S(x) e F(x); Obtemos a Distancia Máxima D entre elas; e a comparamos com um valor tabelado em função do nível de significância e do tamanho da amostra. Diferenças Não é necessário especificar especificar μ e σ. Forma de Obtenção de F(x), pois a Média e Desvio Padrão são Calculados com Base na Amostra. Tabela Utilizada para Decisão do Teste. Hipóteses H0: A amostra provem de uma população que segue uma distribuição normal; H1: A amostra não provém de uma população que segue uma distribuição normal. Exemplo de Aplicação Um Fabricante de Autopeças está próximo de fechar um grande contrato com uma montadora. O ponto-chave é a garantia da qualidade de seus produtos, especialmente do diâmetro (em mm) dos eixos produzidos, que ele supõe seguir uma distribuição normal. A Montadora selecionou uma amostra aleatória de 15 eixos para testar especificações de 5% de significância. Os valores estão descritos a seguir: Amostra dos 15 Eixos: 93,45 97,07 94,46 97,68 94,93 97,93 96,17 99,10 96,74 99,30 100,73 103,29 103,60 103,83 105,20 Passos para realizar o Estudo 1º Passo: Obter a Média, e o Desvio Padrão (S). Amostra dos 15 Eixos: 93,45 97,07 94,46 97,68 94,93 97,93 96,17 99,10 96,74 99,30 100,73 103,29 103,60 103,83 105,20 N = 15. x = 1,483.48 Média = 1/N.x ou x / N = 1,483.48 / 15 Média: 98,90 Obtendo S. ( 93,45-98,90)² = 29,7025 ( 94,46-98,90)² = 19,7136 ( 94,93-98,90)² = 15,7609 ( 96,17-98,90)² = 7,4529 ( 96,74-98,90)² = 4,6656 ( 97,07-98,90)² = 3,3489 ( 97,68-98,90)² = 1,4884 ( 97,93-98,90)² = 0,9409 ( 99,10-98,90)² = 0,004 ( 99,30-98,90)² = 0,16 100,73-98,90)² = 3,3489 103,29-98,90)² = 19,2721 103,60-98,90)² = 22,09 103,83-98,90)² = 24,3049 105,20-98,90)² = 39,69 (x – X(Media)²) = 191,9436 S² = 0,0714286 * 191,9436 S² = 13,71025 (S²) = 3,70 S = 3,70 Obtendo as frequências Empíricas - S(xi) Para Obtermos o valor de S(xi) precisamos dividir o valor correspondente do Índice (i), pela quantidade de elementos da amostra (N). Exemplo: N= 15 Sx1 = 1/15 Sx2 = 2/15 ... Sx15 = 15/15 Organizando os dados Encontrando o valor de Z Para cada valor de xi (i = 1,2,3,..,N), calculamos o correspondente escore Zi, usando a Média e o Desvio Padrão (S). A formula para a obtenção do Zi é: Zi = (xi – Media) / S Z1 = (93,45 - 98,90)/3,70 = -1,47 Atualizando os dados Encontrar o F(xi) Para obter o valor de F(xi) é simples, agora que temos o valor de Zi precisamos olhar na tabela de Distribuição Normal Padrão. Para localizarmos o F(x) basta pegar o valor de Z, e pesquisar esse valor relativo na tabela. Por exemplo o Zi = - 1,47 Encontrar o F(xi) na tabela Atualizando os dados Encontrando a maior diferença absoluta. F(xi) – S(xi-1): Valor da frequência teórica na posição do índice menos o valor da frequência empírica no índice 1. F(xi) – S(xi) Valor da frequência teórica na posição do índice menos o valor da frequência empírica no índice. Atualizando os dados Distancia máxima admissível A Maior Diferença absoluta foi 0,205. Devemos comparar a maior diferença absoluta com o valor da tabela de Significância, para concluir se há aderência dos dados a uma distribuição normal ou não. Procurando na Tabela de Significância para N =15, e α = 0,05. Distância máxima admissível Resultado do Teste A estatística do teste para esta amostra é d = 0,149. Na Tabela para α = 5% ou 0,05 e N=15, obtemos a distancia máxima admissível dc = 0,220. Como d < dc, o teste aceita H0 ao nível de significância de 5%, concluindo que há aderência dos dados a uma distribuição normal. Aplausos. Renato Gonçalves de Araújo Bruno Isaú Pedrosa