Comparação de Sistemas Usando Amostragem de Dados por: Tiago A. E. Ferreira Amostragem vs. População População Milhões de números Amostragem X1, X2, ..., Xn Média Média X Desv. Pad. Desv. Pad. s Objetivo: Determinar parâmetros a partir das estatisticas Intervalo de Confiança • Em estatística, inferências (a partir de dados) não são definitivas inquestionáveis: devem ser sempre apresentadas com os intervalos de confiança associados • Nós apenas medimos os fenômenos do mundo real em observações discretas e generalizamos as conclusões para todo o domínio • Há sempre um erro ao processo de generalização Intervalo de Confiança • P(a b) = 1 - onde: – :valor esperado do parâmetro (desconhecido) – (a,b):intervalo de confiança (variável aleatória) – : nível de significância – 100(1 - ) nível de confiança – (1 - ) coeficiente de confiança Métodos para se Determinar o Intervalo de Confiança. • Quantis de k médias • Teorema Central do Limite (a partir de 1 média) – Aproximação pela distribuição normal (n30) – Aproximação pela distribuição t de Student (n<30) Exemplo: Quantis de 100 Médias a 90% de Nível de Confiança-1 • Tomam-se 100 amostras {x1 , x2,.., xn} de n exemplos • Calculam-se as 100 médias • Colocam-se as 100 médias em ordem crescente { y1, y2 ,, y100 } • Toma as [1+0,05(100-1)] e [1+(1-0,05)(100-1)]-ésimas médias como limites inferior e superior { y1,, y5 , y6 ,, y95 , y96 , y100} a b Intervalo de Confiança – Distribuição Normal - N(0,1) • Faz-se a transformação para a normal reduzida N(0,1) Xn x Zn n s • Consulta-se na tabela o quantil z[1-/2] da normal reduzida • Encontra o intervalo de confiança (a,b) s s (a, b) x z(1 2 ) , x z(1 2 ) n n Exemplo 1 Suponha uma certa distribuição de pontos que tenha: Queremos um intervalo de confiança sobre a média de 90%! x = 3.90 s = 0.95 100(1-) = 90 = 0.1 n = 32 Temos, Z[0.995] = 1.645, o que implica um intervalo de confiança 3.62,4.17 3.90 1.645 0.95 3.62 3.90 , 3.90 1.645 0.95 32 32 4.17 Intervalo de Confiança – Estatística de t-Stundent • Faz-se a transformação para a t de Student com graus de liberdade N (0,1) t ( ) ~ ( ) 2 • Consulta-se na tabela o quantil t[1-/2;] da t de Student • Encontra o intervalo de confiança (a,b) s s (a, b) x t(1 2;n1) , x t(1 2;n1) n n Exemplo 2 Suponha a amostragem: {-0.04, -0.19, 0.14, -0.09, -0.14, 0.19, 0.04, 0.09}. Temos, Queremos um intervalo de x=0 confiança sobre a média de 90%! s = 0.138 100(1-) = 90 = 0.1 n=8 Temos, t[0.95;7] = 1.895, o que implica um intervalo de confiança 0.0926,0.0926 0 1.895 0.138 -0.0926 0 , 0 1.895 0.138 8 8 0.0926 Teste de Média Zero médias 0 Intervalos de Confiança que incluem o zero Intervalos de Confiança que não incluem o zero Exemplo 3 A diferença de tempo de processamento para duas diferentes implementações do mesmo algoritmo é dada pela amostragem: {1.5, 2.6, -1.8, 1.3, -0.5, 1.7, 2.4} n = 7; x = 1.03; s2 = 2.57 ; s = 1.60 Intervalo de Confiança de 99% : 100(1-) = 99, = 0.01, 1-/2 = 0.995 1.03 t0.995;6 1.60 1.03 0.605t0.995;6 1.21,3.27 7 t0.995;6 3.707 Procedimentos Estatísticos para Comparação de Dois Sistemas • Observações Emparelhadas Se n experimentos são realizados sobre dois sistemas, e existe uma relação um para um entre o i-ésimo teste do sistema A e o i-ésimo teste do sistema B, estas observações são ditas emparelhadas • Observações Não Emparelhadas Se não existir uma correspondência entre as amostras dos sistemas A e B, as observações são ditas não em parelhadas. Observações Emparelhadas Seis medidas similares foram aplicas a dois sistemas, e obtemos: {(5.4, 19.1), (16.6, 3.5), (0.6, 3.4), (1.4, 2.5), (0.6, 3.6), (7.3, 1.7)} Um Sistema é melhor do que o outro? A diferença de rendimento constitui ma amostragem das seis observações: {-13.7, 13.1, -2.8, -1.1, -3.0, 5.6} X = -0.32; s = 9.03; IC(90%) = -0.32 t0.95 (3.69), t0.95 = 2.015 IC(90%) = (-7.75, 7.11) O intervalo de Confiança incluí o zero, desta forma os dois sistemas não são diferentes! Observações Não Emparelhadas É necessário realizar uma estimativa da variância e dos graus de liberdade: Receita: Procedimento teste-t 1) Calcular as médias 1 xa na 1 xb nb na x ia i 1 nb x i 1 ib Observações Não Emparelhadas 2) Calcular os Desvios Padrões: sa 2 2 x n x ia a a i 1 na 1 sb 2 2 x n x ib b b i 1 nb 1 na nb 1 1 2 2 Observações Não Emparelhadas 3) Calcula a diferença das médias: xa xb 4) Calcular o desvio padrão da diferença das médias: s 2 a 2 b s s na nb Observações Não Emparelhadas 5) Calcular o número efetivo de graus de liberdade: 2 s s na nb 2 1 sa2 1 sb2 na 1 na nb 1 nb 2 a 2 b Observações Não Emparelhadas 6) Calcule o intervalo de confiança para a diferença das médias: xa xb t1 ; s 2 7) Se o intervalo de confiança incluir o zero, a diferença é não significativa em um nível de confiança de 100(1-)%. Se o intervalo de confiança não incluir o zero, então o sinal da diferença das médias indicará qual sistema é o melhor! Exemplo – Observações não Emparelhadas O tempo de processador requerido para executar uma tarefa foi medido em dois sistemas: Sistema A: {5.36, 16.57, 0.62, 1.41, 0.64, 7.26} Sistema B: {19.12, 3.52, 3.38, 2.50, 3.60, 1.74} Sistema A: Sistema B: Média xa = 5.31 Média xb = 5.64 Variância sa2 = 37.92 Variância sa2 = 44.11 na = 6 nb = 6 Exemplo – Observações não Emparelhadas Diferença das médias: xa – xb = -0.33 Desvio Padrão para diferença das médias: s =3.698 Número efetivo de graus de liberdade: = 11.921 t[0.95; 12] = 1.71 Intervalo de confiança = (-6.92, 6.26) O intervalo de confiança inclui o zero! Assim sobre este nível de confiança os sistemas são iguais! Teste Visual 1) Os CI’s não se sobrepõem, o sistema vermelho é melhor. 2) Os CI’s se sobrepõem e as médias estão dentro do CI do sistema oposto. Os sistemas são iguais! 3) Os CI’s se sobrepõem, mas as médias não estão dentro do CI do sistema oposto. É necessário o procedimento do teste-t! Intervalo de Confiança Unilateral Se desejarmos comparar uma grandeza x com um determinado valor, para sabermos, por exemplo, se ela é maior que este valor. Só necessitamos de um lado do intervalo de confiança. Assim, pode-se definir: s s , x ou x , x t1 ;n1 x t1 ;n1 n n Exemplo – IC Unilateral O tempo de resposta a um estimulo foi medido para um sistema A e um sistema B. No de medidas Média Desv. Padrão A 972 124.10 198.20 B 153 141.47 226.11 Sistema Procedimento Teste-t: xa xb 17.37 s = 19.35 = 191.05 ( > 30) IC = (-17.37, -17.37+1.28*19.35) = (-17.37, 7.402) z0.90=1.28 Intervalos de Confiança para Proporções Estatística de Dados Categóricos – Probabilidades associada às Categorias. Tais probabilidade são chamadas de proporções! Dado que n1 das n observação são do tipo 1, o IC para a proporção é dado por: p z1 2 p1 p n1 , onde p , n n se np 10 Exemplo - Proporções Um experimento foi repetido 4 vezes em dois sistemas. O sistema A foi superior Ao sistema B em 26 repetições. O sistema A é superior com uma confiança de 99%? P = 26/40 = 0.65; s = 0.075 ; z0.995 = 2.576 O que dá um IC = 0.62 (2.576)(0.075) = (0.46, 0.84) Como o ponto 0.5 pertence ao IC não pode-se afirmar que o Sistema A é superior ao Sistema B com 99% de certeza! Determinação do Tamanho das Amostras •Tamanho da amostra para determinação da média: Se queremos um precisão de r% e um IC de 100(1-)% s r 100zs xz x 1 n n 100 rx 2 •Tamanho da amostra para determinação de proporções: Se queremos um precisão de r% e um IC de 100(1-)% p1 p 2 p1 p pr p z , nz n r2 Determinação do Tamanho das Amostras •Tamanho da amostra para IC’s que não se sobrepõem: 0.0051 0.005 Sistem a A 0.005 1.960 n 2 0.0061 0.006 Sistem a B 0.006 1.960 n Assim, 2 0.0051 0.005 0.0061 0.006 0.005 1.960 0.006 1.960 n n n 84340 2 2