Planejamento Experimental TADI Renato Vicente 25/05/06 1 Exercício 1 Estamos estudando o impacto do estágio na obtenção de bons empregos. Dentre os recém formados e com empregos considerados bons, foi sorteada uma amostra e observado o número de anos de estágio anteriores à formatura. (a) Calcule a media e a variância; (b) Para efeito de análise, decidiu-se desprezar os valores que se distanciassem da média amostral por mais de dois desvios padrão (outliers), isto é, só serão considerados os valores no intervalo MÉDIA – 2 DESVIOS PADRÃO até MÉDIA + 2 DESVIOS PADRÃO. Recalcule (a) e comente os resultados. Anos de estágio 0 1 2 3 4 5 6 Total Freqüência 25 58 147 105 72 45 10 462 2 Exercício 2 O Centro Acadêmico de uma faculdade pretende iniciar uma campanha junto à direção da escola com vistas a melhoria das salas de informática. Para tal, fez uma enquete com todos os alunos e perguntou sobre o número de computadores que cada um tinha em sua residência. Computadores Freqüência 0 1 2 3 4 Total 156 135 47 25 8 371 (a) Calcule a média e a variância. (b) O centro acadêmico argumenta que o ideal é ter uma média de 1 computador por aluno, juntando os 20 da sala de informática da faculdade com os que os alunos têm em casa. Quantos computadores precisariam ser acrescentados À sala para atender o Centro Acadêmico ? 3 Exercício 3 As notas finais de uma prova do curso de TADI foram: 7,5,4,5,6,3,8,4,5,4,6,4,5,6,4,6,6,3,8,4,5,4,5,5, e 6 . (a) Organize os dados, calcule a média a mediana e a moda. (b) Separa os dados em dois grupos, os aprovados (>=5) e os reprovados. Compare o desvio padrão dos dois grupos. 4 Estatística: Reação em Cadeia 1859: Charles Darwin publica A Origem das Espécies 1869: Francis Galton, primo de Darwin, lê A Origem das Espécies e decide se dedicar à análise quantitativa da herança genética. Publica 1906: Karl Pearson se impressona com o trabalho de Galton. Dá os primeiros cursos em estatística no mundo na University College London. A Herança Natural 5 Estatística: Reação em Cadeia 1906: William Gosset trabalha para a cervejaria Guinness e assiste aos cursos de Pearson. Publica um artigo sob o pseudonimo Student. 1913:Ronald Fisher troca correspondências com Gosset e publica em seu primeiro artigo um desenvolvimento do trabalho. 1919:Ronald Fisher vai trabalhar na Estação de Pesquisa Agrícola de Rothamnsted, onde desenvolve a nov aárea do Planejamento Experimental. 6 Exemplo de Planejamento Experimental por Fisher: Um problema em psicofísica. Uma vidente alega que, ao provar uma xícara de café com leite, é capaz de dizer o que foi colocado primeiro se café ou leite. Como avaliar essa afirmação ? 7 Exemplo de Planejamento Experimental por Fisher: Um problema em psicofísica. 5 leite depois café 1 2 3 4 café depois leite café depois leite café depois leite café depois leite 6 7 leite leite depois depois café café 8 leite depois café 8 Exemplo de Planejamento Experimental por Fisher: Um problema em psicofísica. 5 leite depois café 1 2 3 4 café depois leite café depois leite café depois leite café depois leite 6 7 leite leite depois depois café café 8 leite depois café 9 Aleatorização 1 2 3 4 5 6 7 8 10 Aleatorização 7 8 5 6 leite depois café leite depois café leite depois café leite depois café 3 2 4 1 café depois leite café depois leite café depois leite café depois leite 11 Hipótese Nula Não é possível distinguir a ordem do preparo. Consequência: Se acertar terá sido sorte, obra do acaso. 12 De quantas maneiras podemos classificar as 8 xícaras abaixo em dois grupos ? Para a primeira temos 8 possibilidades. Para a segunda temos 7 possibilidades. Para a terceira temos 6 possibilidades. Para a quarta temos 5 possibilidades. A ordem não importa, então temos 16 caminhos para escolha dos mesmos quatro. No final temos 8x7x6x5/16 =70 maneiras. 13 Qual é a probabilidade de fazermos justamente a escolha certa ? 7 8 5 6 leite depois café leite depois café leite depois café leite depois café 3 2 4 1 café depois leite café depois leite café depois leite café depois leite 1 em 70=1.4% 14 Nível de significância: Quanto de sorte estamos dispostos a aceitar? O nível de significância é a linha arbitrária que traçamos para decidir o que é mera sorte e o que é evidência. Se houver evidência (algo muito improvável aconteceu) rejeitaremos a Hipótese Nula. Fisher costumava adotar 5% . Ao fazermos um teste experimental temos que, no entanto, sempre divulgar o nível de significância assumido. 15 Como avaliar os resultados do experimento ? Xícaras classificadas corretamente Número de maneiras Probabilidade 0 1 1,4% 1 16 22,9% 2 36 51,4 % 3 16 22,9% 4 1 1,4% Total 70 100% No nível de significância de 5% só rejeitamos a Hipótese Nula se todas as xícaras forem classificadas corretamente 16 O teste não está muito rigoroso ? A vidente afirma que às vezes erra mas na maioria das vezes acerta... E se aumentarmos o número de xícaras para 12 (6 de cada tipo)? Agora são: 924 diferentes classificações. 1 maneira de classificar 6 corretamente . 36 maneiras de classificar 5 corretamente. A probabilidade de acertar 5 ou mais é 37/924 = 4% ! 17 Aumentando o número de amostras Agora são: 924 diferentes classificações. 1 maneira de classificar 6 corretamente . 36 maneiras de classificar 5 corretamente. A probabilidade de acertar 5 ou mais é 37/924 = 4% ! Consequência: Rejeitamos a Hipótese Nula, no nível de significância de 5%, se a vidente acertar pelo menos 5 xícaras. 18 Dá para fazer melhor com as mesmas 8 xícaras? Jogamos um moeda para decidir a forma de preparo de cada xícara. 19 De quantas formas podemos preparar aleatoriamente 8 xícaras ? Café -> Leite Leite -> Café 2 x 2 x 2 x 2 x 2 x 2 x 2 x 2 = 256 Assim a chance de acertar a classificação de todas as 8 xícaras é de 1 em 256, de acertar 7 é de 8 em 256. Assim rejeitaríamos a Hipótese Nula caso a vidente acertasse no mínimo 7 das xícaras ! 20