1a Lista de Exercício – Estatística 2015 1. Exemplifique, através de um histograma (gráfico de barras), uma v.a. discreta X cujos valores possíveis são inteiros variando de 0 a 10 de modo que moda(X) = mediana(X) = média(X), e outra Y com as mesmas características de X, de modo que moda(Y) > mediana(Y) > média(Y). 2. Uma máquina produz peças cujo comprimento é de 20 cm em média, com desvio padrão de 3 cm. Se 3 peças selecionadas aleatoriamente fossem colocadas lado a lado como a seguir: a) Qual seria a média e desvio padrão do comprimento total destas 3 peças juntas? b) Se apenas uma peça fosse selecionada e usada 3 vezes para demarcar a mesma distância, qual seria a média e o desvio padrão neste caso? 3. A variância de uma v.a. pode ser zero? Exemplifique. Por que a variância não pode ter valores negativos? Se a v.a. expressa a área de uma figura geométrica em metros quadrados, qual a unidade da variância e do desvio padrão desta v.a.? 4. Suponha que a v.a. X possua os valores –1, 1, 3, 5, 7, 9, 11, 13, 15, 17, 19 e 21 todos igualmente prováveis. Qual a média e variância de X? Se dois valores de X fossem escolhidos ao acaso (independentemente) e fosse obtida a diferença entre eles, qual seria o mínimo, o máximo, a média e a variância dessa diferença? 5. Deseja-se estudar mudanças de uso da terra através de uma seqüência temporal de 3 imagens. Para tanto, optou-se pelo uso da Transformação por Componentes Principais. Um determinado autor sugere que as imagens utilizadas nessa transformação devam ter a mesma variância. Suponha que as imagens analisadas A, B e C possuam média igual a 180, 130 e 170, e variância 30, 45 e 67, respectivamente. Que transformação linear você sugere a fim de que as imagens B e C passem a ter a mesma variância de A? Caso se desejasse ter a mesma média e variância para as três imagens, qual a transformação sugerida? Use a imagem A como referência. 6. Numa imagem de 8 bits (256 níveis de cinza – de 0 a 255), uma determinada classe de uso possui a seguinte distribuição de valores: Valor 8 9 10 11 12 13 14 15 16 17 Freqüência 1 1 3 5 7 7 10 20 50 36 Valor 18 19 20 21 22 23 24 25 26 Freqüência 21 15 10 5 3 2 2 1 1 Qual a transformação linear (Y=aX+b) sugerida de forma que 98% dos valores mais frequentes dessa classe estejam entre 10 e 245? Calcule a média e a variância dessa classe após esta transformação, considerando 2 situações diferentes: a) Y é do tipo real (- < Y < +) e b) Y é do tipo inteiro 8 bits (0 Y 255) 7. Uma área qualquer pode ser dividida em 3 áreas disjuntas, sendo 30% de floresta, 65% de cerrado e 5% de água. a) Uma v.a. definida como o número de pontos com água em 10 pontos amostrados pode ser considerada uma v.a. com distribuição binomial mesmo tendo 3 classes envolvidas no processo? Explique. b) Se 10 pontos fossem selecionados ao acaso (com reposição) nesta área, qual a probabilidade de que exatamente 5 pontos sejam de água? c) Se 1000 pontos fossem selecionados ao acaso (com reposição), qual a probabilidade de que pelo menos 320 pontos sejam de floresta? 8. Uma variável X tem média igual a 100 e variância igual a 16. Outra variável Y tem média igual a 110 e variância igual a 25. Considerando que ambas têm distribuição normal, calcule: a) P(98 < X < 110) b) P(X = 100) c) P(X > 200) d) P(Y > 110) e) P(X-100 > 3) f) P(2X > Y+95) 9. Por que o estimador de um parâmetro é considerado uma variável aleatória? Qual o significado do termo “não tendencioso” aplicado ao estimador? Qual é a diferença entre parâmetro, estimador e estimativa? 10. Uma pessoa me disse que para se garantir que a média amostral tenha distribuição normal, deveria ser checado e confirmado que a população original (a partir da qual foi retirada a amostra) tenha também uma distribuição normal. Comente esta afirmação. 11. Se eu dispusesse de diversos estimadores para um mesmo parâmetro, qual deveria ser o critério para se escolher o melhor? 12. Amostras de uma mesma cultura foram retiradas em cinco diferentes regiões de uma imagem de satélite. Os valores das variâncias amostrais (s2), e dos tamanhos das amostras (n) foram: s2 40 30 20 42 50 n 11 20 10 31 13 Construa um intervalo de confiança de 95% para a 2 combinando-se estas variâncias amostrais (Dica: a soma de qui-quadrados também é uma qui-quadrado). Caso se soubesse que as médias amostrais das 5 amostras retiradas foram, respectivamente, 10, 11, 13, 9 e 10, qual seria o melhor estimador para 2? Construa um intervalo de confiança de 95% com este novo estimador. Este IC deveria ser mais estreito que o anterior? Comente. 13. Uma pessoa construiu o intervalo de confiança de 99% para média e variância populacionais. No entanto, a pessoa observou que seus IC eram muito amplos. De que forma ela poderia obter IC mais estreitos conservando-se o mesmo nível de confiança? 14. Como posso saber se o intervalo de confiança para a média deve utilizar um valor z ou t? Por que os intervalos de confiança baseados na distribuição normal padrão (z) são mais estreitos que aqueles obtidos a partir da distribuição t de Student? 15. Por que o intervalo de confiança para a variância é assimétrico e sempre positivo?