•Communities and Crime Um estudo sobre criminalidade Vítor Arrais Vítor Antero Rodolfo Santos Luiz Fernando Sotero •Introdução: Temos como objetivo demonstrar a relação de cada variável com o índice de crimes violentos nas cidades. Utilizamos como base de dados amostragens em 1994 cidades de diversos estados dos Estados Unidos. •Imigração •Imigração - Análise Estatística Média = 0.03006018 Moda = 0 Mediana = 0.01 Variância = 0.007602003 Desvio padrão = 0.08718947 Coeficiente de assimetria = 0.3447685 Coeficiente curtose = 0.1428571 Primeiro quartil= 0.00 Terceiro quartil= 0.02 Intervalos de Confiança: Nível (ɑ) = 5% P(0.02623093 ≤ µ ≤ 0.03388943) = 95% Nível (ɑ) = 10% P(0.02684703 ≤ µ ≤ 0.03327333) = 90% Intervalos Frequências 1 (0 , 0.1] 1742 2 (0.1 , 0.2] 78 3 (0.2 , 0.3] 22 4 (0.3 , 0.4] 7 5 (0.4 , 0.5] 3 6 (0.5 , 0.6] 4 7 (0.6 , 0.7] 2 8 (0.7 , 0.8] 1 9 (0.8 , 0.9] 2 10 (0.9 , 1] 7 •Imigração Histograma de Sturges Histograma de Freedman-Diaconis (FD) •Pobreza •Pobreza - Análise Estatística Média = 0.3030241 Moda = 0.08 Mediana = 0.25 Variância = 0.05220043 Desvio padrão = 0.2284741 Coeficiente de assimetria = 0.9761458 Coeficiente curtose = 0.3035714 Primeiro quartil= 0.11 Terceiro quartil= 0.45 Intervalos de Confiança: Nível (ɑ) = 5% P(0.2929898 ≤ µ ≤ 0.3130584) = 95% Nível (ɑ) = 10% P(0.2946042 ≤ µ ≤ 0.3114439) = 90% Intervalos Frequências 1 (0 , 0.1] 467 2 (0.1 , 0.2] 410 3 (0.2 , 0.3] 271 4 (0.3 , 0.4] 238 5 (0.4 , 0.5] 226 6 (0.5 , 0.6] 165 7 (0.6 , 0.7] 89 8 (0.7 , 0.8] 56 9 (0.8 , 0.9] 29 10 (0.9 , 1] 40 •Imigração Histograma de Sturges Histograma de Freedman-Diaconis (FD) •Densidade Populacional •Densidade pop. - Análise Estatística Média = 0.2328536 Moda = 0.09 Mediana = 0.17 Variância = 0.04124629 Desvio padrão = 0.2030918 Coeficiente de assimetria = 0.7033939 Coeficiente curtose = 0.2093023 Primeiro quartil= 0.1 Terceiro quartil= 0.28 Intervalos de Confiança: Nível (ɑ) = 5% 0.2239340 0.2417731 P(0.2239340 ≤ µ ≤0.2417731) = 95% Nível (ɑ) = 10% P(0.2253691 ≤ µ ≤ 0.2403380) = 90% Intervalos Frequências 1 (0 , 0.1] 528 2 (0.1 , 0.2] 650 3 (0.2 , 0.3] 650 4 (0.3 , 0.4] 150 5 (0.4 , 0.5] 94 6 (0.5 , 0.6] 56 7 (0.6 , 0.7] 35 8 (0.7 , 0.8] 25 9 (0.8 , 0.9] 28 10 (0.9 , 1] 45 •Imigração Histograma de Sturges Histograma de Freedman-Diaconis (FD) •Testes de hipóteses •Uma amostra: Problema: Em certo ano, antes das eleições no estado Trololó, o governador divulgou os dados do censo estadual relativo àquela década.Neles constavam que o índice percentual da população abaixo da linha de pobreza, que era de 0.3 antes de seu governo, diminuiu para 0.23. Manolo Sotero, um aluno muito esforçado da cadeira de estatística, com seu faro analítico muito apurado, decidiu investigar a veracidade dos dados, pois ele acreditava que essa divulgação seria apenas jogada de marketing do governo. Com uma amostra de 100 pessoas, Manolo obteve uma média percentual de 0.307 relativa a este dado. Sabendo desses dados, Sotero afirmou que os dados oficiais foram forjados. Ele está certo? (Sendo o nível de significância igual a 5%). •Uma amostra: One Sample t-test data: amostra t = 3.269, df = 99, p-value = 0.001485 alternative hypothesis: true mean is not equal to 0.23 95 percent confidence interval: 0.2604198 0.3543802 sample estimates: mean of x 0.3074 Sotero está certo pois, como podemos verificar pelo resultado do teste de hipótese, a média divulgada pelo governo (0.23) não corresponde a média da população porque não está dentro do intervalo de confiança com nível de significância de 5%, também podemos ver que o p-value é muito menor do que o nível de significância, sendo assim, podemos rejeitar a hipótese com mais segurança. •Duas amostras: Problema: Vendo a dedicação de seu primo Manolo, Luís Fernando resolveu verificar o porcentual de população abaixo da linha de pobreza em sua cidade também. Tendo ele entrevistado igualmente 100 pessoas, e obtido uma média percentual de 0.29. Sabendo disso, podemos dizer que os primos Manolo e Luís Fernando são conterrâneos? Considere nível de significância igual a 5%. •Duas Amostras: Welch Two Sample t-test data: amostra and n t = 0, df = 192.929, p-value = 1 alternative hypothesis: true difference in means is not equal to 0.0094 95 percent confidence interval: -0.05186256 0.07066256 sample estimates: mean of x mean of y 0.3074 0.2980 Sim, podemos dizer que eles são conterrâneos, uma vez que analisando o resultado do teste de hipótese, a diferença entre as médias se encontra dento do intervalo de confiança, e ainda mais, o p-value é muito maior que 0.05, o que nos dá mais segurança em aceitar a hipótese. •Conclusão •Conclusão: •Dúvidas?