•Communities and Crime
Um estudo sobre criminalidade
Vítor Arrais
Vítor Antero
Rodolfo Santos
Luiz Fernando Sotero
•Introdução:
Temos como objetivo demonstrar a relação de cada variável com o índice de
crimes violentos nas cidades. Utilizamos como base de dados amostragens
em 1994 cidades de diversos estados dos Estados Unidos.
•Imigração
•Imigração
- Análise Estatística Média = 0.03006018
Moda = 0
Mediana = 0.01
Variância = 0.007602003
Desvio padrão = 0.08718947
Coeficiente de assimetria = 0.3447685
Coeficiente curtose = 0.1428571
Primeiro quartil= 0.00
Terceiro quartil= 0.02
Intervalos de Confiança:
Nível (ɑ) = 5%
P(0.02623093 ≤ µ ≤ 0.03388943) = 95%
Nível (ɑ) = 10%
P(0.02684703 ≤ µ ≤ 0.03327333) = 90%
Intervalos
Frequências
1 (0 , 0.1]
1742
2 (0.1 , 0.2]
78
3 (0.2 , 0.3]
22
4 (0.3 , 0.4]
7
5 (0.4 , 0.5]
3
6 (0.5 , 0.6]
4
7 (0.6 , 0.7]
2
8 (0.7 , 0.8]
1
9 (0.8 , 0.9]
2
10 (0.9 , 1]
7
•Imigração
Histograma de Sturges
Histograma de Freedman-Diaconis (FD)
•Pobreza
•Pobreza
- Análise Estatística Média = 0.3030241
Moda = 0.08
Mediana = 0.25
Variância = 0.05220043
Desvio padrão = 0.2284741
Coeficiente de assimetria = 0.9761458
Coeficiente curtose = 0.3035714
Primeiro quartil= 0.11
Terceiro quartil= 0.45
Intervalos de Confiança:
Nível (ɑ) = 5%
P(0.2929898 ≤ µ ≤ 0.3130584) = 95%
Nível (ɑ) = 10%
P(0.2946042 ≤ µ ≤ 0.3114439) = 90%
Intervalos
Frequências
1 (0 , 0.1]
467
2 (0.1 , 0.2]
410
3 (0.2 , 0.3]
271
4 (0.3 , 0.4]
238
5 (0.4 , 0.5]
226
6 (0.5 , 0.6]
165
7 (0.6 , 0.7]
89
8 (0.7 , 0.8]
56
9 (0.8 , 0.9]
29
10 (0.9 , 1]
40
•Imigração
Histograma de Sturges
Histograma de Freedman-Diaconis (FD)
•Densidade Populacional
•Densidade pop.
- Análise Estatística Média = 0.2328536
Moda = 0.09
Mediana = 0.17
Variância = 0.04124629
Desvio padrão = 0.2030918
Coeficiente de assimetria = 0.7033939
Coeficiente curtose = 0.2093023
Primeiro quartil= 0.1
Terceiro quartil= 0.28
Intervalos de Confiança:
Nível (ɑ) = 5% 0.2239340 0.2417731
P(0.2239340 ≤ µ ≤0.2417731) = 95%
Nível (ɑ) = 10%
P(0.2253691 ≤ µ ≤ 0.2403380) = 90%
Intervalos
Frequências
1 (0 , 0.1]
528
2 (0.1 , 0.2]
650
3 (0.2 , 0.3]
650
4 (0.3 , 0.4]
150
5 (0.4 , 0.5]
94
6 (0.5 , 0.6]
56
7 (0.6 , 0.7]
35
8 (0.7 , 0.8]
25
9 (0.8 , 0.9]
28
10 (0.9 , 1]
45
•Imigração
Histograma de Sturges
Histograma de Freedman-Diaconis (FD)
•Testes de hipóteses
•Uma amostra:
Problema:
Em certo ano, antes das eleições no estado Trololó, o governador
divulgou os dados do censo estadual relativo àquela década.Neles
constavam que o índice percentual da população abaixo da linha de
pobreza, que era de 0.3 antes de seu governo, diminuiu para 0.23.
Manolo Sotero, um aluno muito esforçado da cadeira de estatística,
com seu faro analítico muito apurado, decidiu investigar a veracidade
dos dados, pois ele acreditava que essa divulgação seria apenas
jogada de marketing do governo. Com uma amostra de 100 pessoas,
Manolo obteve uma média percentual de 0.307 relativa a este dado.
Sabendo desses dados, Sotero afirmou que os dados oficiais foram
forjados. Ele está certo? (Sendo o nível de significância igual a 5%).
•Uma amostra:
One Sample t-test
data: amostra
t = 3.269, df = 99, p-value = 0.001485
alternative hypothesis: true mean is not
equal to 0.23
95 percent confidence interval:
0.2604198 0.3543802
sample estimates:
mean of x
0.3074
Sotero está certo pois, como podemos
verificar pelo resultado do teste de
hipótese, a média divulgada pelo governo
(0.23) não corresponde a média da
população porque não está dentro do
intervalo de confiança com nível de
significância de 5%, também podemos ver
que o p-value é muito menor do que o
nível de significância, sendo assim,
podemos rejeitar a hipótese com mais
segurança.
•Duas amostras:
Problema:
Vendo a dedicação de seu primo Manolo, Luís Fernando resolveu
verificar o porcentual de população abaixo da linha de pobreza em
sua cidade também.
Tendo ele entrevistado igualmente 100 pessoas, e obtido uma média
percentual de 0.29. Sabendo disso, podemos dizer que os primos
Manolo e Luís Fernando são conterrâneos?
Considere nível de significância igual a 5%.
•Duas Amostras:
Welch Two Sample t-test
data: amostra and n
t = 0, df = 192.929, p-value = 1
alternative hypothesis: true
difference in means is not equal
to 0.0094
95 percent confidence interval:
-0.05186256 0.07066256
sample estimates:
mean of x mean of y
0.3074 0.2980
Sim, podemos dizer que eles são
conterrâneos, uma vez que
analisando o resultado do teste de
hipótese, a diferença entre as médias
se encontra dento do intervalo de
confiança, e ainda mais, o p-value é
muito maior que 0.05, o que nos dá
mais segurança em aceitar a
hipótese.
•Conclusão
•Conclusão:
•Dúvidas?
Download

Communities and Crime