Aula 5
Introdução ao Stata
16 de abril de 2013
Gráficos
• O comando graph do STATA possui várias
opções.
• Em geral, gráficos de barra são usados para
mostrar a distribuição de variáveis categóricas,
enquanto histogramas e box-plots são usados
para mostrar a distribuição das variáveis
quantitativas.
Gráficos
• A cada novo gráfico que o Stata gerar, o anterior
será "perdido", por isso, às vezes é desejável
salvar um gráfico antes de gerar outro.
• Um gráfico pode ser salvo de duas maneiras
diferentes:
– copiar cada gráfico e colar em um outro arquivo "fora"
do STATA, por exemplo, um arquivo do Word.
– Salvar a janela com o gráfico como uma figura,
utilizando o menu: File  Save graph .
Gráficos
Diagrama de dispersão dos dados mas mostrando também a curva de regressão linear
• Dois gráficos podem ser combinados: salvar os dois gráficos e depois
graph combine graph1 graph2
• Gráficos podem ser exportados: graph export mygraph.wmf
Diagrama de dispersão
• Gráficos da gordura e da idade, adicionando o sexo como
marcador
Diagrama de dispersão
• twoway (scatter rendapc educ, mlabel(educ)), by(ano)
40000
2003
2004
20000
16
10000
12
12
9
3
3
1
3
1
3
2 3
2
3
1
1 2
3
2
1
3
2
1
2 3
0
rendapc
30000
16
0
4
4
4
4
4
4
4
5
5
5 6
9
9
5
9
5
9
5 6
6
9
5
9
9
7
5 6
8
9
5
7
6 7
7
8
5
9
8
5 6
6 7 8 9
16
16
16
16
16
12
16
12
10
16
12
15
16
14
16
12
14
16
11 12
13 14 15 16
12
16
12
10
16
11 12
17
12 13
13 14
16 17
10
11
13
17
14
10
15
11
12
16
17
10
14
10
15
0
educ
Graphs by ano
1
1
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
5
5
5
9
6
6
8
6
6
6
6
6
6
6
6
9
7
7
7 8
8 9
9
7
9
7
8 9
7 8
8
9
9
7
16
16
16
16
10
16
16
11 12
14
16
12
12
16
10 11 12
16
16
12
16
12
16
10 11 12
12
16
14
10
16
11 12 13
13 14 15
10
15
16 17
11
10
11
12
16
10
14
13
17
16
12
15
11
14
10
16
11
12
13
14
15
10
16 17
17
10
13
15
Box plot
• Serve para analisar a distribuição da variável de interesse.
• O 1º. Quartil e o 3º. Quartil da distribuição da variável
delimitam a caixa (box). A mediana é representada pela linha
no interior da caixa.
• As extremidades representam os valores máximo e mínimo.
• Se a variável tem uma distribuição normal, a linha (mediana)
deve estar no meio da caixa (dividindo-a em duas partes
iguais).
Box plot
• Identificar outliers: são representados como
pontos isolados do diagrama de caixa.
idade
66
46
40
34
25
15
motorista
cobrador
Gráficos de barras
3,000
2,000
0
1,000
count of celular
4,000
5,000
• graph bar (count) celular, over(uf)
Podem ser feitos direto no point and click
111213141516172122232425262728293132333541424350515253
Histograma
• Deve selecionar a variável, o seu tipo, a amplitude dos intervalos
(bins) bem como o valor de início do primeiro intervalo e no eixo Y
a frequencia de ocorrências
• Exibir a curva normal
Expressões lógicas
Se y diferente de 2 e z maior que x ou x igual a 1.
Tabelas
Tabelas cruzadas
• Para cruzar duas variáveis qualitativas deve-se
utilizar o comando:
tab var1 var2, col (100% na coluna)
tab var1 var2, lin (100% na linha)
Tabelas de sentido duplo
. tab2 eletrica fixo tv
-> tabulation of eletrica by fixo
eletrica
fixo
0
1
Total
0
1
5,715
22,145
9
2,533
5,724
24,678
Total
27,860
2,542
30,402
-> tabulation of eletrica by tv
tv
eletrica
0
1
Total
0
1
5,587
6,641
137
18,037
5,724
24,678
Total
12,228
18,174
30,402
-> tabulation of fixo by tv
tv
fixo
0
1
Total
0
1
12,137
91
15,721
2,451
27,858
2,542
Total
12,228
18,172
30,400
Download

Aula 4