Aula 5 Introdução ao Stata 16 de abril de 2013 Gráficos • O comando graph do STATA possui várias opções. • Em geral, gráficos de barra são usados para mostrar a distribuição de variáveis categóricas, enquanto histogramas e box-plots são usados para mostrar a distribuição das variáveis quantitativas. Gráficos • A cada novo gráfico que o Stata gerar, o anterior será "perdido", por isso, às vezes é desejável salvar um gráfico antes de gerar outro. • Um gráfico pode ser salvo de duas maneiras diferentes: – copiar cada gráfico e colar em um outro arquivo "fora" do STATA, por exemplo, um arquivo do Word. – Salvar a janela com o gráfico como uma figura, utilizando o menu: File Save graph . Gráficos Diagrama de dispersão dos dados mas mostrando também a curva de regressão linear • Dois gráficos podem ser combinados: salvar os dois gráficos e depois graph combine graph1 graph2 • Gráficos podem ser exportados: graph export mygraph.wmf Diagrama de dispersão • Gráficos da gordura e da idade, adicionando o sexo como marcador Diagrama de dispersão • twoway (scatter rendapc educ, mlabel(educ)), by(ano) 40000 2003 2004 20000 16 10000 12 12 9 3 3 1 3 1 3 2 3 2 3 1 1 2 3 2 1 3 2 1 2 3 0 rendapc 30000 16 0 4 4 4 4 4 4 4 5 5 5 6 9 9 5 9 5 9 5 6 6 9 5 9 9 7 5 6 8 9 5 7 6 7 7 8 5 9 8 5 6 6 7 8 9 16 16 16 16 16 12 16 12 10 16 12 15 16 14 16 12 14 16 11 12 13 14 15 16 12 16 12 10 16 11 12 17 12 13 13 14 16 17 10 11 13 17 14 10 15 11 12 16 17 10 14 10 15 0 educ Graphs by ano 1 1 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 9 6 6 8 6 6 6 6 6 6 6 6 9 7 7 7 8 8 9 9 7 9 7 8 9 7 8 8 9 9 7 16 16 16 16 10 16 16 11 12 14 16 12 12 16 10 11 12 16 16 12 16 12 16 10 11 12 12 16 14 10 16 11 12 13 13 14 15 10 15 16 17 11 10 11 12 16 10 14 13 17 16 12 15 11 14 10 16 11 12 13 14 15 10 16 17 17 10 13 15 Box plot • Serve para analisar a distribuição da variável de interesse. • O 1º. Quartil e o 3º. Quartil da distribuição da variável delimitam a caixa (box). A mediana é representada pela linha no interior da caixa. • As extremidades representam os valores máximo e mínimo. • Se a variável tem uma distribuição normal, a linha (mediana) deve estar no meio da caixa (dividindo-a em duas partes iguais). Box plot • Identificar outliers: são representados como pontos isolados do diagrama de caixa. idade 66 46 40 34 25 15 motorista cobrador Gráficos de barras 3,000 2,000 0 1,000 count of celular 4,000 5,000 • graph bar (count) celular, over(uf) Podem ser feitos direto no point and click 111213141516172122232425262728293132333541424350515253 Histograma • Deve selecionar a variável, o seu tipo, a amplitude dos intervalos (bins) bem como o valor de início do primeiro intervalo e no eixo Y a frequencia de ocorrências • Exibir a curva normal Expressões lógicas Se y diferente de 2 e z maior que x ou x igual a 1. Tabelas Tabelas cruzadas • Para cruzar duas variáveis qualitativas deve-se utilizar o comando: tab var1 var2, col (100% na coluna) tab var1 var2, lin (100% na linha) Tabelas de sentido duplo . tab2 eletrica fixo tv -> tabulation of eletrica by fixo eletrica fixo 0 1 Total 0 1 5,715 22,145 9 2,533 5,724 24,678 Total 27,860 2,542 30,402 -> tabulation of eletrica by tv tv eletrica 0 1 Total 0 1 5,587 6,641 137 18,037 5,724 24,678 Total 12,228 18,174 30,402 -> tabulation of fixo by tv tv fixo 0 1 Total 0 1 12,137 91 15,721 2,451 27,858 2,542 Total 12,228 18,172 30,400