Introdução ao Stata Aula 3 12 de abril de 2013 Gerenciamento e análise dos dados • Capítulo 2 do Cameron e Trivedi. • Principal etapa do trabalho empírico: qualidade dos dados e do tratamento das variáveis modeladas. • Cada registro de um banco de dados é um vetor de dados com atributos qualitativos e quantitativos de cada indivíduo ou unidade observacional (firma, escola, etc...). • Dados são limpos, transformados e combinados. Alguns registros podem ser excluídos da análise (por exemplo, se quero analisar o público feminino... Ou só jovens). • Preparação do dado: modificação do dado, transformação do dado, junção de dados. Exemplo • Download os do-files e os bancos de Microeconometrics Using Stata net from http://www.stata-press.com/data/mus net install mus net get mus spinst_mus Insheet • Imputar dado de uma base que foi criada em uma planilha ou em algum programa que usou vírgula ou tab para separar os dados. • Exemplo: mus02file1. CSV Insheet Exemplo SAEB 2011 • insheet using "L:\stata\SAEB2011\Dados\TS_RESULTADO_REGIAO.csv", delimiter(";") • insheet using "L:\stata\SAEB2011\Dados\TS_QUEST_DIRETOR.csv", delimiter(";") • Quando o delimitador não for vírgula ou espaço deverá informar qual é o delimitador. Caso contrário abrirá tudo na mesma célula. • Também só pode ter um delimitador, caso contrário não conseguirá abrir. Infile • Ler qualquer dado em formato de texto que esteja separado por espaço e virgula (não aceita outro delimitador). • Todos os dados são lidos como numéricos, logo deve informar se o dado for textual. Infix • Leitura de dados em formato fixo. A coluna tem um formato fixo. Sem título. • Coluna 1 a 10 é o nome, 11- 12 idade... Etc... • Não há necessidade de ter delimitador entre as variáveis. • Definir as colunas que aparecem em cada entrada de variável. Infix • infix ano 1-4 uf 5-7 using L:\pnad2011\microdado\Dados\Dados\DOM2011.txt Dicionários • Quando o banco envolver muitas variáveis e foi mais difícil de ser manuseado, o formato do banco de dados deve ser lido e registrado usando um dicionário (.dct ou .txt). • infile using L:\stata\aula2\dicionário_dom2011.txt Do. file • Abrir o arquivo : mus02psid92m.txt • Veja como estão os dados. • Abri usando o comando insheet: ver o mus02psid92m.do • Rodar • Describe data: descrição dos dados que constam no banco de dados • Summarize: estatísticas descritivas dos dados que constam no banco de dados. Rename e Label • Para algumas variáveis talvez faça mais sentido dar nomes específicos. • Label: explicar melhor o que é a variável.