Introdução ao Stata
Aula 3
12 de abril de 2013
Gerenciamento e análise dos dados
• Capítulo 2 do Cameron e Trivedi.
• Principal etapa do trabalho empírico: qualidade dos dados
e do tratamento das variáveis modeladas.
• Cada registro de um banco de dados é um vetor de dados
com atributos qualitativos e quantitativos de cada indivíduo
ou unidade observacional (firma, escola, etc...).
• Dados são limpos, transformados e combinados. Alguns
registros podem ser excluídos da análise (por exemplo, se
quero analisar o público feminino... Ou só jovens).
• Preparação do dado: modificação do dado, transformação
do dado, junção de dados.
Exemplo
• Download os do-files e os bancos de
Microeconometrics Using Stata
net from http://www.stata-press.com/data/mus
net install mus
net get mus
spinst_mus
Insheet
• Imputar dado de uma base que foi criada em
uma planilha ou em algum programa que
usou vírgula ou tab para separar os dados.
• Exemplo: mus02file1. CSV
Insheet
Exemplo SAEB 2011
• insheet using "L:\stata\SAEB2011\Dados\TS_RESULTADO_REGIAO.csv",
delimiter(";")
• insheet using "L:\stata\SAEB2011\Dados\TS_QUEST_DIRETOR.csv",
delimiter(";")
• Quando o delimitador não for vírgula ou
espaço deverá informar qual é o delimitador.
Caso contrário abrirá tudo na mesma célula.
• Também só pode ter um delimitador, caso
contrário não conseguirá abrir.
Infile
• Ler qualquer dado em formato de texto que
esteja separado por espaço e virgula (não
aceita outro delimitador).
• Todos os dados são lidos como numéricos,
logo deve informar se o dado for textual.
Infix
• Leitura de dados em formato fixo. A coluna
tem um formato fixo. Sem título.
• Coluna 1 a 10 é o nome, 11- 12 idade... Etc...
• Não há necessidade de ter delimitador entre
as variáveis.
• Definir as colunas que aparecem em cada
entrada de variável.
Infix
• infix ano 1-4 uf 5-7 using
L:\pnad2011\microdado\Dados\Dados\DOM2011.txt
Dicionários
• Quando o banco envolver muitas variáveis e
foi mais difícil de ser manuseado, o formato
do banco de dados deve ser lido e registrado
usando um dicionário (.dct ou .txt).
• infile using
L:\stata\aula2\dicionário_dom2011.txt
Do. file
• Abrir o arquivo : mus02psid92m.txt
• Veja como estão os dados.
• Abri usando o comando insheet: ver o
mus02psid92m.do
• Rodar
• Describe data: descrição dos dados que constam
no banco de dados
• Summarize: estatísticas descritivas dos dados que
constam no banco de dados.
Rename e Label
• Para algumas variáveis talvez faça mais
sentido dar nomes específicos.
• Label: explicar melhor o que é a variável.
Download

Introdução ao Stata