Como se familiarizar com seu
banco de dados usando o
SPSS
Profa. Suzi Camey
GPPG - Hospital de Clínicas
Depto de Estatística - UFRGS
Como se familiarizar com seu banco de dados
Construção de BD
• O banco de dados (BD) pode ser construído
diretamente no SPSS ou em qualquer tipo de
planilha eletrônica (como por exemplo Excel)
– Principal desvantagem: ausência de um sistema
de controle de entrada de dados
– Alternativa: EpiData que pode ser obtido
gratuitamente no endereço
• http://www.epidata.dk/
Como se familiarizar com seu banco de dados
Construção de BD
• Usando o Excel lembrar que:
– Colocar o nome de cada variável na primeira linha
da planilha;
– Cada linha representa um sujeito;
– Cada coluna é uma variável;
– Dados perdidos (missing): é mais fácil deixar a
casela vazia;
– Não colocar letras em colunas destinadas à
variáveis numéricas.
Como se familiarizar com seu banco de dados
Construção de BD
•
Usando o Excel lembrar que:
–
Cada variável só pode aparecer uma vez no banco, não
podendo haver 2 colunas com o mesmo nome.
–
Não incluir no nome de uma variável acentos, cedilhas,
espaços ou caracteres especiais (%, vírgulas, pontos, *,
& ...), pois dependendo da versão do SPSS, eles serão
lidos de um jeito diferente.
–
Mesmo já existindo a numeração padrão do excel, deve
existir uma coluna enumerando os casos no arquivo.
Como se familiarizar com seu banco de dados
Construção de BD
•
Usando o Excel lembrar que:
–
Para facilitar a digitação, algumas linhas e algumas
colunas podem ficar “fixas” na planilha. Por exemplo se
você quer fixar o nome do paciente (coluna b) e o nome
das variáveis (linha 1), então deve colocar o cursor na
célula B2 e clicar em “Janela” no menu superior, e depois
em “congelar painéis”. Neste caso, em qualquer ponto da
planilha que você estiver, sempre aparecerá o nome do
paciente e o nome da variável.
Como se familiarizar com seu banco de dados
Construção de BD
Depois clique aqui.
Primeiro posicione o
cursor nesta casela.
Como se familiarizar com seu banco de dados
Construção de BD
•
Caso você use a versão 2010 do Excel:
–
Para facilitar a digitação, algumas linhas e algumas
colunas podem ficar “fixas” na planilha. Por exemplo se
você quer fixar o nome do paciente (coluna b) e o nome
das variáveis (linha 1), então deve colocar o cursor na
célula B2 e clicar em “Exibição” no menu superior, e
depois em “Congelar Painéis”. Neste caso, em qualquer
ponto da planilha que você estiver, sempre aparecerá o
nome do paciente e o nome da variável.
Como se familiarizar com seu banco de dados
Construção de BD
Depois clique aqui.
Primeiro posicione o
cursor nesta casela.
Como se familiarizar com seu banco de dados
Construção de BD
• O ideal é que daqui em diante os próximos
passos sejam executados no arquivo
milsa.xls
Como se familiarizar com seu banco de dados
Construção de BD
Vamos iniciar o uso do SPSS. Como
exemplo vamos usar o arquivo milsa.xls.
O ideal é que daqui em diante os
próximos passos sejam executados nesse
arquivo, que pode ser obtido em:
http://www.mat.ufrgs.br/~camey/HCPA/
Como se familiarizar com seu banco de dados
Iniciando o SPSS
Quando abrimos o SPSS ele tem a seguinte aparência:
Clicar aqui
Como se familiarizar com seu banco de dados
Lendo dados do Excel
Escolher tipo de arquivo
Clicar aqui
Como se familiarizar com seu banco de dados
Lendo dados do Excel
Escolher tipo de arquivo
Clicar aqui
Como se familiarizar com seu banco de dados
Lendo dados do Excel
Escolher arquivo: primeiro escolher o subdiretório onde o arquivo se encontra.
Clicar 2x aqui
Como se familiarizar com seu banco de dados
Lendo dados do Excel
Escolher a planilha
Escolher esta opção se houver o
nome das variáveis na 1a. linha
do arquivo Excel
Clicar aqui
Aqui pode ser
escolhida a planilha
do arquivo Excel
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das variáveis e categorias, no. de casas decimais e dados perdidos
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das variáveis
Nesta coluna podemos
colocar os rótulos das
variáveis. Basta clicar
em uma das caselas e
digitar o rótulo.
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das variáveis
Neste exemplo ficaria
assim
Como se familiarizar com seu banco de dados
Definições: pelo Menu
• Rótulos das categorias
Nesta coluna podemos
colocar os rótulos das
categorias.
Clicando na 2a. casela.
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das categorias
Clique aqui
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das categorias
Aqui digite o
valor
Aqui digite o
rótulo
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das categorias
Para a variável civil fica assim.
Após adicionar cada “Value” e seu
“Label” deve-se clicar aqui.
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Rótulos das categorias: colocar rótulos das variáveis
abaixo.
• Instrução:
– 1: Ensino Fundamental
– 2: Ensino Médio
– 3: Superior
• Região:
– 1: capital
– 2: interior
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Casas decimais
Nesta coluna podemos
definir o no. de casas
decimais. Basta clicar
em uma das caselas e
digitar o no. de casas
decimais ou usar as
setas.
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Dados perdidos
Nesta coluna podemos
definir quais são os
códigos para valores
perdidos.
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Dados perdidos
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pelo Menu
Dados perdidos
Podem ser definidos até 3 valores
diferentes.
No nosso exemplo o valor perdido
é definido pelo número 9.
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Agora vamos definir rótulos das variáveis e
categorias, no. de casas decimais e dados perdidos
construindo um arquivo de sintaxe.
Esse método é útil principalmente quando se
pretende fazer análises parciais do banco de dados,
pois cada vez que lemos um BD do Excel temos que
reaplicar as definições.
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Clicar aqui
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Esta é a janela do arquivo de sintaxe.
O arquivo de sintaxe pode ser construído em qualquer editor de
texto e é conveniente que seja salvo com a terminação .sps
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Nomes dos comandos
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Nomes das variáveis a serem definidas
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Rótulo da variável
Nome da categoria
Número da categoria
Código do valor perdido
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Os rótulos devem estar entre aspas simples e o código do dado
perdido está entre parênteses.
Todos os comandos devem terminar com ponto final.
Agora você deve definir os rótulos de variáveis e categorias para
todas as variáveis!
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Clicando aqui após selecionar o comando com o mouse, o
comando será executado.
Como se familiarizar com seu banco de dados
Definições: pela sintaxe
Lembrar de salvar a sintaxe!
Como se familiarizar com seu banco de dados
Lembrar de salvar o
banco de dados!
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Após colocar todos os rótulos e definir quais
são os valores perdidos devemos fazer uma
distribuição de frequências de todas as
variáveis para detectar possíveis erros de
digitação.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Clicar aqui
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Clicar aqui depois de selecionar
todas as variáveis com o mouse.
• Depois clicar em OK.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Quando esse comando é executado, uma
nova janela é aberta: a janela de resultados.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Aqui temos todas as variáveis analisadas, o número
de casos válidos e o número de casos perdidos.
• Por exemplo: temos 13 observações perdidas na
variável “Região onde mora” e 23 observações
válidas.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
• Agora vamos fazer uma análise de cada uma
das variáveis buscando inconsistências.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Número do Suj eito
Variável Número do sujeito:
Valid
• Como esta é a variável de
identificação dos casos
não podemos ter
nenhuma freqüência
diferente de 1, pois neste
caso teríamos dois
sujeitos com a mesma
identificação.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Total
Frequency
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
36
Percent
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
100,0
Valid Percent
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
100,0
Cumulative
Percent
2,8
5,6
8,3
11,1
13,9
16,7
19,4
22,2
25,0
27,8
30,6
33,3
36,1
38,9
41,7
44,4
47,2
50,0
52,8
55,6
58,3
61,1
63,9
66,7
69,4
72,2
75,0
77,8
80,6
83,3
86,1
88,9
91,7
94,4
97,2
100,0
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Variável Estado civil:
Estado civil
Valid
Solteiro
Casado
4
Total
Frequency
16
19
1
36
Percent
44,4
52,8
2,8
100,0
Valid Percent
44,4
52,8
2,8
100,0
Cumulative
Percent
44,4
97,2
100,0
Aqui encontramos um problema: na distribuição de frequência
aparece um código 4. Temos que identificar qual o caso e corrigi-lo.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Temos várias maneiras de localizar o caso. Uma delas é marcando a
coluna da variável onde se encontra o problema e depois clicar em
“Find”.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Digitar aqui o valor “estranho” e
depois em “Find Next”.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Depois de identificado o sujeito...
Como se familiarizar com seu banco de dados
“Limpeza” do BD
... verificar o erro e corrigi-lo.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Variável Grau de instrução:
• Aqui não há inconsistência.
Grau de instrução
Valid
Ensino Fundamental
Ensino Médio
Supeior
Total
Frequency
12
18
6
36
Percent
33,3
50,0
16,7
100,0
Valid Percent
33,3
50,0
16,7
100,0
Cumulative
Percent
33,3
83,3
100,0
• Uma das possíveis observações que podemos fazer
é: há 33,3% de pessoas que concluíram o Ensino
Fundamental.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Variável Número de filhos:
• Nesta variável aparece um sujeito com 55 filhos.
Devemos novamente localizar o sujeito e verificar se
a informação está correta.
Número de filhos
Valid
Missing
Total
0
1
2
3
5
55
Total
System
Frequency
4
5
7
3
1
1
21
15
36
Percent
11,1
13,9
19,4
8,3
2,8
2,8
58,3
41,7
100,0
Valid Percent
19,0
23,8
33,3
14,3
4,8
4,8
100,0
Cumulative
Percent
19,0
42,9
76,2
90,5
95,2
100,0
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Agora vamos ver outra maneira de localizar o caso. Quando o valor
procurado for o maior ou o menor de todos, basta marcar a coluna da
variável onde se encontra o problema, clicar com o botão direito do
mouse e depois clicar em “Sort Descending” ou “Sort Ascending”,
dependendo do caso.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Identificado o sujeito e o erro, devemos corrigir o banco.
Neste caso corrija para 5.
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Número de salários mínimos
Variável Número de salários
mínimos:
• Nesta variável não há
inconsistência.
• A partir da tabela
podemos ver que 50,0%
dos sujeitos ganham no
máximo 9,8 salários
mínimos.
Valid
4,00
4,56
5,25
5,73
6,26
6,66
6,86
7,39
7,44
7,59
8,12
8,46
8,74
8,95
9,13
9,35
9,77
9,80
10,53
10,76
11,06
11,59
12,00
12,79
13,23
13,60
13,85
14,69
14,71
15,99
16,22
16,61
17,26
18,75
19,40
23,30
Total
Frequency
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
36
Percent
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
100,0
Valid Percent
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
2,8
100,0
Cumulative
Percent
2,8
5,6
8,3
11,1
13,9
16,7
19,4
22,2
25,0
27,8
30,6
33,3
36,1
38,9
41,7
44,4
47,2
50,0
52,8
55,6
58,3
61,1
63,9
66,7
69,4
72,2
75,0
77,8
80,6
83,3
86,1
88,9
91,7
94,4
97,2
100,0
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Idade - anos
Variável Idade-anos:
Valid
• Há um sujeito com idade
igual a 330. Escolha um
dos métodos descritos
anteriormente e corrija a
idade do sujeito para 33.
20
23
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
46
48
330
Total
Frequency
1
1
1
2
1
1
1
2
2
2
1
2
2
2
2
1
1
2
2
1
2
1
1
1
1
36
Percent
2,8
2,8
2,8
5,6
2,8
2,8
2,8
5,6
5,6
5,6
2,8
5,6
5,6
5,6
5,6
2,8
2,8
5,6
5,6
2,8
5,6
2,8
2,8
2,8
2,8
100,0
Valid Percent
2,8
2,8
2,8
5,6
2,8
2,8
2,8
5,6
5,6
5,6
2,8
5,6
5,6
5,6
5,6
2,8
2,8
5,6
5,6
2,8
5,6
2,8
2,8
2,8
2,8
100,0
Como se familiarizar com seu banco de dados
Cumulative
Percent
2,8
5,6
8,3
13,9
16,7
19,4
22,2
27,8
33,3
38,9
41,7
47,2
52,8
58,3
63,9
66,7
69,4
75,0
80,6
83,3
88,9
91,7
94,4
97,2
100,0
“Limpeza” do BD
Variável Idade-meses:
• Não há inconsistência.
Idade - meses
Valid
0
1
2
3
4
5
6
7
8
9
10
11
Total
Frequency
4
1
3
1
3
5
3
6
3
1
4
2
36
Percent
11,1
2,8
8,3
2,8
8,3
13,9
8,3
16,7
8,3
2,8
11,1
5,6
100,0
Valid Percent
11,1
2,8
8,3
2,8
8,3
13,9
8,3
16,7
8,3
2,8
11,1
5,6
100,0
Cumulative
Percent
11,1
13,9
22,2
25,0
33,3
47,2
55,6
72,2
80,6
83,3
94,4
100,0
Como se familiarizar com seu banco de dados
“Limpeza” do BD
Variável Região onde mora:
• Há um código 8, identificar o sujeito e corrigir para 9.
Região onde mora
Valid
Missing
Total
capital
interior
8
Total
9
Frequency
12
10
1
23
13
36
Percent
33,3
27,8
2,8
63,9
36,1
100,0
Valid Percent
52,2
43,5
4,3
100,0
Cumulative
Percent
52,2
95,7
100,0
Como se familiarizar com seu banco de dados
FIM
Agora este banco está pronto para ser
analisado!!!
Repita todos os procedimentos com o seu
próprio banco de dados.
Como se familiarizar com seu banco de dados
Download

Como se familiarizar com seu banco de dados usando o