Redatam+G4
ta
REcuperação de DAdos para Areas pequenas por Microcomputador, 4 Geração
Manual do Módulo de
Criação de Bases de Dados
NOTA: Este manual foi gerado a partir do arquivo de Ajuda em linha que acompanha o software
Redatam+G4; o documento resultante desta conversão, em formato Microsoft Word, foi novamente
convertido para um documento em formato Adobe pdf, o qual pode ser visualizado com o Adobe
Acrobat© v3.0 ou mais recente. O sistema de Ajuda foi escrito usando-se o software RoboHelp©
produzido por eHelp Corporation.
REDATAM+G4 é um programa computacional desenvolvido pelo Centro Latinoamericano e
Caribenho de Demografia (CELADE), que é a Divisão de População da Comissão Econômica
para América Latina e o Caribe, (CEPAL), Nações Unidas.
www.eclac.cl\celade\redatam
Man_RpG4CPrt1.doc 03/07/02 13:08; Man_RpG4CPrt1.pdf
Table of Contents
Introdução 4
COMO UTILIZAR A AJUDA DURANTE O TRABALHO ................................. 4
BREVE RESUMO DE Redatam+G4 ............................................................... 4
AGRADECIMENTOS ...................................................................................... 5
Conceitos de uma base de dados
6
Conceitos de uma base de dados R+G4 ........................................................ 6
CONCEITOS DA BASE DE DADOS R+ G4 - ENTIDADES e ELEMENTOS
ENTIDADES.............................................................................................. 7
NÍVEL ........................................................................................................ 8
RAMO ....................................................................................................... 8
ENTIDADES SUPERIORES..................................................................... 9
ENTIDADES INFERIORES ...................................................................... 9
ELEMENTOS DE UMA ENTIDADE.......................................................... 9
ENTIDADE SELECIONÁVEL ................................................................. 10
ENTIDADE NÃO SELECIONÁVEL......................................................... 10
ELEMENTOS SELECIONÁVEIS E NÃO SELECIONÁVEIS.................. 10
VARIÁVEIS ............................................................................................. 11
VALORES FORA DE FAIXA E NÃO SE APLICA................................... 11
Algumas definições para trabalhar com R+G4 ............................................. 12
ESTRUTURA DA BASE DE DADOS...................................................... 12
NÚMERO INTERNO ............................................................................... 13
ÍNDICES.................................................................................................. 13
MAIS DE UM RAMO ............................................................................... 14
DICIONÁRIO........................................................................................... 15
RELAÇÕES ENTRE ENTIDADES.......................................................... 15
CONTEÚDO LÓGICO DOS ARQUIVOS DE PONTEIROS ................... 17
CONTEÚDO FÍSICO DOS ARQUIVOS DE PONTEIROS ..................... 17
DADOS ................................................................................................... 18
CÓDIGO GEOGRÁFICO ........................................................................ 19
ESTRUTURA DOS ARQUIVOS ............................................................. 20
Arquivos envolvidos na criação ..................................................................... 20
ARQUIVO ESTRUTURAL DA BASE (.WIP)........................................... 20
ARQUIVO DE DEFINIÇÃO DOS DADOS DE ENTRADA (.DDF) .......... 20
RELAÇÕES ENTRE .wip E .ddf ............................................................. 22
Preparação do Arquivo de Entrada
23
ETAPAS INICIAIS ......................................................................................... 23
FORMATO DO ARQUIVO DE ENTRADA ................................................... 23
FORMATO ÚNICO ........................................................................................ 23
FORMATO MÚLTIPLO.................................................................................. 24
CUIDADOS COM O ARQUIVO DE ENTRADA ............................................ 26
DICIONÁRIOS ACEITOS PARA O ARQUIVO DE ENTRADA ..................... 27
DEFINIÇÃO CHILLÁN – REGISTRO MÚLTIPLO......................................... 27
DEFINIÇÃO CHILLÁN - REGISTRO SIMPLES ............................................ 29
USO ALTERNATIVO DO IMPS 4.1 .............................................................. 31
Geração
32
DESCRIÇÃO RESUMIDA DA GERAÇÃO .................................................... 32
PREPARAÇÃO DO ARQUIVO DE ENTRADA ............................................. 33
DEFINIR OS CAMPOS DE ENTRADA ......................................................... 33
2
6
DEFINIR A ESTRUTURA HIERÁRQUICA DA BASE ................................... 33
DEFINIR VARIÁVEIS PARA CADA ENTIDADE ........................................... 34
DEFINIR VARIÁVEIS E CÓDIGOS DE ENTIDADE ..................................... 36
GERAR A BASE R+G4 ................................................................................. 37
REVISAR RELATÓRIO DO PROCESSO DE GERAÇÃO............................ 39
GERAR NOMES DE ELEMENTOS .............................................................. 39
REVISAR CONSISTÊNCIA DO DICIONÁRIO.............................................. 40
REVISAR FREQÜÊNCIAS DE VARIÁVEIS.................................................. 41
BACK UP DA BASE ...................................................................................... 42
Uma Volta pela Geração
43
RESUMO DO GUIA DE CRIAÇÃO DE BASES ............................................ 43
CARREGAR UMA DEFINIÇÃO DE UM ARQUIVO DE ENTRADA.............. 43
CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE REGISTROS SIMPLES
43
CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE REGISTROS MÚLTIPLOS 52
CRIAR UMA BASE A PARTIR DE UM ARQUIVO XBase ............................ 59
Menus
66
MENU PRINCIPAL ........................................................................................ 66
MENU DE ARQUIVO .................................................................................... 67
MENU DE BASE DE DADOS........................................................................ 67
MENU DO ARQUIVO DE ENTRADA............................................................ 68
MENU DINÂMICO (POPUP) DE ENTIDADES ............................................. 68
MENU DINÂMICO (POPUP) DE VARIÁVEIS............................................... 69
MENU DINÂMICO (POPUP) DE CAMPOS .................................................. 69
Janelas
70
JANELA DO ESQUEMA DE BASE ............................................................... 70
JANELA DE PROPRIEDADES DO ARQUIVO DE ENTRADA..................... 70
JANELA DE PROPRIEDADES DA VARIÁVEL............................................. 71
JANELA DE PROPRIEDADES DOS CAMPOS DE ENTRADA ................... 73
Facilidades Adicionais
74
FREQÜÊNCIAS DE CAMPOS ...................................................................... 74
VALORES MÍNIMOS E MÁXIMOS ............................................................... 74
VERIFICAR A CONSISTÊNCIA DO ESQUEMA DE BASE.......................... 74
SALVAR E CARREGAR ESQUEMA DE GERAÇÃO ................................... 75
EDITAR A DEFINIÇÃO DE UM ARQUIVO DE ENTRADA........................... 75
MODIFICANDO AS PROPRIEDADES DE VARIÁVEIS E CAMPOS DE ENTRADA
....................................................................................................................... 76
Preferências................................................................................................... 76
PREFERÊNCIAS GERAIS ..................................................................... 76
PREFERÊNCIAS DE IDIOMA ................................................................ 77
PREFERÊNCIAS DE FONTE................................................................. 77
Index
78
3
Introdução
COMO UTILIZAR A AJUDA DURANTE O
TRABALHO
· Através da ajuda organizada por conteúdos ou por índice.
ou a tecla F1 sobre o tema ou janela da qual se necessita
· Através do ícone Ajuda
ajuda. O sistema de Ajuda é sensitivo de contexto, e traz o capítulo de ajuda associado à
janela ativa.
· Através dos textos marcados que aparecem embaixo de alguns botões ou telas.
BREVE RESUMO DE Redatam+G4
REDATAM é uma família de software elaborada pelo CELADE, que permite a qualquer
profissional processar de maneira fácil e rápida dados censitários e de outras fontes,
organizados numa base hierárquica, para qualquer área geográfica de interesse para o
usuário (por exemplo, um conjunto de quadras de uma cidade). A continuação se descrevem
as características principais da quarta geração da família, Redatam+G4 (abreviatura R+G4).
Cabe mencionar que a versão R+G4 é de distribuição gratuita.
Que faz R+G4?
Por uma parte permite processar informação contida em bases de dados comprimidas
(criadas em formato Redatam), como as provenientes de censos de população, censos
agropecuários, pesquisas domiciliares, etc., que, por exemplo, contém dados sobre milhões
de pessoas, domicílios e famílias, na sua totalidade. Isto faz com que habitualmente uma base
de dados R+G4 contenha microdados, quer dizer, dados ou variáveis referidas a indivíduos,
domicílios, famílias ou outros elementos de informação que permitem gerar diversas
tabulações para qualquer área geográfica definida pelo usuário. Estes dados, organizados
hierarquicamente para permitir um acesso rápido, são processados em busca de resultados
específicos para determinadas áreas de interesse geográfico. Ademais, pode-se derivar novas
variáveis e processar rapidamente tabulações e outros resultados estatísticos mediante
janelas gráficas e sem assistência de um programador.
R+G4 pode ser usado em qualquer computador funcionando com Microsoft Windows 95, 98,
2000 ou NT4. winR+ v1.2 (e ZonPlan), a geração anterior, também podem ser executadas
com Windows 3.x.
O programa contém facilidades para tratar a manipulação de mapas e pode vincular-se com
vários deles. O vínculo permite ao usuário levar adiante diversas análises espaciais das
estatísticas agregadas que podem ser produzidas pelo programa para qualquer dos níveis
geográficos e área(s) de interesse.
Ver também Que estatísticas podem ser produzidas com R+G4
4
AGRADECIMENTOS
Redatam+G4, que é a quarta geração de Redatam, foi programado por Serge Poulard, Chefe
da Unidade de Processamento de Dados do CELADE, a Divisão de População da CEPAL.
Com o objetivo de permitir o uso do sistema em outras plataformas da mesma forma que para
o atual Microsoft Windows, ele rescreveu e redesenhou a versão anterior, winR+ v1.2, que
também é de sua autoria, em Borland C++ Builder 5.0. Alem disso, Serge desenhou e
escreveu dois grandes módulos novos: R+Create para criar bases de dados Redatam junto
com novas capacidades em R+Process para manipular bases de dados, e o módulo R+xPlan,
com o qual profissionais capacitados podem criar aplicações específicas para que os usuários
finais elaborem e mapeiem indicadores, sem conhecer a linguagem de comandos Redatam.
Atualmente Serge está na Sede Subregional da CEPAL para o Caribe em Porto Espanha,
com a tarefa de apoiar aos países no processamento dos censos de 2000 e promover o uso e
disseminação de R+G4 para analisar os censos.
Não teria sido possível finalizar a tarefa de criar R+G4 sem o valioso trabalho em equipe de
um pequeno e variado grupo de profissionais que durante todo o tempo mostraram sua
dedicação e capacidade de ir mais além de seus horários normais de trabalho. Este grupo
inclui a Ari Silva, ex Chefe da Unidade de Processamento de Dados do CELADE, e que
atualmente trabalha no Brasil; ele proporcionou insumos tanto do ponto de vista do usuário
como do programador. Também traduziu os textos para o português e escreveu e reelaborou
grande parte do programa Ajuda em espanhol que traduziu para o inglês e português; seu
filho, Rafael Nunan, traduziu parte da versão em español da Ajuda à inglesa. Lenin Aguinaga,
analista de sistemas, trabalhou diretamente com Serge Poulard na programação e uso dos
módulos iniciais de R+G4, e criaram aplicações para a Unidade de Desenvolvimento Agrícola
da CEPAL. Alejandra Silva, especialista em Sistemas de Informação Geográfica, deu forma a
várias seções da documentação do programa Ajuda, desenvolveu aspectos relacionados com
o tratamento de mapas no sistema, e trabalhou no desenho do módulo R+xPlan; também
testou o funcionamento e ensinou o software em vários cursos de pré-lançamento. Sebastián
Carrasco, sociólogo, desempenhou um valioso papel na tediosa tarefa de comprovar em
forma intensiva os componentes do sistema, enquanto o usava para estudos específicos
substantivos e ensinava na etapa de pré-lançamento. Dirk Jaspers Faijer, Chefe da Área de
Treinamento e Informação em População do CELADE, impulsou o trabalho conjunto da
equipe e de outras pessoas envolvidas, buscou e encontrou tanto os recursos financeiros
como os profissionais "trabalcoólicos" que se dedicaram à tarefa.
A Unidade de Desenvolvimento Agrícola da Divisão de Desenvolvimento Produtivo e
Empresarial da CEPAL proporcionou um apoio substantivo de envergadura, tanto financiando
pessoas que trabalharam em R+G4 (e novas aplicações) como usando o sistema em busca
de resultados. Em forma especial, María Beatriz David, chefe da Unidade, promoveu o
desenvolvimento de diversas atividades novas baseadas em Redatam, que abriram caminho
para o uso do sistema com dados de campos "não tradicionais" (quer dizer, aqueles não
relacionados con população), como os censos agrícolas e o comercio internacional.
Vão também nossos agradecimentos aos profissionais de diversas disciplinas que
contribuíram de distintas formas ao trabalho de R+G4; citados em ordem alfabética, trata-se
de Waldo Aracena, Ángel Baeza, David Candia, Ángel Fucaraccio, Daniela González, Víctor
González, Victoria Horment, Daniel Macadar, Hernán Orellana, Enrique Peláez, Luis
Rivadeneira, Jorge Rodríguez Vignoli, Alejandro Sabag, Edwin St. Catherine e Jaime
Salvador. Não podemos passar por alto a positiva retroalimentação das versões beta de
R+G4 que nos entregaram diversos profissionais de projetos da CEPAL; neste grupo se inclui
Juan Eduardo Faúndez, Bárbara Castelletti, Mónica Rodrigues, Laura Ortiz e Rodolfo Vilches.
Enrique Pemjean editou os textos em espanhol e fez traduções do inglês quando foi
necessário. Adelaida Rahmer e Alejandra Reyes se encarregaram da assistência
administrativa e corrigiram a versão em espanhol do programa Ajuda. Outro apoio muito
significativo foi o que nos chegou dos usuários de R+G4 dos institutos nacionais de estatística
5
do Brasil, Chile, Colombia, Nicaragua, Equador, Panamá, Santa Luzia, Venezuela e outros
países.
O software R+G4 está disponível no site RedatamWeb do CELADE
(http://www.eclac.cl/celade/redatam) através de uma facilidade de descarga que aproveita o
sistema de manejo da página Web da CEPAL para "automatizar" a entrada de conteúdo
descentralizado e a compilação de dados. Javier Pi, analista de sistema para sites Web da
CEPAL, programou a facilidade de descarga a petição do CELADE. Orly Winer, desenhadora
gráfica e de sites web, criou os gráficos e desenhou Redatam Informa Al Día (e também o site
do CELADE, desde o qual se pode descarregar o software); os conteúdos são proporcionados
por Arthur Conning, que também trabalhou intensamente no sistema Ajuda de R+G4. Juan
Rojo, Coordenador do portal web da CEPAL e Jorge Balzo, analista de sistemas que trabalha
no sistema Web, nos entregaram, respectivamente, apoio administrativo e técnico.
É para nós de singular relevância enfatizar que os esforços para produzir esta última geração
de Redatam recebeu em todo momento o impulso contínuo do anterior diretor do CELADE,
Reynaldo Bajraj –atualmente Secretário Adjunto da CEPAL– e do atual diretor do CELADE,
Daniel Blanchard.
Por último, vai também nossa gratidão e agradecimento às diversas fontes financeiras que
suportaram o desenvolvimento e uso de R+G4 e dos outros componentes da família
Redatam. O orçamento regular das Nações Unidas cobriu as remunerações dos membros
chaves do pessoal; por outra parte, o FNUAP financiou um número de outros membros da
equipe, a maioria deles consultores a tempo parcial. O Banco Interamericano de
Desenvolvimento (BID) proporcionou fundos para apoiar aos países no trabalho com as
versões pré-lançamento de R+G4 e está dando seu respaldo financeiro ao projeto 2001-2003
para ajudar aos países a usar e disseminar seus dados censitários do ciclo de 2000,
especificamente mediante bases de dados Redatam e suas aplicações. A Agencia
Canadense de Desenvolvimento Internacional (ACDI), suportou, mediante projetos durante a
década de 90, o desenvolvimento de Redatam, diversos cursos e pessoal, e permitiu que o
CELADE "descobrisse" e buscasse Serge Poulard para trabalhar no CELADE. Finalizemos
estendendo nossa gratidão ao Centro Internacional de Investigações para o Desenvolvimento
(CIID) do Canadá, que entregou a contribuição inicial que resultou na criação de Redatam;
ademais, proporcionou importantes quantidades de recursos no período 1985-1997, mediante
três projetos que financiaram as três primeiras gerações de Redatam; o último (e maior)
destes projetos tornou possível que CELADE trabalhasse em conjunto com a Universidade de
Waterloo, que originou os três membros da família Redatam baseados em SIG, AccessPlan,
EduPlan e TourPlan; esse mesmo projeto doe CIID financiou o desenvolvimento de winR+ em
conjunto com ZonPlan, precursor do módulo R+xPlan em R+G4.
Conceitos de uma base de dados
Conceitos de uma base de dados R+G4
CONCEITOS DA BASE DE DADOS R+ G4 - ENTIDADES e
ELEMENTOS
A estrutura da base de dados é composta de entidades ou níveis. Em cada nível se agrupam
os elementos que a conformam.
6
Cada um dos níveis, como "comuna" ou "distrito", representa um nível geográfico que
possui um nível hierárquico em relação ao nível prévio; por exemplo, as quadras são áreas de
nível menor que as comunas. Um conjunto específico de distritos, cada um com seu próprio
nome e código único na base de dados, constitui uma comuna. Cada nível leva o nome de
entidade.
O conjunto de áreas dentro de uma entidade dada é denominado elementos da entidade
(indivíduos). O indivíduo, ou unidade estatística, é um elemento que pertence ao conjunto de
referência, ou população.
Nas hierarquias geográficas censitárias podem existir alguns níveis de entidades num ramo
sem nomes para seus elementos (por exemplo, as quadras) mas com códigos que os
conectam claramente com áreas específicas em um mapa.
Os dois últimos níveis, "domicílio" e "pessoa", são também entidades. Os domicílios dentro
de uma quadra são os elementos domicílio de uma "quadra" particular e, similarmente, as
pessoas dentro de um domicílio são os elementos pessoa deste domicílio.
Uma base de dados em Redatam, como a base de dados de demonstração NMIR2000 de
Nova Miranda, que acompanha o programa (ver figura), pode ter vários ramos de dois ou mais
censos, pesquisas e outros dados que podem ser incluídos numa mesma base. A base de
dados, que aparece na janela do dicionário R+G4, mostra a forma em que estão estruturadas
as entidades da base de dados de Nova Miranda. Note-se que aparecem ramos e sub-ramos;
por exemplo, a entidade manzan se divide em dois ramos, vivien e educac, onde esta última
representa a(s) escola(s) que existem na "quadra", se corresponde.
ENTIDADES
As variáveis descrevem entidades, que são conjuntos de objetos lógicos organizados em
forma hierárquica na base de dados. Uma entidade dada pode ser o conjunto de províncias,
ou o conjunto de cidades, ou domicílios ou pessoas, etc., num país. Todas as variáveis que
pertencem a uma entidade possuem certos atributos em comum, como o número de
7
elementos, e o mesmo nível de hierarquia. A entidade de mais alta hierarquia de uma base é
chamada entidade "raiz".
A característica de selecionável ou não selecionável para uma entidade dada é definida pelo
administrador no momento de criar a base de dados (com o Módulo de Criação de Bases de
R+G4). Também se usa o termo de entidade identificada e não identificada, com o mesmo
propósito de Selecionável e Não Selecionável, pela existência de um código de identificação
para seus elementos.
Ver também entidades inferiores, entidades superiores
NÍVEL
É o grau de profundidade de uma entidade dentro de seu ramo. Por construção, a entidade
"raiz" tem nível zero, a(s) entidade(s) imediatamente inferiores tem nível 1, e assim
consecutivamente.
RAMO
É o "caminho" desde a "raiz" a uma determinada entidade. Por definição (veja Entidades
Superiores), uma entidade (e consequentemente suas variáveis) pertence a um único ramo.
Se comparamos a estrutura de uma base multidisciplinar com uma árvore, os "ramos" da
estrutura são exatamente o mesmo que os ramos da árvore, e as entidades correspondem às
folhas da árvore.
A figura mostra a base de dados de Nova Miranda com quatro ramos com distinta
informação.
8
ENTIDADES SUPERIORES
São todas as entidades que se encontram no "caminho" desde a entidade "raiz" até a
entidade propriamente dita.
As entidades distrito e comuna são superiores à entidade bloco. A entidade imediatamente
superior pode ser chamada também entidade "mãe". Por definição, cada entidade tem só uma
entidade "mãe".
Ver também entidades inferiores
ENTIDADES INFERIORES
São todas as entidades que se encontram "dependentes" ou "penduradas" da entidade
determinada.
Referindo-se à figura, a entidade domicílio é inferior à entidade distrito. As entidades
imediatamente inferiores podem ser chamadas entidades "filhas". Uma entidade pode ter um
número variável de entidades "filhas" (zero ou mais).
Ver também entidades superiores
ELEMENTOS DE UMA ENTIDADE
Os membros individuais de uma entidade são denominados elementos de uma entidade. Por
exemplo, as comunas pertencentes à entidade "comuna" são os elementos ou casos dessa
entidade. Pode ser que existam poucos elementos para uma entidade, por exemplo, as
9
regiões de um país para a entidade "região", ou pode ser que existam milhões de elementos
numa entidade, como no caso de pessoas para a entidade "pessoa" dessa mesma base de
dados.
ENTIDADE SELECIONÁVEL
As entidades selecionáveis tem a propriedade de distinguir (identificar) seus elementos por
seus códigos e, portanto, podem participar no processo de seleção hierárquica. Quer dizer,
para ser selecionável uma entidade necessita possuir uma variável que permita armazenar
este código identificador. Isto significa, por exemplo, que as províncias A e B podem ser
escolhidas para o processamento, mas não se pode selecionar especificamente o domicílio X
se a entidade DOMICÍLIO não é definida como selecionável.
Ver também entidade não selecionável
ENTIDADE NÃO SELECIONÁVEL
Se os elementos individuais de uma entidade não tem códigos de identificação (visível no
dicionário), trata-se de uma entidade não selecionável. Esta entidade não pode ser usada
numa seleção hierárquica. Da mesma maneira, não pode ser usada como entidade de saída
para uma Lista de Áreas.
Ver também entidade selecionável
ELEMENTOS SELECIONÁVEIS E NÃO SELECIONÁVEIS
Por definição, todos os elementos de uma base de dados são selecionáveis, quer dizer,
podem ser analisados em detalhe. Entretanto, baseado na segurança dos dados
(especificamente o segredo estatístico das bases censitárias) e nas necessidades
substantivas, pode definir-se qualquer entidade e suas inferiores como não selecionável no
momento de criação de uma base de dados Redatam+G4, ou ao utilizar as ferramentas de
administração de bases de dados.
Existe um conflito entre segurança e utilidade dos dados. Por exemplo, se a entidade Quadra
é definida como não selecionável, não será possível obter resultados para cada quadra a
partir da informação dos domicílios e das pessoas existentes em cada uma delas. Só se
poderá obter informação agregada das quadras a um nível superior como distrito, comuna ou
região.
Pode-se gerar resultados para elementos individuais de entidades selecionáveis, mas não se
pode produzir resultados para entidades individuais não selecionáveis, por exemplo, para um
domicílio específico na base de dados de Nova Miranda. Evidentemente, é possível gerar
tabulações de domicílios e pessoas para uma área determinada toda vez que os domicílios e
as pessoas específicas não sejam individualizadas.
10
VARIÁVEIS
Os itens de informação dos elementos individuais de uma entidade estão armazenados em
variáveis. Uma variável é uma propriedade ou característica de cada indivíduo, quer dizer, é
assunto comum a todos os indivíduos de uma população: idade, estado civil, quantidade de
chuva, etc. A característica pode ser qualitativa (atributo) ou quantitativa (variável). Em
conseqüência, cada entidade tem sua própria lista de variáveis e cada elemento da entidade
tem seu próprio conjunto de valores para estas variáveis. Assim, a entidade Pessoa poderia
ter, entre outras, a variável sexo e um de seus elementos poderia ter o valor de sexo =
feminino.
É possível que qualquer entidade possua variáveis, por exemplo, Província poderia ter
variáveis, como a média de chuva caída por ano, ou a percentagem de mães solteiras em
idade fértil.
Em R+G4 uma variável é identificada pela entidade à qual pertence e o nome da variável,
com um ponto entre eles, isto é, Nome_de_Entidade.Nome_de_Variável. Por exemplo,
PESSOA.SEXO, DOMICIL.TVCOLOR, etc.
Uma mudança importante em R+G4 com relação a seu predecessor, winR+
v1.2, é que agora letras maiúsculas e minúsculas tem diferença, sobretudo nos nomes de
variáveis e entidades. Por exemplo, PESSOA.SEXO, do dicionário de NMIR2000, não és o
mesmo que PESSOA.sexo, ou pessoa.SEXO, ou pessoa.sexo; tem que se respeitar
exatamente a escritura de cada variável no dicionário.
VALORES FORA DE FAIXA E NÃO SE APLICA
O conceito de Fora de Faixa (as vezes chamado de Omitido ou Missing) e o Não se Aplica se
vinculam somente com as variáveis numéricas de uma base de dados.
Ao carregar variáveis numéricas numa base de dados, o sistema R+G4 verifica sua
integridade com relação aos limites informados, e caso o valor não se encontre dentro da
faixa definida para a variável, o sistema assignará um único valor para todos estes casos.
Por exemplo, a variável Estado Civil tem uma faixa de 1 a 4 ((1) solteiro, (2) casado, (3) viúvo
e (4) divorciado). Qualquer valor que apareça no arquivo de entrada que não esteja entre 1 e
4 será transformado para o Valor Missing informado na janela de propriedades da variável.
Por exemplo, seja este valor um 8. Nesse caso, depois da carga a variável Estado Civil terá
os valores possíveis de 1 a 4 e 8.
Por outro lado, o sistema R+G4 não é capaz de armazenar os brancos nas variáveis
numéricas, o que significa que eles têm que ser convertidos a um outro valor numérico. Em
geral, num arquivo de entrada consistente, estes brancos correspondem aos casos para os
quais a pergunta NÃO É APLICADA. Por exemplo, para a variável Estado Civil, no censo de
Chile de 1992, a pergunta se aplica somente para as pessoas maiores de 14 anos, pelo que
as pessoas de até 13 anos têm um valor em branco para esta variável. Em tempo de carga
estes valores são transformados para o Valor Não se Aplica informado na janela de
propriedades da variável. Por exemplo, seja este valor um 9. Nesse caso, depois da carga a
variável Estado Civil terá os valores possíveis de 1 a 4, 8 e 9.
11
Os valores para Fora de Faixa e Não se Aplica são especiais para o sistema R+G4 no
momento de exploração da base. Eles são excluídos dos resultados tabulados, e no caso de
que alguma variável com Missing ou Não se Aplica esteja envolvida numa expressão de
cálculo ou de filtro, o resultado será um Missing ou Não se Aplica, de acordo à ordem de
prioridade estabelecida pelo sistema. Isto faz com que os resultados de alguns tabulados não
mostrem todos os casos existentes na base.
Uma alternativa para eliminar estes problemas de casos "faltosos" é colocar os valores de
Missing e Não se Aplica DENTRO da faixa de valores possíveis da variável. Esse
procedimento terá a mesma função de assignar o Missing e o Não se Aplica no momento da
carga, mas no momento da exploração, os valores estarão dentro da faixa, e SEMPRE
aparecerão para o usuário. No exemplo acima, se informaria a faixa de Estado Civil como 1 –
9 (incorporando os valores 8 e 9). Além disso, se informaria também as categorias 8 –
Omitido, e 9 – NSA (para Não Se Aplica).
A vantagem de ter os valores de Missing e Não se Aplica dentro da faixa é ter o controle total
das tabulações. Nunca faltariam casos nas tabulações, ou nos filtros ou expressões. A
desvantagem é que estes valores NÃO podem mais ser filtrados automaticamente pelo
sistema, sempre teremos que usar uma expressão de filtro, como
FOR pessoa.ecivil < 5
para eliminar o Missing e o Não se Aplica dos cálculos. Outra desvantagem dessa solução é
que os valores 5, 6, 7, 8 e 9 seriam considerados como valores "bons", quer dizer, dentro da
faixa, e poderiam aparecer na base definitiva. Isto não seria problema se estamos trabalhando
com um arquivo original passado pela consistência. No caso de estarmos trabalhando com
arquivos antes da consistência, a alternativa é gerar a base com a faixa "oficial" 1 – 4 e
modificar esta faixa no dicionário, depois da carga. A desvantagem é o trabalho de efetuar
estas modificações a cada vez que se gere a base (ou fazer uma vez e salvar o dicionário em
outro diretório).
Algumas definições para trabalhar com R+G4
ESTRUTURA DA BASE DE DADOS
A estrutura da base de dados define as relações hierárquicas entre as entidades, isto é, as
relações pais-filhos. Isto define as relações entre elementos, dado que cada entidade pode ter
elementos, ou instâncias específicas da entidade.
Na figura se mostra a estrutura da base de dados Nova Miranda, a qual acompanha o
programa R+G4 como base de demonstração.
12
Se necessitará ver a estrutura quando se selecione a(s) área(s) de interesse com a(s) qual(is)
se deseja trabalhar.
NÚMERO INTERNO
Cada uma das entidades (e variáveis) possui, além de seu nome pelo qual são conhecidas
nos processos estatísticos, um número interno, único, assignado pelo sistema na criação (ou
edição) do Dicionário. Por definição, a primeira entidade (entidade "raiz", com o nome da base
de dados), é a 0. Estes números podem ser consultados (mas não modificados) pelo usuário
no Dicionário de Dados (consulta em linha).
ÍNDICES
Estes arquivos, também chamados de "ponteiros" , são os responsáveis pela conexão física
entre os elementos das entidades e suas entidades inferiores. Cada entidade tem um arquivo
de índices, com elementos que "apontam" desde a entidade superior até a entidade mesma.
Eles têm a extensão ".ptr" (de "ponteiro"), e o nome de cada um deles é formado pelo nome
da base de dados, agregando-se o número interno da entidade, com quatro posições,
completado com zeros à esquerda.
Todas as entidades na base de dados (inclusive a entidade "raiz") têm um arquivo ".ptr"
associado. Para entender o funcionamento destes arquivos, tomemos como exemplo a base
de dados mostrada na figura abaixo.
PAIS
PROVINC
DISTRITO
VIVIENDA
13
Cada um dos níveis, como "provinc", se denomina uma entidade. Cada entidade tem um ou
mais elementos. A entidade "provinc" pode ter, por exemplo, dois elementos, as províncias
denominadas: Província Oriental e Província Ocidental. Seguindo a hierarquia, debaixo da
entidade "provinc" se encontra a entidade "distrito". Por exemplo, cada elemento da província
está subdividido em elementos distritos, os que por sua vez estão divididos em domicílios.
Se os elementos de uma entidade têm nomes e códigos, se diz que a entidade pode ser
selecionável, já que os elementos individuais podem ser identificados fisicamente e
selecionados em R+G4 para uso posterior. Habitualmente, este é o caso de entidades
geográficas tais como uma província, município, distritos, etc., permitindo que os elementos
da base de dados sejam conectados às áreas por meio de mapas.
Neste exemplo, embaixo da entidade "distrito" se encontra a entidade "domicílio", composta
de elementos individuais de dimicílio, cada um dos quais está localizado dentro de um distrito.
As entidades como domicílio e pessoa podem ter milhões de elementos.
Geralmente, estes se encontram não-identificados numa base de dados Redatam, ou seja,
que não se pode selecionar domicílios ou indivíduos em forma isolada. Estas entidades são
chamadas de não-selecionáveis. Porém, um conjunto de pessoas ou domicílios numa área
podem ser selecionados através de sua localização em um ou mais elementos identificados
nas entidades de alto nível. Isto se faz por meio do procedimento de seleção hierárquica de
R+G4.
MAIS DE UM RAMO
Uma base de dados R+G4 pode ter mais de um ramo hierárquico e estes, por sua vez,
podem ter sub-ramos, os conceitos e elementos de entidade são os mesmos. Uma entidade
selecionável não necessita ser geográfica.
Por exemplo, na figura a continuação se apresenta a estrutura hierárquica da base de dados
de demonstração que se distribui com o programa R+G4, correspondente ao país fictício de
Nova Miranda. Nesta estrutura a entidade "EDUCAC" é o estabelecimento educacional,
"TENSENAN" é o tipo de educação, e "CURSOS" são os cursos existentes, o que significa
que você pode selecionar só os dados de educação para um domicílio onde se agregam os
dados de tipo de educação e cursos.
14
A informação sobre os elementos individuais de uma entidade são guardadas em variáveis,
como o número de quilômetros quadrados de um distrito, ou o sexo de uma pessoa, de forma
que se pode ver uma entidade como se fosse uma matriz, onde as linhas são os elementos
(casos) e as colunas são as variáveis.
DICIONÁRIO
Toda a informação referente às entidades e às variáveis são guardadas num conjunto de
arquivos chamado Dicionário da base de dados que são os "metadados", quer dizer, trata-se
de "informação sobre informação".
O Dicionário proporciona uma ponte entre os arquivos de dados e o usuário. Permite
visualizar os dados em termos de variáveis e de registros, afastando-o dos detalhes físicos de
armazenamento e manipulação interna.
O dicionário contém uma lista de todas as variáveis de uma base de dados para cada nível da
hierarquia (entidade), assim como os códigos (valores) para cada variável, com uma
descrição do significado de cada código. Por exemplo, os códigos para a variável sexo
pertencente ao nível pessoa são 1 e 2, onde 1 = masculino e 2 = feminino.
O dicionário para uma determinada Base de Dados geralmente é definido uma só vez; por isto
a maioria dos usuários o utiliza para obter uma lista das variáveis disponíveis e seus valores
possíveis.
O Dicionário pode ser revisado mediante a janela do dicionário que se abre desde o menu
principal.
RELAÇÕES ENTRE ENTIDADES
15
Esta base têm quatro entidades, e portanto, deverá ter quatro arquivos ".ptr". Para
simplificação, suponhamos que as entidades tenham números internos correlativos
começando de zero (PAIS é a entidade 0, PROVINC é a 1, DISTRITO é a 2, etc.). A entidade
VIVENDA "pertence a" (ou depende de) entidade DISTRITO, que por sua vez "pertence" a
PROVINC, que "pertence" a PAIS, e esta, por definição, "pertence" ao sistema. O conceito de
"pertinência", numa divisão político-administrativa por exemplo, pode ser entendido como: a
província 3 "do" país, o distrito 14 "da" província 2, a vivenda 358 "do" distrito 21, etc.
Cada entidade pode ter um número distinto de elementos (casos), quer dizer, x distritos, y
províncias, etc. Para efeito de exemplo, suponhamos que se tenha os seguintes números de
casos para as entidades:
PROVINC
5
DISTRITO
23
VIVENDA
4587
NOTA: Por definição, a entidade "raiz" tem SEMPRE um único caso, ou seja, é como se
fosse o país.
Suponhamos também as seguintes distribuições
PROVINCIA
DISTRITOS
1
3
2
5
3
4
4
6
5
5
DISTRITOS
VIVIENDAS
1
300
2
250
3
130
…
16
23
90
Quer dizer, a primeira província têm três distritos, a segunda cinco distritos, etc., e o primeiro
distrito tem 300 vivendas, o segundo 250 vivendas, etc.
CONTEÚDO LÓGICO DOS ARQUIVOS DE PONTEIROS
O conceito lógico dos arquivos de índices (ponteiros) é um vetor de contadores, cada registro
com o número de casos da entidade inferior que "pertencem" a cada elemento da entidade
superior. Em outras palavras, cada arquivo índice têm tantos elementos quantos sejam os
elementos da entidade "que aponta", e cada elemento destes contém o número de casos da
entidade "apontada".
Por exemplo, o conteúdo lógico do arquivo de índices de DISTRITO, ou seja, PAIS0002.PTR,
é exatamente a coluna da direita da tabela de Distritos por Província no tópico de Relações
entre Entidades, quer dizer, o arquivo tem cinco registros lógicos (um para cada província),
com os valores, 3, 5, 4, 6 e 5. O arquivo PAIS0003.PTR (para a entidade VIVENDA)
corresponde à coluna da direita da tabela de Vivendas por Distrito, a seguir no mesmo tópico,
com 23 registros lógicos, contendo respectivamente 300, 250, 130, etc.
Pode-se dizer que um arquivo de ponteiros, apesar de levar o número da entidade para a qual
ele aponta, funciona como um arquivo de dados da entidade superior, porque tem o mesmo
número de elementos desta entidade.
CONTEÚDO FÍSICO DOS ARQUIVOS DE PONTEIROS
Na verdade, o conteúdo físico dos arquivos índice é um pouco distinto, assemelhando-se mais
a um conceito de ponteiros que de número de elementos. Em vez do número de elementos,
cada registro contém o número correlativo (começando de zero) do primeiro elemento da
entidade inferior. Além disso, existe sempre um elemento adicional, ao final do arquivo, com o
número total de casos da entidade inferior.
Referindo-se às tabelas descritas em Conteúdo Lógico, o conteúdo físico do arquivo
PAIS0002.PTR para a entidade DISTRITO seria como a primeira tabela abaixo, e para a
entidade VIVENDA seria como na segunda tabela.
PROVINCIA
DISTRITOS
Registro
Conteúdo
1
3
1
0
2
5
2
3
3
4
3
8
4
6
4
12
5
5
5
18
6
23
VIVIENDAS
Registro
Conteúdo
1
300
1
0
2
250
2
300
3
130
3
550
DISTRITOS
17
…
23
90
23
4497
4587
Nota: Existe sempre um registro a mais ao final da lista, para armazenar o número de casos
da última observação.
Para ter acesso aos elementos da entidade inferior, o sistema usa então dois registros, o
registron para o início dos elementos, e o registron+1 para calcular, por subtração, o
número de casos. Por exemplo, os distritos da província 3 começam no distrito 7 (no registro
está 8, mas devemos subtrair 1 porque se conta a partir do elemento zero), e são 4 (12 - 8).
A figura mostra um exemplo desta relação em forma gráfica, onde pode-se apreciar que cada
entidade tem variáveis (arquivos .bin, veja em Dados), dentro das quais se dispõe de uma
variável que contém um código para os elementos daquelas entidades selecionáveis. Além
disso pode-se ter uma variável que contém um nome associado ao código. Para recorrer a
estrutura hierárquica das entidades existem os índices (arquivos .ptr) que estabelecem a
conexão entre um elemento de uma entidade superior com seus elementos da entidade
inferior, os quais podem ser visualizados como as flechas da figura.
Os arquivos de índices são criados em tempo de geração da base de dados. Cada registro
(elemento do arquivo) tem um tamanho de 4 bytes, e seu conteúdo NÃO está em formato
ASCII.
DADOS
O sistema R+G4 guarda cada variável de uma entidade em um arquivo distinto, com um
"registro" por cada elemento da entidade, o que significa que cada variável pode ser vista
18
como um vetor de dados (tais arquivos se conhecem como arquivos transpostos). Existe
então um arquivo para a variável sexo, outro para a variável tipo de domicílio, etc.
Cada arquivo conterá tantos registros (elementos) quantos sejam o número de casos da
entidade à qual pertença a variável. Reportando-se ao exemplo descrito para os arquivos de
Índices, uma variável a nível de PROVINCI terá 5 elementos, e uma variável a nível de
VIVENDA terá 4.587 elementos. Estes arquivos têm a extensão .bin (de "binários"), se foram
criados pela versão anterior de winR+, ou .rbf (de "Redatam Data Format") se foram criados
por esta versão.
Uma das vantagens deste tipo de arquivo é que, como cada registro (quer dizer, cada valor da
variável, ou cada elemento do vetor) tem o mesmo tamanho, pode-se usar uma técnica de
compressão de dados muito simples para economizar espaço de armazenamento. A decisão
de comprimir (ou não) estes arquivos é tomada pelo usuário ao definir a variável no Esquema
de Base. Se por um lado, as variáveis comprimidas ocupam muitíssimo menos espaço, o
processo de descompressão ao le-la gasta um tempo maior que uma variável armazenada em
formato caracter. Entretanto, o próprio fato de que a variável esteja comprimida, melhora a
eficiência na leitura de seus dados de disco para a memória, já que se transfere menos
volume de informação.
O processo de compressão consiste em transformar em números binários os valores dos
elementos de cada arquivo. O número de "bits" necessários para cada variável depende do
valor máximo que a variável possa conter (também definido pelo usuário). Uma variável, por
exemplo sexo, que contém os valores 1 e 2 (para homens e mulheres respectivamente), é
comprimida em 2 bits (com 2 bits pode-se armazenar um número menor ou igual a 3). A
variável idade, que pode variar, por exemplo de 0 até 99, necessita de 7 bits (armazena um
número menor ou igual a 127), etc.
Estes arquivos NÃO podem ser lidos fora do sistema R+G4, já que não estão em um formato
ASCII.
CÓDIGO GEOGRÁFICO
Uma informação de vital importância para a criação da base de dados numérica, que se
construirá depois de coletar e validar toda a informação do país e para cada uma de suas
divisões político administrativas (regiões, províncias e comunas, etc.), é a que contém a
localização geográfica de cada um dos domicílios em que se aplicou o questionário. Desta
maneira é possível que, uma vez construída a base de dados censitária, se possa recuperar a
informação recolhida até o nível mais baixo de desagregação geográfica que, no caso do
Chile, corresponde ao "setor censitário", o qual está formado por uma agrupação de
domicílios.
Por razões legais e para proteger o segredo estatístico, que assegura a inviolabilidade da
intimidade das pessoas, a base de dados não permite a individualização de um domicílio,
família nem de pessoas em particular. Esta informação composta de códigos numéricos é a
que dá origem ao código geográfico que, segundo se verá mais adiante, possui uma
relevância especial no momento de trabalhar com dita base de dados.
Ver também Segurança dos dados
19
ESTRUTURA DOS ARQUIVOS
Além dos arquivos do Dicionário, uma Base de dados Redatam está formada por outros dois
conjuntos de arquivos: a) os arquivos de dados e, b) os arquivos de ponteiros ou índices.
Arquivos de Dados (.rbf)
O sistema R+G4 guarda cada variável de uma entidade em seu próprio arquivo, com um
"registro" para cada elemento da entidade. Assim, cada variável é um vetor de dados. Tais
arquivos são conhecidos como arquivos transpostos, para distingui-los da forma mais comum
de organização de dados estatísticos, onde todas as variáveis de cada elemento são
guardadas em registros individuais, de maneira que um só arquivo contém todas as variáveis
para todos os elementos.
Na estrutura de arquivo transposto de Redatam, existe um arquivo para sexo, outro para tipo
de domicílio, etc. Isto, entre outras vantagens, faz com que o processamento do sistema seja
eficiente, já que permite que o sistema leia somente as variáveis especificamente envolvidas
num determinado processo.
Arquivos de Ponteiros (Índices .ptr)
Estes arquivos são os responsáveis pela conexão entre os elementos das entidades e suas
entidades inferiores. Cada entidade tem um arquivo de índices, com elementos que "apontam"
desde os elementos da entidade superior até os elementos da entidade propriamente dita.
Arquivos envolvidos na criação
ARQUIVO ESTRUTURAL DA BASE (.WIP)
Este arquivo é criado pelo módulo de Geração de Bases de Dados e nele se armazena o
Esquema de Base, quer dizer, a estrutura das entidades e a informação sobre os registros e
variáveis extraídas do dicionário importado que, junto com o arquivo de dados originais (.dat
ou .dbf) se utiliza para criar as distintas bases de dados em formato R+G4. Quer dizer, se
guarda o marco de referência (com entidades e variáveis) a utilizar para gerar uma ou mais
bases de dados em Redatam+G4.
Na Geração, este arquivo é a parte correspondente do arquivo final do dicionário da base
(.dic). Em outras palavras, é como se fosse um arquivo .dic do dicionário, mas ainda não se
construiu toda a informação necessária para que seja considerado um "verdadeiro" dicionário,
o que acontecerá quando se gere a base (faltam os ponteiros e variáveis).
Este arquivo trabalha em conjunto com o arquivo de definição de campos (.ddf), ou os
dicionários IMPS, ISSA ou DBF do arquivo de entrada, para estabelecer quais campos serão
gerados, e em que entidades.
ARQUIVO DE DEFINIÇÃO DOS DADOS DE ENTRADA
(.DDF)
Este arquivo tem a finalidade de definir as propriedades do arquivo de entrada para a geração
da base. Nesse arquivo se define também o tipo de arquivo de entrada, se é de formato
20
Simples ou Múltiplo (quer dizer, se o arquivo de entrada possui mais de um tipo de registro é
múltiplo, se possui um registro único é simples).
A definição dos campos do arquivo de entrada deve conter a informação básica necessária
para localizar o campo no arquivo (tipo de registro ao qual pertence o campo), seu
deslocamento (onde começa no registro) e seu tamanho. Estas são chamadas de definições
físicas do campo.
O arquivo também deve conter as definições lógicas de cada campo, quais sejam seu nome,
rótulo (opcional), seu tipo (inteiro, real ou alfanumérico), sua faixa (valores mínimo e máximo
aceitáveis) e suas categorias (código e nome).
Os campos existentes no arquivo de entrada serão as futuras variáveis da base de dados.
Claro, não é obrigatória a geração de todos os campos para a base de dados: pode-se
escolher quais campos pertencerão à base, e em quais entidades.
Como todo arquivo tipo Chillán, o DDF pode ter várias seções, cada uma com suas cláusulas
específicas.
seção
descrição
General
Única para todo o arquivo, descreve o tipo de arquivo, número
de tipos de registro, número de campos, e a posição e tamanho
do identificador do tipo de registro.
Field
Uma seção para cada campo no arquivo de entrada.
Record
Uma seção para cada tipo de registro no arquivo de entrada.
Existe somente no caso de Registros Múltiplos.
Seção General
cláusulas
descrição
DataSetType
Tipo de arquivo, pode ser ASCII1(registro simples) ou ASCIIM
(registros múltiplos).
Fields
Número de campos no arquivo. O arquivo DDF terá tantas
seções [FIELDn] quanto o conteúdo desta cláusula.
Records
Número de tipos de registro. O arquivo DDF terá tantas seções
[RECORDn] quanto o conteúdo desta cláusula. Somente se
DataSetType=ASCIIM
RecTypeStart
Posição do tipo de registro no arquivo. Somente se
DataSetType=ASCIIM
RecTypeSize
Tamanho do tipo de registro no archivo. Somente se
DataSetType=ASCIIM
Seção Field
cláusulas
descrição
Name
Nome do campo.
Label
Rótulo do campo.
21
Record
Tipo de registro ao qual pertence. Se é um campo comum a
todos os tipos de registro, Record=COMMON
Type
Tipo de campo. INTEGER, REAL ou STRING
Start
Posição no registro de entrada.
Size
Tamanho do campo.
NotApplicable
Valor no arquivo de entrada que significa Não se Aplica.
Opcional.
Missing
Valor no arquivo de entrada que significa Valor Omitido.
Opcional.
Blank
Valores possíveis NOTAPP ou MISSING. Se o branco no
arquivo de entrada é Não se Aplica ou Missing.
RangeMin
Valor para a faixa mínima aceitável.
RangeMax
Valor para a faixa máxima aceitável.
ValueLabels
Número de rótulos para as categorias do campo. Existirão
tantas cláusulas VLn quanto o conteúdo desta cláusula.
VLn
Código e valor da categoria n, no formato
VLn=x texto, onde x é a categoria, e texto é a descrição da
mesma.
Seção Record
cláusulas
descrição
Name
Identifica o tipo de registro, para ser usado na cláusula Record
dos FIELD.
Label
Rótulo do registro.
Value
Valor do tipo de registro.
RELAÇÕES ENTRE .wip E .ddf
O arquivo .ddf contém a definição dos campos do arquivo de entrada, assim como informação
sobre os tipos de registros e forma de ordenamento contidos no arquivo de entrada, e é usado
para "povoar" o esquema de entidades e variáveis da futura base de dados Redatam. O
arquivo .wip, ao contrário, guarda o esquema estrutural, que armazena as entidades e
variáveis da base. O arquivo estrutural da base (.wip), contém o Esquema de Base, e com ele
todas as variáveis assignadas às entidades correspondentes.
Quando se arrasta uma variável desde a janela de propriedades do arquivo de entrada para a
janela de variáveis do Esquema de Base, o sistema copia as características do campo
informadas no arquivo de definição .ddf, e as coloca na variável copiada para o Esquema de
Base. O sistema copia as características tais como Nome, Rótulo, Categorias, Tipo, Tamanho,
Decimais e Comentários.
Entretanto, não copia todas as características. A característica de deslocamento do campo
NÃO é copiada para a variável: o que o sistema faz é armazenar o nome do campo origem da
variável, e armazenar o início da variável EM RELAÇÃO AO INÍCIO DO CAMPO. Por
22
exemplo, o campo IDADE, na posição 17 e tamanho 3 no registro de entrada, ao ser
arrastado para a entidade PESSOA terá as mesmas características, mas seu deslocamento
será 1 (porque é relativo ao início do campo) e seu tamanho será 3.
Esta estratégia de não copiar o deslocamento tem a vantagem de poder modificar a definição
do arquivo de entrada com relação aos deslocamentos, por exemplo, ao equivocar-se ao
definir este parâmetro, ou esquecer-se de um campo. Outra vantagem é possibilitar a
definição de variáveis como parte de um campo: por exemplo, o campo de ATIVIDADE (início
28 e tamanho 4) pode estar conectado a três variáveis no Esquema, a primeira como
ATIVIDADE, mesmo tamanho (deslocamento 1), uma segunda como GRUPO (grupo de
atividade, primeiro dígito da atividade), com tamanho 1 e deslocamento também 1, e a terceira
como as duas últimas posições da atividade, com tamanho 2 e deslocamento 3.
Depois de executar a carga da base, o dicionário (.dic) é gerado automaticamente, assim
como os arquivos de ponteiros (.ptr) e de variáveis (.rbf), e será, em principio, uma versão de
trabalho do Esquema de Base (.wip), sem ter mais nenhuma conexão com o arquivo de
definição (.ddf)
Preparação do Arquivo de Entrada
ETAPAS INICIAIS
Uma base de dados R+G4 pode ter uma estrutura muito simples, com um só ramo de
informação, ou tão complexa como você possa imaginar, com múltiplos ramos na árvore
hierárquica. Pode ser muito pequena em tamanho (só uns quantos Megabytes), ou muito
grande, incluindo dados censitários com centenas de Megabytes. Independentemente de qual
seja o seu caso, antes de começar o processo de geração, você tem que considerar as
etapas aqui descritas.
(1) Revisar e definir o formato do arquivo de entrada
(2) Cuidados com o arquivo de entrada
(3) Verificar formatos aceitos para a definição do arquivo de entrada
(4) Definir os campos de entrada
(5) Proceder a criar o Esquema de Base e carregar a base R+G4
FORMATO DO ARQUIVO DE ENTRADA
Para gerar uma base de dados, R+G4 pode ler arquivos ASCII (.dat) e Dbase (.dbf). Os
registros num arquivo podem estar organizados de duas maneiras: com um formato único ou
com um formato múltiplo.
Se seu arquivo de entrada está armazenado em um tipo especial de formato, tais como
aqueles usados em aplicativos comerciais, por exemplo, LOTUS, SAS, SPSS, etc., você tem
que convertê-los a um formato DBF ou a arquivos planos de formato ASCII antes de gerar a
base em R+G4.
FORMATO ÚNICO
23
O arquivo de entrada tem um só tipo de registro, isto é, todos os registros têm o mesmo
formato e identificam a uma mesma entidade. Nesse caso, R+G4 assume que eles pertencem
somente a uma entidade, por exemplo "pessoa". Você pode misturar variáveis de diferentes
entidades num arquivo com um formato único sempre e quando a entidade inferior esteja
presente. Por exemplo, se o arquivo com formato único representa a pessoas, mas também
inclui variáveis do domicílio, todas as variáveis do domicílio deverão estar duplicadas em cada
registro correspondente às pessoas dentro desse domicílio.
Identificação-variáveis
Dados
Provincia
|
Comuna
|
|
Distrito
|
|
|
Manzana Numviv Nper
|
|
|
|
01
01
001
358
01
01
01
001
358
01
01
001
01
01
01
01
Luz
agua
sexo
idade
P1
1
1
2
23
01
P2
1
1
1
33
358
01
P3
1
1
2
12
001
358
02
P1
2
1
1
56
01
001
358
02
P2
2
1
2
52
01
001
358
02
P3
2
1
2
16
As outras variáveis que devem estar presentes num arquivo com um único formato de registro
são aquelas que identificam as entidades superiores à entidade específica na estrutura de
árvore hierárquica. Por exemplo, se você está carregando dados para a entidade PESSOA
desde um arquivo de formato simples, as variáveis que estão presentes são aquelas que
pertencem a esta entidade, e além disso se duplicam as variáveis de entidades superiores
incluindo as variáveis de identificação de entidades superiores como MANZANA, DISTRITO,
COMUNA y PROVINCIA, as quais são, respectivamente, as entidades superiores.
FORMATO MÚLTIPLO
Se você está tratando com um arquivo de formato múltiplo, tal como aqueles encontrados em
pesquisas domiciliares e censos de população, existem dois ou mais tipos de registros num
mesmo arquivo. Por exemplo, quando você tem um tipo de registro para os dados de
domicílio e outro registro para os dados de população, este arquivo deve ter uma coluna
específica para identificar o tipo de registro, por exemplo, "1" para domicílio e "2" para
população, como se mostra na tabela abaixo.
Tipo-reg
Identificação-variáveis
Dados
Provincia
|
Comuna
|
|
Distrito
|
|
|
Manzana
|
|
|
|
24
1
01
01
001
358
Domicílio
2
01
01
001
358
Pessoa 1
2
01
01
001
358
Pessoa 2
2
01
01
001
358
Pessoa 3
1
01
01
001
358
Outro Domicílio
2
01
01
001
358
Pessoa 1
Nesse caso, cada tipo de registro (o tipo 1 para domicílio, e o tipo 2 para pessoas) será
referido a uma entidade diferente na base de dados criada em R+G4, e os dados de cada tipo
de registro serão carregados só para essa entidade. Cada tipo de registro deve ter variáveis
pertencentes só à entidade específica a que se refere, mais as variáveis de identificação
geográfica das entidades de níveis superiores na hierarquia como MANZANA, DISTRITO,
COMUNA e PROVINCIA.
Estas variáveis de identificação para as entidades superiores são necessárias para construir
as relações entre os diferentes níveis, isto é, os arquivos de índices (".PTR"). É a única
maneira que o sistema tem para "conhecer" como enlaçar os dados desde uma entidade de
menor nível a uma de maior nível.
Para as entidades que não têm variável de identificação, como é o caso de DOMICÍLIO, o
sistema "saberá" quando criar um elemento detectando seu tipo de registro no arquivo de
entrada. Isto é, usando o mesmo exemplo de um típico arquivo de censo, cada tipo de registro
"1" criará um elemento domicílio para a entidade DOMICÍLIO, e os registros tipo "2" que
vierem depois deste registro tipo "1" criarão registros de pessoas para a entidade PESSOA,
mantendo a dependência ao domicílio anterior. Os domicílios sem pessoas não terão registros
tipo "2" a continuação de seu registro tipo "1". Para detectar aqueles domicílios sem pessoas
se aconselha trabalhar com registros de formato múltiplo, já que com o formato único se
criaria sempre uma entrada para uma pessoa ainda que as variáveis pudessem ser
consideradas com valores não se aplica.
É importante notar que o registro de domicílio tem que vir ANTES dos registros de população
correspondentes. Quer dizer, o arquivo deve ter os registros ordenados.
O arquivo de formato de registros múltiplo é algumas vezes chamado arquivo "hierárquico",
porque existe uma certa "hierarquia" entre os registros tipo "1" e "2", isto é, os registros tipo
"2" "dependem" do registro prévio tipo "1". Porém, este não é realmente um arquivo
hierárquico, porque a parte identificatória (geralmente a informação geográfica) está duplicada
para todos os registros. Um verdadeiro arquivo hierárquico teria um tipo de registro por cada
nível de informação (entidade), como na tabela a seguir.
Cada entidade teria um tipo de registro específico para armazenar seus dados. A informação
"geográfica" não seria repetida para cada registro no arquivo, mas apareceria só no tipo de
registro específico. Por exemplo, a informação de província (como seu código, nome ou outra
informação desse nível) seria armazenada só nos registros tipo "1". Este tipo de arquivo não é
comum em processamento estatístico, ainda que seja muito útil para economizar espaço.
Tipo-reg
Dados
|
|
1
Província (código e outra informação)
2
Comuna
3
Distrito
4
Manzana
5
Domicílio
6
Pessoa 1
25
6
Pessoa 2
...
5
Outro Domicílio
6
Pessoa 1
…
CUIDADOS COM O ARQUIVO DE ENTRADA
Antes de entrar em detalhe na geração de uma base de dados é necessário analisar o
conteúdo dos arquivos originais e verificar sua consistência. Se não se conta com um
dicionário de dados, é imprescindível conhecer a distribuição de cada campo para poder
defini-los corretamente na base. Para isto se recomenda gerar freqüências de cada campo.
Uma vez que se conheça todos os possíveis valores de cada campo com exatidão, deve-se
definir um dicionário com a seguinte informação:
a)
O formato de entrada dos dados (registro únicos ou múltiplos)
b)
Se é múltiplo, o campo que define o tipo de registro (nome, posição, e tamanho)
c)
Para cada campo definir o nome, posição e tamanho
d)
Além disso, o tipo de campo (real, inteiro, caracter)
e)
A faixa, isto é, o valor mínimo e máximo possível de encontrar
f)
Os valores fora desta faixa (brancos, ignorados e possíveis inconsistências).
g)
O número de categorias possíveis de encontrar
h)
Descrição das categorias
Uma vez definido o dicionário deve-se verificar a consistência dos dados:
i)
Verificar que não exista duplicidade de registros, quer dizer, dois registros para um
mesmo elemento. Por exemplo, verificar que não se encontre uma pessoa definida duas
vezes.
j)
Verificar que um campo definido como código identificador de entidade tenha somente
números. Esta é uma limitação de R+G4 já que o código é um valor numérico
armazenado como caracter. Por exemplo, mudar códigos como 02001A para número.
k)
Verificar que o código definido como identificador de um elemento seja único para esse
elemento. Por exemplo, que dentro de um bloco não existam dois domicílios 01.
l)
Decidir os campos geográficos a utilizar na estrutura hierárquica, além de identificar
quais levarão nome ou rótulos (por exemplo, província, região, distrito, segmento, etc.).
m) Ordenar os dados segundo a seqüência da hierarquia que se vai utilizar: O arquivo de
entrada deve ser classificado utilizando como padrão o conjunto de campos de
identificação de geografia, necessários para o acesso geográfico à base de dados de
Redatam. Pode-se utilizar um utilitário como LSORT, ou aplicativos como FoxPro ou
IMPS para tais efeitos.
26
DICIONÁRIOS ACEITOS PARA O ARQUIVO DE
ENTRADA
Os dados do arquivo de entrada (arquivo com dados originais) se comunicam com o esquema
de base em Redatam através do dicionário (ou arquivo de definição) o qual pode vir em
qualquer dos formatos aceitos por R+G4:
As alternativas de formatos são:
· Arquivo xBase. Nesse caso o arquivo de definição é diretamente o arquivo original de
carga (.dbf), não há necessidade de ter uma definição a parte.
· IMPS4. O arquivo de definição (dicionário) foi definido usando-se o software IMPS4.1,
e tem a extensão .ddw.
· ISSA. O arquivo de definição (dicionário) foi definido usando-se o software ISSA ou
CSPro e tem a extensão .map.
· Chillán. É o formato interno de R+G4 para a definição dos dados de entrada (extensão
.ddf).
Para facilitar os processos posteriores e eventuais câmbios na definição de variáveis, se
recomenda exportar o dicionário de ISSA ou IMPS para o formato Chillán .
DEFINIÇÃO CHILLÁN – REGISTRO MÚLTIPLO
Arquivo ASCII com Registros Múltiplos
A seguinte estrutura afeta a:
1. Arquivos de registros múltiplos
2. Registros sem hierarquia
Descrição de seções com um exemplo
[General]
Fields=17
RecTypeStart=2
RecTypeSize=1
Records=4
[Record1]
Name=VIVIENDA
Label=Vivienda
Value=1
MaxNumber=27
BrotherRecord=HOGAR
[Record2]
Name=HOGAR
27
Label=Hogar
Value=2
MaxNumber=27
ParentRecord=Common
BrotherRecord=PERSONA
[Record3]
Name=PERSONA
Label=Persona
Value=3
MaxNumber=27
ParentRecord=Common
[Field1]
Name=ORDVIV
Type=STRING
Size=5
Start=19
Record=Common
ValueLabels=0
[Field2]
Name=REGION
Type=STRING
Size=2
Start=39
Record=Common
ValueLabels=0
[Field3]
Name=PROVINC
Type=STRING
Size=1
Start=41
Record=Common
ValueLabels=0
[Field4]
Name=COMUNA
Type=STRING
Size=3
Start=42
28
Record=Common
ValueLabels=0
[Field5]
Name=DISTRITO
Type=STRING
Size=2
Start=45
Record=Common
ValueLabels=0
[Field6]
Name=AREAC
Type=STRING
Size=1
Start=47
Record=Common
ValueLabels=0
[Field7]
Name=ZONALOC
Type=STRING
Size=3
Start=48
Record=Common
ValueLabels=0
Nota: As variáveis que pertencem à raiz devem declarar um pai comum (common).
DEFINIÇÃO CHILLÁN - REGISTRO SIMPLES
Arquivo ASCII de Registro Simples
Descrição de seções
Exemplo
[General]
Fields=401
DataSetType=ASCII1
[Field1]
Name=CLAVE
29
Type=
Size=15
Start=1
Record=Common
ValueLabels=0
[Field2]
Name=REGION
Type=INTEGER
Size=2
Start=1
Record=SECCION
ValueLabels=0
[Field3]
Name=PROVIN
Type=INTEGER
Size=1
Start=3
Record=SECCION
ValueLabels=0
[Field4]
Name=COMUNA
Type=INTEGER
Size=3
Start=4
Record=SECCION
ValueLabels=0
[Field5]
Name=IFOLIO
Type=INTEGER
Size=4
Start=7
Record=SECCION
ValueLabels=0
[Field6]
Name=IDVF
Type=INTEGER
Size=1
30
Start=11
Record=SECCION
ValueLabels=0
[Field7]
Name=CIIU
Type=INTEGER
Size=4
Start=12
Record=SECCION
ValueLabels=0
[Field8]
Name=P106
Type=INTEGER
Size=1
Start=16
Record=SECCION
ValueLabels=0
[Field9]
Name=P107
Type=INTEGER
Size=1
Start=17
Record=SECCION
ValueLabels=4
VL1=1 Privada Nacional
VL2=2 Privada Extranjera
VL3=3 Mixta
VL4=4 Estatal
USO ALTERNATIVO DO IMPS 4.1
Uma das maneiras de evitar a tarefa tediosa de ingressar à mão toda a informação necessária
para descrever o arquivo de entrada em formato Chillán é fazer uso do software IMPS 4.1, do
Bureau de Censos dos Estados Unidos, que tem um editor muito bom de definição de
arquivos.
Esse dicionário (extensão .ddw), produzido pelo IMPS 4.1, pode ser importado ao formato
Chillán pelo Gerador de Bases de Dados de R+G4 de uma maneira muito simples.
Passos a seguir para Importar um dicionário IMPS 4.1 a Chillán
31
Entrar no modulo R+Create e abrir um Esquema de Base novo. O sistema mostra um
Esquema de Base vazio, com o nome de "Sem Título" e com uma única entidade "raiz".
No menu Dados de Entrada >Abrir Definição >IMPS4.1, navegar no disco e buscar o
arquivo do dicionário de IMPS correspondente. Depois de aceitar o arquivo IMPS (.ddw), o
sistema dá uma mensagem dizendo que o arquivo de dados não foi encontrado, não se
preocupe: esta mensagem se refere ao arquivo de dados que contém os dados de entrada, o
qual não é necessário nesse momento, e não a seu arquivo de definição (.ddw). O sistema
mostra a janela de Propriedades do Arquivo de Origem.
Em menu Arquivo >Exportar para Chillán, eleger o diretório e nome do arquivo tipo Chillán
(.ddf) a ser criado.
Fechar a janela de Propriedades do arquivo de entrada e fechar também o Esquema de Base,
sem salvá-lo.
Geração
DESCRIÇÃO RESUMIDA DA GERAÇÃO
A Geração de uma base de dados R+G4 nada mais é do que um processo de modificação de
formato do arquivo de entrada ao formato final em R+G4. Claro está que, para executá-la
bem, é necessário cumprir uma série de condições e procedimentos.
Em primeiro lugar, deve-se verificar se o arquivo original de entrada está preparado para a
geração, se está classificado na ordem que se necessita, se a estrutura de casos pode ser
"entendida" pelo Gerador, etc.
Em segundo lugar, como se trata de um câmbio de formato, é necessário definir ambos
formatos, tanto o formato original do arquivo de entrada como o formato definitivo da base.
Isso significa a criação da Definição do Arquivo de Entrada (extensão .ddf) e do Esquema de
Base. Além disso, deve-se "mapear" os campos de uma definição para a outra, quer dizer,
quais (e de que maneira) os campos de entrada estarão representados na base de saída.
Por último, Gerar a base propriamente dita, fazendo uma revisão do processo e do dicionário
produzido.
Etapas a seguir
Anteriores a R+G4
Preparar original
Verificar se o arquivo cumpre com as condições necessárias para a
Geração.
Definir entrada
Descrever as propriedades do arquivo de entrada.
Em Geração R+G4
Estrutura Hierárquica
Desenhar a estrutura da base com suas entidades.
Mapear variáveis
Empalmar as definições de campos no arquivo de entrada com as
variáveis da base.
Propriedades das Variáveis
Verificar rótulos, categorias, faixas, valores não se aplica e
missing. Definir também os códigos selecionáveis das entidades.
Criar a Base
Executar o processo de Geração propriamente dito.
Revisão do Processo
Examinar o relatório de geração.
32
Em Process R+G4
Nomes de elementos
Gerar as variáveis correspondentes aos nomes dos elementos das
entidades que possuam nomes.
Revisão do Dicionário
Verificar a relação entre o dicionário e os arquivos de dados e
ponteiros.
Revisão das Variáveis
Verificar a distribuição de freqüências das categorias das variáveis,
e compará-las com as freqüências do arquivo original de entrada.
Fora de R+G4
Back Up
Compressão e cópia da base.
PREPARAÇÃO DO ARQUIVO DE ENTRADA
A preparação do arquivo de entrada consiste em programar a função de geração da base, ter
um conhecimento mais aprofundado do arquivo a ser trabalhado, verificar se as condições de
carga se cumprem, classificar, se necessário, o arquivo, preparando-o para a carga, enfim,
todas as tarefas preparatórias necessárias para possibilitar a geração da base.
Estas tarefas estão melhor descritas no tópico de Cuidados com o Arquivo.
DEFINIR OS CAMPOS DE ENTRADA
Com a informação que se obtém ao analisar um arquivo com dados originais é necessário
criar um dicionário ou definição de dados para R+G4. O dicionário de um arquivo de entrada é
também denominado definição do arquivo de entrada. No dicionário ou definição se indica o
nome do arquivo com os dados, se indicam os campos a incluir na base de dados, seu nome,
tipo, tamanho, faixa, possíveis categorias e o tipo de registro a que pertencem.
Para a definição pode-se utilizar algum dos formatos aceitos por R+G4 (ver formatos aceitos
para o arquivo de entrada) ou pode-se gerar utilizando o formato Chillán.
DEFINIR A ESTRUTURA HIERÁRQUICA DA BASE
O processo de geração de uma base de dados R+G4 começa por estabelecer as entidades
da hierarquia e suas variáveis no Esquema de Base, que se armazena num arquivo com a
extensão .wip.
Para começar a criação de um esquema novo se seleciona a opção Arquivo >Novo desde o
menu principal, e se começa a preencher a janela com a nova definição da estrutura
hierárquica.
O programa mostra a Janela do Esquema de Base onde aparece a definição das Entidades
que formam a estrutura hierárquica da nova base de dados que vai ser gerada (por exemplo
Região, Província, Comuna, Distrito, etc.).
33
Para agregar uma entidade, ou para as outras funções de manutenção dessa estrutura, tais
como deletar entidades, mover entidades para outro ramo, etc., usar o menu dinâmico de
entidades. Ao salvar este esquema, o sistema cria um arquivo de Esquema de Base, no
diretório definido, com a extensão .wip.
DEFINIR VARIÁVEIS PARA CADA ENTIDADE
Essa atividade consiste em arrastar variáveis desde a janela de Propriedades do Arquivo de
Entrada para a janela do Esquema de Base, tendo marcado previamente (com um clique do
mouse) a entidade para à qual pertencerá a variável.
Para definir as variáveis para cada entidade deve-se abrir a janela de propriedades dos dados
de entrada (onde aparecem os campos todos juntos ou separados pelo tipo de registro). Isso
se faz com a opção do menu principal em Dados de Entrada >Mostrar definição de dados
de entrada. A mecânica de todo o processo se baseia em selecionar a entidade à qual vai se
agregar uma variável no Esquema de Base e em seguida arrastar os campos desde a janela
de propriedades do arquivo de entrada, até o painel de variáveis do Esquema de Base.
Esta é a única forma de definir variáveis para cada entidade, uma vez que NÃO EXISTE
OUTRA MANEIRA de criar variáveis no Esquema de Base que não seja a partir dos campos
existentes no arquivo de entrada (dados pela descrição de campos adjunta). Não se pode, por
exemplo, agregar uma variável nova, como se faz com as entidades, no Esquema de Base.
Cabe mencionar que o menu dinâmico de variáveis não tem a função de agregar variáveis ao
Esquema de Base.
Passos a seguir
Selecionar a entidade
Com o botão esquerdo do mouse, clicar no nome da entidade no
Esquema de Base.
Selecionar os campos
Na janela de propriedades do arquivo de entrada, localizar o(s)
campo(s) que se deseja colocar na entidade selecionada. É
possível selecionar um ou mais campos, da maneira usual em
Windows, com um clique no mouse esquerdo no nome do campo,
ou acompanhado das teclas Ctrl para selecionar campos
separados, ou com a tecla Shift para selecionar um intervalo de
campos.
34
Arrastar os campos
Com o mouse esquerdo, arrastar os campos para a parte de
variáveis (direita) do Esquema de Base.
Os nomes dos campos serão movidos para a parte de variáveis do Esquema de Base, e
estarão conectados com a entidade marcada.
É possível arrastar um campo mais de uma vez para o Esquema de Base, no caso de que se
queira gerar variáveis correspondentes a seções ou partes de um campo (por exemplo,
ocupação e grupo de ocupação, ou uma variável numérica e também a mesma variável como
string). Nesse caso, antes de arrastar o campo pela segunda vez, mudar o nome da variável
no Esquema.
35
DEFINIR VARIÁVEIS E CÓDIGOS DE ENTIDADE
Esta etapa tem duas funções distintas:
a) Verificar as características das variáveis; e
b) Definir os códigos que identificam as entidades.
Verificar as características das variáveis
O processo de definir variáveis para cada entidade estabelece quais variáveis vão "pertencer"
a quais entidades no Esquema de Base. Estas variáveis têm propriedades que provêm da
descrição dos campos do arquivo de entrada, que as vezes não foram totalmente definidas,
mas são necessárias para a geração de uma base Redatam.
No momento de salvar o Esquema de Base, ou então quando se Verifica a Consistência do
Esquema o sistema faz uma verificação de seu conteúdo e das propriedades das variáveis.
Se faltar alguma definição necessária o sistema mostra uma caixa de mensagens e
advertências com a explicação da informação que falta (ou que está errada). Cada variável
deve ter a seguinte informação:
·
posição
·
tamanho (no arquivo de entrada)
·
tipo (inteira, real ou alfanumérica),
36
·
limites mínimo e máximo (se variável numérica, quer dizer, inteira ou real), e
·
definição dos valores para fora de faixa e não se aplica.
Definir os códigos das entidades
As entidades podem ser selecionáveis ou não selecionáveis. Para que uma entidade seja
selecionável é necessário que ela tenha uma variável de identificação, de valores únicos para
cada elemento da entidade, e de tipo alfanumérico (STRING). Para marcar uma entidade
como selecionável, chamar o menu dinâmico com o mouse sobre o nome da entidade, e
escolher a opção Entidade Selecionável. O sistema colocará uma marca ao lado esquerdo
desta opção, significando que a entidade está marcada como selecionável. Para desmarcar
uma entidade (passá-la para não selecionável), chamar o menu dinâmico e desmarcar a
opção.
Toda entidade selecionável necessita uma variável para identificar seus elementos, e É
OBRIGATÓRIO que esta variável seja do tipo STRING. Se a entidade não tem nenhuma
variável do tipo STRING, o sistema não permite que seja marcada como selecionável, ainda
que se chame o menu dinâmico e se tente marcar a opção.
Depois de marcar a entidade como selecionável, deve-se definir sua variável de identificação.
Com o mouse sobre a variável elegida, chamar o menu dinâmico e escolher a opção Código
de Entidade. O sistema reconhece este comando mostrando uma bandeira ao lado do nome
da entidade.
GERAR A BASE R+G4
No menu principal eleger a opção Base de Dados >Executar Geração. O sistema verifica a
consistência do Esquema de Base e, caso positivo, inicia o processo de carga, com uma serie
de painéis (ou passos) manejados pelos botões de Avançar e Voltar, na parte inferior da
janela. É possível usar um Esquema de Geração salvo anteriormente usando o botão de
Carregar Esquema. Ainda que se use um Esquema de Geração, é necessário seguir com o
botão de Avançar até o último painel (passo), quando aparece o botão de Executar.
Passo 1 – Definir parâmetros da Base
Nome da Base
Nome genérico da base de dados. Por default é o nome da entidade
raiz. Este nome será usado como prefixo dos nomes dos arquivos .rbf e
.ptr da base. Se é necessário manter a compatibilidade com a versão
anterior de winR+ v1.2, este nome deve ter até quatro caracteres
alfanuméricos, e começar com uma letra.
Nome do
dicionário
e sua localização
Nome do arquivo .dic a ser gravado para o dicionário da base, com seu
passo completo. É possível ingressar este nome à mão, ou usar o
botão de navegação à direita. Se recomenda um diretório em separado
para armazenar os arquivos da base.
Compatibilidade de
Versões
Se a base vai ser usada também pela versão anterior de Redatam
(winR+ v1.2). Se recomenda manter esta compatibilidade.
Passo 2 – Definir Arquivo Original
Identificador
Tipo do arquivo de entrada. Na verdade, este tipo já está definido pelo
tipo indicado no dicionário do arquivo de entrada (simples ou múltiplo).
37
Nome do arquivo
Define o nome (localização completa) do arquivo de entrada a ser
usado na geração. Em geral, este campo já deveria vir definido na
janela de propriedades do arquivo de entrada, mas se não existir essa
informação, usar o botão de navegação ao lado do identificador para
eleger o arquivo de entrada.
Passo 3 – Definir Esquema de Identificação de Arquivos
O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis
da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base.
Estes arquivos necessitam ter nomes, para que possam ser referenciados apropriadamente
pelo dicionário. O esquema de geração destes nomes pode ser:
a) numeração automática; ou
b) usando os nomes de entidades e variáveis.
Numeração automática
Os arquivos são nomeados em seqüência numérica, todos com o
prefixo do nome da base. Por exemplo AGRO0020.RBF,
AGRO0035.PTR, etc.
Nomes de Entidades
Os arquivos são nomeados usando-se os nomes de suas
respectivas entidades e variáveis. Por exemplo, SEXO.RBF
Nota: Por compatibilização com a versão anterior se recomenda a numeração automática.
Passo 4 – Selecionar Entidades a Gerar
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas
deve-se estabelecer os parâmetros a seguir.
Gerar Ponteiro
Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral
esta marca deve estar sempre ligada.
Nome do arquivo
Define o nome (passo completo) do arquivo de ponteiro. Este nome, por
definição, já foi estabelecido pelo sistema quando se definiu o esquema
de nomes no passo anterior, mas existe a possibilidade de editar este
campo e modificar o nome do arquivo que armazenará os ponteiros da
entidade.
Verificar seqüência Para as entidades selecionáveis, eleger se o sistema deverá verificar a
ordem dos elementos em tempo de carga, para garantir a seqüência.
Tipo de registro
Para as entidades não selecionáveis, eleger o tipo de registro, definido
no arquivo de entrada, como ponto de quebra ao qual corresponderá a
entidade a ser carregada.
Passo 5 – Selecionar Variáveis
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas,
deve-se marcar as variáveis a serem carregadas. Pode-se usar os botões de Selecionar
Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de uma entidade.
Passo Final – Gerar a Base
Usar o botão de Executar para começar a carga da base. Nesse momento, ANTES da
geração propriamente tal, pode-se usar o botão de Salvar Esquema para que o mesmo possa
ser reusado em caso de necessidade de reexecutar o processo.
38
Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com
dados de início, previsão de término, percentagem de execução, etc.
Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de
Geração.
REVISAR RELATÓRIO DO PROCESSO DE
GERAÇÃO
Ao término da carga o sistema mostra uma janela com o Relatório do Processo de Geração.
Este informe deve ser salvo para posterior consulta (no menu principal, Arquivo >Salvar
Como).
O Relatório contém as quantidades de elementos gerados para cada entidade, e as
quantidades de elementos gerados por variável, separados em Valores Válidos, Valores Não
se Aplica, e Valores Missing. Verificar estes valores contra o esperado em cada uma das
variáveis.
As quantidades de elementos nas entidades, para as entidades não selecionáveis, deve ser a
mesma que o número de registros do arquivo original de entrada, por exemplo, o número de
domicílios e de pessoas. Para as entidades selecionáveis, este número deve ser o número
esperado de casos das entidades geográficas, como por exemplo, províncias.
Para as entidades, resultados não esperados podem ter várias causas:
Arquivo original de entrada não classificado. Isto faz com que as entidades superiores
possam aparecer mais de uma vez na contagem (a cada "quebra" deste código o sistema
contabiliza um novo elemento da entidade).
Deslocamento do campo de código. Uma definição equivocada do campo de província, por
exemplo, começando na coluna errada (ou com o tamanho equivocado), seguramente irá
ocasionar um número errado de províncias na base.
Tipo de registro equivocado. O empalme entre a entidade e o tipo de registro na janela de
propriedades do arquivo de entrada está incorreto. Por exemplo, se inverteu o tipo de registro
de domicílio com o de pessoa.
Para as variáveis, os resultados não esperados podem ter as seguintes causas:
Deslocamento do campo de entrada. Uma definição equivocada do campo de entrada, por
exemplo, começando na coluna errada (ou com o tamanho equivocado), seguramente irá
ocasionar um resultado errado para a variável.
Faixa de valores. A definição dos limites mínimo e máximo para a variável determina os
valores de entrada que serão convertidos a missing (fora de faixa).
GERAR NOMES DE ELEMENTOS
Em geral, o arquivo original de dados não possui os campos de nomes de elementos das
entidades, somente seus códigos. Por exemplo, as posições 2 e 3 do registro trazem o código
das províncias, (01, 02, 03, etc.), mas seus nomes (Bellavista, Eldorado, etc.) não estão no
arquivo. Desta maneira não há como gerar a informação de nomes diretamente do arquivo de
entrada.
39
Por outro lado, essa é uma informação importante, porque além de servir para documentar os
resultados dos processos (com os nomes das províncias e não seus códigos), é usado
também no módulo de seleção geográfica para facilitar a localização (e seleção) das
províncias a processar.
Apesar de tratar-se de um processo de carga de variáveis, esta função é executada pelo
Processador Estatístico de R+G4, e está descrita em Agregar Variável.
Para gerar os nomes dos elementos se recomenda partir de um arquivo que tenha somente
os registros desta entidade, com um registro para cada elemento, com o código e o nome do
elemento. Por exemplo,
123
Aranjuez
175
Marguerita
178
Carbajal de los Montes
Os nomes devem estar separados dos códigos pelo menos por um espaço (não usar o
caracter tabulador). Seguir as instruções em Agregar Variável, usando a técnica de Tabelas
Lookup para carregar os nomes.
REVISAR CONSISTÊNCIA DO DICIONÁRIO
Depois da geração da base deve-se verificar todo o processo e o conteúdo do dicionário.
Parte dessa revisão já deve ter sido executada na etapa de revisão do Relatório do Processo.
A revisão do dicionário é executada no módulo de Processo de Bases de Dados. Esse
módulo, no menu principal de Dicionário >Consistência, executar ambos processos, o de
Localizar Arquivos, e o de Relatório de Erros.
Localizar Arquivos
Verificação e atualização do dicionário com respeito às entidades e variáveis descritas nele, e
à LOCALIZAÇÃO de seus correspondentes arquivos binários ou ponteiros que lhes
armazenam. O processo verifica se todos os arquivos mencionados no dicionário estão
localizáveis. Caso contrário, mostra uma mensagem dizendo que não encontrou determinado
arquivo, e pergunta se deseja localizá-lo. O sistema abre a caixa de diálogo para que se
navegue no disco em busca do arquivo "perdido".
Essa possível falta de arquivos pode ser também um indicador de que algo não foi bem na
carga da base, porque seu dicionário tem informações contraditórias em relação ao conteúdo
da mesma. Nesse caso, da falta de um arquivo correspondente a uma variável ou ponteiro,
deve-se revisar o processo de carga, olhando seu Relatório de Processo.
Caso se apresente uma falta de arquivos mas que estes sejam posteriormente localizados
usando a caixa de diálogos, o sistema dá uma mensagem de que não se encontraram erros
na base. Entretanto, deve-se salvar o dicionário para que seja atualizada a informação da
localização destes arquivos "perdidos".
Relatório de Erros
Gerar um relatório em que se descreve a verificação de consistência de TAMANHOS entre o
dicionário e os arquivos que armazenam as entidades (ponteiros) e variáveis (arquivos .rbf). O
processo verifica se todos os arquivos têm os tamanhos que deveriam ter de acordo à
informação no dicionário.
40
Caso não encontre erros, o resultado desse processo é uma lista das entidades com seu
respectivo número de casos. Caso contrário, o resultado apresenta o arquivo com o tamanho
inconsistente, e a informação do tamanho que deveria ter (tamanho lógico) e seu tamanho
real (tamanho físico).
Estes erros de tamanho são indicações claras de que a base não foi carregada com precisão.
Verificar se as entidades correspondentes aos registros de entrada têm o mesmo número de
casos que no arquivo original (as vezes existe um equívoco na ligação das entidades com os
tipos de registro).
O tamanho lógico de um arquivo é calculado da seguinte maneira:
Arquivo de ponteiros Cada ponteiro ocupa 4 bytes, pelo que se multiplica o número de casos
da entidade mãe por 4. Quer dizer, para calcular o tamanho do arquivo
de ponteiros de pessoas, multiplicar o número de domicílios por 4
(assumindo-se que a entidade pessoa seja diretamente dependente de
domicílio).
Arquivo de dados
Dependendo de seu tipo, cada variável ocupa um certo número de bits
se é INTEGER, ou alguns bytes, se é REAL ou STRING. No primeiro
caso, tomar o tamanho da variável (informado no dicionário, painel de
propriedades da variável) e dividir por 8, para ter seu tamanho em
bytes. Em seguida, multiplicar o tamanho da variável (seja de qualquer
tipo) pelo número de casos de sua entidade mãe. Por exemplo,
tomemos a variável estado civil, que é de formato INTEGER e tem 4
bits. A entidade pessoa, à qual a variável pertence, tem 2.400.000
pessoas (informação existente no Relatório de Erros). O tamanho lógico
do arquivo de estado civil deverá ser o resultado de 2.400.000 * 4 / 8.
Nota: Em função da estratégia interna de armazenamento, pela qual se usam blocos de 4
bytes na criação dos arquivos, podem aparecer pequenas diferenças (até 4 bytes), mas o
sistema não as leva em consideração, apontando somente as maiores que 4.
REVISAR FREQÜÊNCIAS DE VARIÁVEIS
Freqüências
Para garantir o conteúdo da base de dados é necessária uma revisão na distribuição de
freqüências das categorias das variáveis, e compará-las com os valores obtidos a partir do
arquivo original de entrada.
Este processo se executa com o módulo de Processo, usando no menu principal a opção
Processos Estatísticos > Freqüências, arrastando para essa janela os nomes de todas as
variáveis categorizadas do dicionário. Para as variáveis quantitativas se recomenda uma
recodificação das mesmas, com o mesmo esquema usado para as freqüências do arquivo
original. Nesse caso não se pode usar o processo de freqüências diretas, deve-se fazer um
pequeno programa para recodificar as variáveis (DEFINE AS RECODE) e depois ter uma
tabulação das recodificações (TABLE AS FREQUENCY).
Relações entre entidades
O conceito de estrutura hierárquica de uma base de dados R+G4 tem uma série de
vantagens, entre elas a possibilidade de armazenamento das variáveis no nível adequado,
sem repetição. Por exemplo, os códigos de província estão na entidade PROVINCIA, os
dados do domicílio estão na entidade DOMICIL, etc. Esta hierarquia permite que uma
41
determinada tabela tenha variáveis de distintos níveis, sempre que elas estejam no mesmo
ramo da árvore hierárquica. Por isso, é possível, por exemplo, ter um cruzamento de
DOMICIL.AGUA por PESSOAA.SEXO, sem que o usuário final tenha que se preocupar com
as diferentes entidades.
Entretanto, deve-se verificar que o processo executou bem o seu trabalho de estruturação
entre as entidades, e que, por exemplo, as pessoas pertençam ao domicílio adequado, que os
domicílios estejam sob a província real, etc. Uma maneira simples de verificar estas relações
é através de cruzamentos entre variáveis dos distintos níveis, ou com freqüências simples
com quebras de área. Se recomenda fazer uma série de tabulações cruzadas entre as
variáveis de entidades distintas, e compará-las com os tabulados existentes do arquivo de
entrada.
Este passo se executa com o módulo de Processo, usando no menu principal a opção
Processos Estatísticos >Freqüências, ou >Cruzamentos, e arrastando para essa janela os
nomes de todas as variáveis necessárias do dicionário, usando também a opção de
AREABREAK.
Exemplos
TABLE uma AS FREQUENCY OF pessoa.sexo AREABREAK provincia
TABLE dois AS FREQUENCY OF domicil.luz AREABREAK provincia
Estas duas tabelas verificam a relação estrutural entre as províncias e pessoas, e entre as
províncias e os domicílios (número de pessoas e domicílios por província).
TABLE tres AS CROSSTABS OF domicil.situac BY pessoa.sexo
Esta tabela verifica a relação entre os domicílios e as pessoas (número de homens e
mulheres por área urbana e rural).
BACK UP DA BASE
O processo de back up, além de sua finalidade direta de salvar a base de dados em outro
lugar, tem também uma necessidade prática para a base RG+4, dada as características
internas do programa de geração: o fato de que se trabalhe com muitas variáveis (e em
conseqüência, muitos arquivos) de cada vez, o processo de carga tem que fechar e depois
abrir estes arquivos de gravação da base, o que fragmenta o armazenamento destes
arquivos.
Para eliminar essa fragmentação se recomenda o uso de um programa de compactação de
arquivos (winZip, por exemplo), com os seguintes passos:
Compactação
Compactação dos arquivos da base (.dic, .rbf e .ptr), produzindo o
arquivo compactado (.zip).
Limpeza
Eliminação dos arquivos da base (.dic, .rbf .ptr) do diretório (para não
correr riscos desnecessários, antes copiar estes mesmos arquivos para
uma área de trabalho temporária).
Regeneração
Descomprimir os arquivos desde o .zip para o diretório da base. Este
passo funciona como um desfragmentador dos arquivos.
Cópia
Gravação de um (ou mais) CD-ROM ou outro meio de armazenamento
com o arquivo .zip para respaldo da base.
42
Uma Volta pela Geração
RESUMO DO GUIA DE CRIAÇÃO DE BASES
Neste guia, você aprenderá os passos básicos para gerar uma base em R+G4. Em particular,
aprenderá os conceitos de e para:
·
Criar um Esquema de Base
·
Carregar uma definição de um arquivo de entrada
·
Definir variáveis para as entidades
·
Gerar a base
·
Revisar o relatório do processo
Guia prático:
·
Criar uma base a partir de um arquivo de registros simples
·
Criar uma base a partir de um arquivo de registros múltiplos
·
Criar uma base a partir de um arquivo xBase
CARREGAR UMA DEFINIÇÃO DE UM ARQUIVO
DE ENTRADA
Quando você quiser criar uma base de dados em Redatam, deve ter dados originais que
sirvam de entrada para esta geração da base. Ao começar a criação de um esquema novo
parte-se com uma nova definição de estrutura hierárquica e depois se chama a janela de
definição do arquivo de entrada. Para isto se seleciona a opção Dados de Entrada >Abrir
definição de dados de entrada desde o menu principal. Os dados de entrada se comunicam
com o esquema novo através do dicionário, que pode vir em qualquer dos formatos aceitos
por R+G4 (ver formatos aceitos para o arquivo de entrada)
CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE
REGISTROS SIMPLES
Para trabalhar este guia e os outros similares se incluiu junto com o programa R+G4 uma
série de arquivos de dados para serem usados como modelo para criar bases em R+G4.
Estes arquivos são os seguintes:
Arquivos com os dados de entrada:
C:\Program Files\redatam\Samples\simple.dat
C:\Program Files\redatam\Samples\multiple.dat
C:\Program Files\redatam\Samples\simple.dbf
Arquivos com as definições dos dados de entrada:
C:\Program Files\redatam\Samples\simple.ddf
43
C:\Program Files\redatam\Samples\multiple.ddf
C:\Program Files\redatam\Samples\multiple.ddw
Este guia se concentra na utilização de um arquivo de formato único como entrada e para isto
se utilizará o arquivo de dados simple.dat e o arquivo de definição destes dados simple.ddf.
Procedimento
Passo 1 – Criar um Esquema de Base
Abrir um Esquema de Base novo desde o menu principal Arquivo >Novo. Na janela que se
abre deve-se começar a definir a estrutura da nova base de dados. Esta estrutura é armada
agregando níveis inferiores ao nível RAIZ, que é criado automaticamente. Para agregar níveis
utilize o menu dinâmico do mouse (botão direito) e selecione a opção Agregar Entidade
Inferior. Em seguida digite o nome desejado na caixa agregada (até 8 caracteres).
Para este exemplo, devem ser inseridos os níveis mostrados na figura.
44
Passo 2 – Carregar definição do arquivo de entrada
Uma vez completada a estrutura hierárquica deve-se chamar o arquivo que será utilizado
como arquivo de entrada. Para isto, não se chama diretamente o arquivo com os dados (.dat),
mas sim o arquivo que guarda a definição dos dados (o dicionário). Desde o menu principal
escolher Dados de Entrada >Abrir definição de dados de entrada. A definição pode vir em
algum destes formatos: Arquivo xBase, IMPS4, ISSA, Chillán. Neste exemplo, se escolhe o
formato Chillán e localizar o arquivo simple.ddf.
Abre-se a janela de propriedades do arquivo de entrada. Esta janela mostra toda a informação
relevante do arquivo de entrada, assim como também lista todas as variáveis (tipo de arquivo,
formato, localização, etc.).
Passo 3 – Assignação de variáveis e códigos a cada entidade
45
Para cada entidade devemos agregar as variáveis correspondentes a ela. Utilizando o mouse
se toma o campo da janela da direita (propriedades do arquivo de entrada) e se arrasta até a
janela da esquerda (lado direito do Esquema de Base). Na figura se mostram as variáveis
telefone e rádio que são arrastadas ao nível de Hogar.
Deve-se declarar a variável identificadora de cada entidade. Para aquelas entidades que
contêm entidades inferiores e que são selecionáveis (por exemplo comuna, distrito, domicílio)
é obrigatório que tenham uma variável definida como o código identificador. Isto se faz com o
mouse sobre o nome da variável correspondente e escolhendo a opção Código de entidade
desde o menu dinâmico. Ao marcar uma variável como código aparece um check ao lado da
opção no menu dinâmico e aparece uma bandeirinha ao lado do nome da variável.
Nem todos os níveis ou entidades devem ter variáveis identificadoras, mas SIM é
obrigatório que cada entidade selecionável tenha um código identificador. Quer dizer, se a
entidade é selecionável é obrigatório o código. Se uma entidade tem entidades inferiores que
não são selecionáveis (por exemplo domicílio e pessoas) não é obrigatório que elas tenham um
código identificador (ordenador), ainda que seja altamente recomendável que cada entidade o
tenha para assim poder verificar a consistência dos registros no momento de criar a base de
dados Redatam.
Passo 4 – Definir cada entidade como selecionável ou não selecionável
Uma vez terminada a assignação de códigos a cada entidade mostrada na janela da esquerda
do Esquema de Base, deve-se definir a propriedade de selecionável ou não selecionável a
cada uma. Isto se faz com o mouse posicionado sobre o nome da entidade e selecionando a
opção Entidade selecionável desde o menu dinâmico, como mostra a figura.
Ao marcar uma entidade como selecionável aparece um check ao lado da opção Entidade
selecionável.
Na figura aparecem as variáveis da entidade pessoa: ordper, sexo e ecivil. Depois aparece a
janela de propriedades da variável sexo (que se abre com a opção Propriedades do menu
dinâmico) para analisar ou completar sua faixa, tipo, categorias, etc. A variável sexo contém as
categorias 1 para homem e 2 para mulher. A variável ordper corresponde ao código
identificador da pessoa.
46
Passo 5 – Verificar consistência do Esquema de Base
Uma vez terminada a assignação de variáveis e atributos das entidades se procede a verificar
a consistência do dicionário e da assignação recentemente efetuada. Desde o menu principal
escolha a opção Base de dados >Verificar consistência do dicionário.
Passo 6 – Gerar a base de dados
Procede-se a gerar a base de dados. Desde o menu principal escolha a opção Base de dados
>Gerar base de dados. O sistema abre um assistente que o guia no processo de geração. Em
cada página do assistente que se abre preencha a informação solicitada:
Nome da Base
Nome genérico da base de dados.
47
Nome do dicionário e sua localização Nome do dicionário (.dic) a ser gravado para o
dicionário da base, com sua localização completa.
Escreva (ou localize) o arquivo C:\Program Files\redatam\Samples\SIMPLE.DIC
Compatibilidade de Versões
Escreva versão 2.0 somente.
Passo 7 – Definir Arquivo Original
Identificador
Tipo do arquivo de entrada. O tipo já vem definido desde que se abre a
definição do arquivo de entrada (simples).
Nome do arquivo
Define o nome (localização completa) do arquivo de entrada (.dat) a
ser usado na geração.
Escreva (ou localize) o arquivo C:\Program Files\redatam\Samples\SIMPLE.DAT
48
Passo 8 – Definir Esquema de Identificação de Arquivos
O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis
da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base.
Estes arquivos necessitam ter nomes, para que possam ser referenciados propriamente pelo
dicionário. O esquema de geração destes nomes pode ser:
a) numeração automática; ou
b) usando os nomes de entidades e variáveis.
Por compatibilização com a versão anterior se usa a numeração automática.
49
Passo 9 – Selecionar Entidades a Gerar
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas
deve-se estabelecer os parâmetros a seguir.
Gerar Ponteiro
Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta
marca deve estar ligada.
Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por
definição, já foi estabelecido pelo sistema quando se definiu o esquema de
nomes no passo anterior, mas há a possibilidade de editar este campo e
mudar o nome do arquivo que armazenará os ponteiros da entidade.
Verificar seqüência
Para as entidades selecionáveis, escolher se o sistema deverá testar a
ordem dos elementos em tempo de carga, para garantir a seqüência.
Tipo de registro Para as entidades não selecionáveis, escolher o tipo de registro, definido no
arquivo de entrada, como ponto de quebra que corresponderá à entidade a
ser carregada.
50
Passo 10 – Selecionar Variáveis
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas,
ao posicionar o mouse sobre seu nome, se listam as variáveis correspondentes. Deve-se
marcar as variáveis que se deseja incluir nesta geração. Pode-se usar os botões de
Selecionar Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de
uma entidade.
Passo Final – Gerar a Base
51
Usar o botão de Executar para iniciar a carga da base. Nesse momento, ANTES da geração
propriamente dita, pode-se usar o botão de Guardar Esquema para que o mesmo possa ser
reusado em caso de necessidade.
Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com
dados de início, previsão de término, percentagem de execução, etc.
Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de
Geração.
Revise este relatório para comprovar que todas as variáveis foram geradas em formato
Redatam de forma correta.
CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE
REGISTROS MÚLTIPLOS
Para trabalhar este guia e os outros similares foi incluído junto com o programa R+G4 uma
série de arquivos de dados a serem usados como modelo para criar bases em R+G4. Estes
arquivos são os seguintes:
Arquivos com os dados de entrada:
C:\Program Files\redatam\Samples\simple.dat
C:\Program Files\redatam\Samples\multiple.dat
C:\Program Files\redatam\Samples\simple.dbf
Arquivos com as definições dos dados de entrada:
C:\Program Files\redatam\Samples\simple.ddf
C:\Program Files\redatam\Samples\multiple.ddf
C:\Program Files\redatam\Samples\multiple.ddw
Este guia se concentra na utilização de um arquivo de formato múltiplo como entrada e para
isto se utilizara o arquivo de dados multiple.dat e o arquivo de definição destes dados
multiple.ddf. De igual forma se poderia utilizar o dicionário IMPS multiple.ddw que contém a
mesma informação sobre os dados de entrada, mas em outro formato (ver formatos aceitos
do arquivo de entrada).
Procedimento
Passo 1 – Criar um Esquema de Base
52
Abrir um Esquema de Base novo desde o menu principal Arquivo >Novo. Na janela que se
abre deve-se começar a definir a estrutura da nova base de dados. A estrutura é armada
agregando níveis inferiores ao nível RAIZ colocado automaticamente pelo sistema. Para
agregar níveis utilize o menu dinâmico do mouse (botão direito) e selecione a opção Agregar
Entidade Inferior. Em seguida se escreve o nome desejado na caixa agregada (máximo de 8
caracteres).
Para este exemplo, devem ser inseridos os níveis mostrados na figura.
Passo 2 – Carregar definição do arquivo de entrada
Uma vez completada a estrutura hierárquica deve-se chamar o arquivo que será utilizado
como arquivo de entrada. Para isto, não se chama diretamente o arquivo com os dados (.dat),
mas sim o arquivo que guarda a definição dos dados (o dicionário). Desde o menu principal
53
escolher Dados de Entrada >Abrir definição de dados de entrada. Neste exemplo, se
escolhe o formato Chillán e localizar o arquivo multiple.ddf.
Abre-se a janela de propriedades do arquivo de entrada. Esta janela mostra toda a informação
relevante do arquivo de entrada, assim como também lista todas as variáveis (tipo de arquivo,
formato, localização, etc.).
No caso de arquivo de entrada de registros múltiplos as variáveis se ordenam por tipo de
registro em páginas separadas. Em multiple.dat existem 3 tipos de registros: (1) VIVIENDA
que se assignará à entidade vivienda, (2) HOGAR que se assignará à entidade hogar e (3)
PESSOA que se assignará à entidade pessoa.
Passo 3 – Assignação de variáveis e códigos a cada entidade
Para cada entidade devemos agregar as variáveis correspondentes a ela. A figura mostra as
variáveis dentro do tipo de registro VIVIENDA.
54
Utilizando o mouse se toma o campo da janela da direita (propriedades do arquivo de entrada)
e se arrasta até a janela da esquerda (lado direito do Esquema de Base).
Em seguida deve-se declarar a variável identificadora de cada entidade. Para aquelas
entidades que contêm entidades inferiores e que são selecionáveis (por exemplo comuna,
distrito, vivienda) é obrigatório que tenham uma variável ordenadora definida como o código
identificador. Isto se faz com o mouse sobre o nome da variável correspondente e escolhendo
a opção Código de entidade desde o menu dinâmico. Ao marcar uma variável como código
aparece um check ao lado da opção no menu dinâmico e aparece uma bandeirinha ao lado do
nome da variável.
Nem todos os níveis ou entidades devem ter variáveis identificadoras, mas SIM
é obrigatório que cada entidade selecionável tenha um código identificador. Quer dizer, se a
entidade é selecionável é obrigatório o código. Se uma entidade tem entidades inferiores que
não são selecionáveis (por exemplo domicílio e pessoas) não é obrigatório que elas tenham
um código identificador (ordenador), ainda que seja altamente recomendável que cada
entidade o tenha para assim poder verificar a consistência dos registros no momento de criar
a base de dados Redatam.
Passo 4 – Definir cada entidade como selecionável ou não selecionável
Uma vez terminada a assignação de códigos a cada entidade mostrada na janela da esquerda
do Esquema de Base, deve-se definir a propriedade de selecionável ou não selecionável a
55
cada uma. Isto se faz com o mouse posicionado sobre o nome da entidade e selecionando a
opção Entidade selecionável desde o menu dinâmico, como mostra a figura.
Ao marcar uma entidade como selecionável aparece um check ao lado da opção Entidade
selecionável. Neste exercício todas as entidades geográficas são selecionáveis e VIVIENDA,
HOGAR e PERSONA são NÃO selecionáveis.
Passo 5 – Verificar consistência do Esquema de Base
Uma vez terminada a assignação de variáveis e atributos das entidades se procede a verificar
a consistência do dicionário e da assignação recentemente efetuada. Desde o menu principal
escolha a opção Base de dados >Verificar consistência do dicionário.
Passo 6 – Gerar a base de dados
Procede-se a gerar a base de dados. Desde o menu principal escolha a opção Base de
dados >Gerar base de dados. O sistema abre um assistente que o guia no processo de
geração. Em cada página do assistente que se abre preencha a informação solicitada:
Nome da Base
Nome genérico da base de dados.
Nome do dicionário e sua localização Nome do dicionário (.dic) a ser gravado para o
dicionário da base, com sua localização completa.
Escreva (ou localize) o arquivo C:\Program Files\ redatam\ Samples\ MULTIPLE.DIC
Compatibilidade de Versões
Escreva versão 2.0 somente.
Passo 7 – Definir Arquivo Original
Identificador
Tipo do arquivo de entrada. O tipo já vem definido desde que se abre a
definição do arquivo de entrada (múltiplo).
Nome do arquivo
Define o nome (localização completa) do arquivo de entrada (.dat) a
ser usado na geração.
Escreva (ou localize) o arquivo C:\Program Files\redatam\Samples\multiple.dat
Passo 8 – Definir Esquema de Identificação de Arquivos
O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis
da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base.
56
Estes arquivos necessitam ter nomes, para que possam ser referenciados propriamente pelo
dicionário. O esquema de geração destes nomes pode ser:
a) numeração automática; ou
b) usando os nomes de entidades e variáveis.
Por compatibilização com a versão anterior se usa a numeração automática.
Passo 9 – Selecionar Entidades a Gerar
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas
deve-se estabelecer os parâmetros a seguir.
Gerar Ponteiro
Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta
marca deve estar ligada.
Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por
definição, já foi estabelecido pelo sistema quando se definiu o esquema de
nomes no passo anterior, mas há a possibilidade de editar este campo e
mudar o nome do arquivo que armazenará os ponteiros da entidade.
Verificar seqüência
Para as entidades selecionáveis, escolher se o sistema deverá testar a
ordem dos elementos em tempo de carga, para garantir a seqüência.
Tipo de registro Para as entidades não selecionáveis (VIVIENDA, HOGAR e PERSONA),
escolher o tipo de registro, definido no arquivo de entrada, como ponto de
quebra que corresponderá à entidade a ser carregada.
57
Passo 10 – Selecionar Variáveis
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas,
ao posicionar o mouse sobre seu nome, se listam as variáveis correspondentes. Deve-se
marcar as variáveis que se deseja incluir nesta geração. Pode-se usar os botões de
Selecionar Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de
uma entidade.
Passo Final – Gerar a Base
58
Usar o botão de Executar para iniciar a carga da base. Nesse momento, ANTES da geração
propriamente dita, pode-se usar o botão de Guardar Esquema para que o mesmo possa ser
reusado em caso de necessidade.
Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com
dados de início, previsão de término, percentagem de execução, etc.
Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de
Geração.
Revise este relatório para comprovar que todas as variáveis foram geradas em formato
Redatam de forma correta.
CRIAR UMA BASE A PARTIR DE UM ARQUIVO
XBase
Para trabalhar este guia e os outros similares se incluiu junto com o programa R+G4 uma
série de arquivos de dados para serem usados como modelo para criar bases em R+G4.
Estes arquivos são os seguintes:
Arquivos com os dados de entrada:
C:\Program Files\redatam\Samples\simple.dat
C:\Program Files\redatam\Samples\multiple.dat
C:\Program Files\redatam\Samples\simple.dbf
Arquivos com as definições dos dados de entrada:
C:\Program Files\redatam\Samples\simple.ddf
C:\Program Files\redatam\Samples\multiple.ddf
C:\Program Files\redatam\Samples\multiple.ddw
Este guia se concentra na utilização de um arquivo de formato único e DBF como entrada e
para isto se utilizará o arquivo de dados simple.dbf. Este arquivo leva implícita a definição dos
dados e não se requer portanto outro arquivo externo com a definição ou dicionário de dados
(ver formatos aceitos do arquivo de entrada).
Procedimento
Passo 1 – Criar um Esquema de Base
Abrir um Esquema de Base novo desde o menu principal Arquivo >Novo. Na janela que se
abre deve-se começar a definir a estrutura da nova base de dados. A estrutura é armada
agregando níveis inferiores ao nível RAIZ colocado automaticamente pelo sistema. Para
agregar níveis utilize o menu dinâmico do mouse (botão direito) e selecione a opção Agregar
Entidade Inferior. Em seguida se escreve o nome desejado na caixa agregada (máximo de 8
caracteres).
59
Para este exemplo, devem ser inseridos os níveis mostrados na figura.
Passo 2 – Carregar definição do arquivo de entrada
Uma vez completada a estrutura hierárquica deve-se chamar o arquivo que será utilizado
como arquivo de entrada. Para isto, como a definição e os dados em DBF estão no mesmo
arquivo, chama-se diretamente o arquivo com os dados (.dbf). Desde o menu principal
escolher Dados de Entrada >Abrir definição de dados de entrada. Neste exemplo, se
escolhe o formato xBase e localizar o arquivo simple.dbf .
Abre-se a janela de propriedades do arquivo de entrada. Esta janela mostra toda a informação
relevante do arquivo de entrada, assim como também lista todas as variáveis (tipo de arquivo,
formato, localização, etc.).
60
No caso de arquivo de entrada de tipo DBF as variáveis são listadas todas juntas numa
mesma página.
61
Passo 3 – Assignação de variáveis e códigos a cada entidade
Para cada entidade devemos agregar as variáveis correspondentes a ela.
Utilizando o mouse se toma o campo da janela da direita (propriedades do arquivo de entrada)
e se arrasta até a janela da esquerda (lado direito do Esquema de Base).
Em seguida deve-se declarar a variável identificadora de cada entidade. Para aquelas
entidades que contêm entidades inferiores e que são selecionáveis (por exemplo comuna,
distrito, vivienda) é obrigatório que tenham uma variável ordenadora definida como o código
identificador. Isto se faz com o mouse sobre o nome da variável correspondente e escolhendo
a opção Código de entidade desde o menu dinâmico. Ao marcar uma variável como código
aparece um check ao lado da opção no menu dinâmico e aparece uma bandeirinha ao lado do
nome da variável.
Por exemplo:
Entidade MANZENT código identificador é MANZENT
Entidade VIVIENDA código identificador é ORDVIV
Entidade PERSONA código identificador é ORDPER
Quando se trata de um arquivo DBF, as variáveis trazem a informação mínima (tipo, tamanho
e posição). Para não escrever uma faixa exagerada na base de dados é conveniente editar as
propriedades da variável e corrigir a faixa, agregar as categorias correspondentes e os valores
para Não Aplica.
62
A faixa assumida por default depende do tamanho que é informado para essa variável, por
exemplo, se uma variável extraída de um arquivo DBF, como AGUA, ocupa um campo de 4
caracteres, essa variável terá uma faixa de 0 – 9999 ainda que em realidade os valores
somente sejam de 0 – 5. Como mostra a figura deve-se editar esta informação na janela de
propriedades da variável.
Nem todos os níveis ou entidades devem ter variáveis identificadoras, mas SIM
é obrigatório que cada entidade selecionável tenha um código identificador. Quer dizer, se a
entidade é selecionável é obrigatório o código. Se uma entidade tem entidades inferiores que
não são selecionáveis (por exemplo domicílio e pessoas) não é obrigatório que elas tenham
um código identificador (ordenador), ainda que seja altamente recomendável que cada
entidade o tenha para assim poder verificar a consistência dos registros no momento de criar
a base de dados Redatam.
Passo 4 – Definir cada entidade como selecionável ou não selecionável
Uma vez terminada a assignação de códigos a cada entidade mostrada na janela da esquerda
do Esquema de Base, deve-se definir a propriedade de selecionável ou não selecionável a
cada uma. Isto se faz com o mouse posicionado sobre o nome da entidade e selecionando a
opção Entidade selecionável desde o menu dinâmico, como mostra a figura.
Ao marcar uma entidade como selecionável aparece um check ao lado da opção Entidade
selecionável. Neste exercício todas as entidades geográficas são selecionáveis e VIVIENDA,
HOGAR e PERSONA são NÃO selecionáveis.
63
Passo 5 – Verificar consistência do Esquema de Base
Uma vez terminada a assignação de variáveis e atributos das entidades se procede a verificar
a consistência do dicionário e da assignação recentemente efetuada. Desde o menu principal
escolha a opção Base de dados >Verificar consistência do dicionário.
Passo 6 – Gerar a base de dados
Procede-se a gerar a base de dados. Desde o menu principal escolha a opção Base de
dados >Gerar base de dados. O sistema abre um assistente que o guia no processo de
geração. Em cada página do assistente que se abre preencha a informação solicitada:
Nome da Base
Nome genérico da base de dados.
Nome do dicionário e sua localização Nome do dicionário (.dic) a ser gravado para o
dicionário de la base, com sua localização completa.
Escreva (ou localize) o arquivo C:\Program Files\ redatam\ Samples\ DBF.DIC
Compatibilidade de Versões
Escreva versão 2.0 somente.
Passo 7 – Definir Arquivo Original
Identificador
Tipo do arquivo de entrada. O tipo já vem definido desde que se abre a
definição do arquivo de entrada (dbf).
Nome do arquivo
Define o nome (localização completa) do arquivo de entrada (.dbf) a
ser usado na geração.
Escreva (ou localize) o arquivo C:\Program Files\ redatam\ Samples\ DBF.DIC
Passo 8 – Definir Esquema de Identificação de Arquivos
O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis
da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base.
Estes arquivos necessitam ter nomes, para que possam ser referenciados propriamente pelo
dicionário. O esquema de geração destes nomes pode ser:
a) numeração automática; ou
b) usando os nomes de entidades e variáveis.
Por compatibilização com a versão anterior se usa a numeração automática.
64
Passo 9 – Selecionar Entidades a Gerar
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas
deve-se estabelecer os parâmetros a seguir.
Gerar Ponteiro
Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta
marca deve estar ligada.
Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por
definição, já foi estabelecido pelo sistema quando se definiu o esquema de
nomes no passo anterior, mas há a possibilidade de editar este campo e
mudar o nome do arquivo que armazenará os ponteiros da entidade
Verificar seqüência
Para as entidades selecionáveis, escolher se o sistema deverá testar a
ordem dos elementos em tempo de carga, para garantir a seqüência.
65
Passo 10 – Selecionar Variáveis
O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas,
ao posicionar o mouse sobre seu nome, se listam as variáveis correspondentes. Deve-se
marcar as variáveis que se deseja incluir nesta geração. Pode-se usar os botões de Selecionar
Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de uma entidade.
Passo Final – Gerar a Base
Usar o botão de Executar para iniciar a carga da base. Nesse momento, ANTES da geração
propriamente dita, pode-se usar o botão de Guardar Esquema para que o mesmo possa ser
reusado em caso de necessidade.
Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com
dados de início, previsão de término, percentagem de execução, etc.
Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de
Geração.
Revise este relatório para comprovar que todas as variáveis foram geradas em formato
Redatam de forma correta.
Menus
MENU PRINCIPAL
O menu principal (algumas vezes o chamamos de barra principal) tem as seguintes funções:
Arquivo
Maneja todas as operações que têm relação com abrir, fechar, o
Esquema de Base.
Base de Dados
Para gerar a base.
66
Dados de Origem
Para a conexão com as propriedades do arquivo de entrada.
Janela
Ordena as janelas.
Ajuda
Entrega ajuda ao usuário para manejar o programa, inclui informação
sobre o programa, número de versão, endereço para contato, etc.
MENU DE ARQUIVO
O menu de Arquivo se compõe das seguintes funções:
Novo
Abrir um novo Esquema de Base para geração. O sistema mostra
(1)
a janela de um Esquema de Base vazio, com a entidade "raiz".
Abrir
Para abrir um Esquema de Base existente. O sistema mostra a
caixa de diálogo para localizar o arquivo .wip desejado. É possível
também selecionar diretamente o arquivo .wip desde o menu
Arquivo, desde que ele esteja entre os quatro últimos arquivos
.wip usados (seu nome aparece ao final da lista no menu
(1)
Arquivo).
Fechar
Fechar o Esquema de Base existente na tela.
Salvar
Salvar o Esquema de Base existente na tela.
Salvar como…
Salvar o Esquema de Base com outro nome. O sistema abre a
(2)
caixa de diálogo para determinar o nome e o diretório de saída.
(2)
(2)
Imprimir
Imprimir o Esquema de Base.
Configurar Impressora
Definir os parâmetros da impressora.
Preferências
Abrir a janela de preferências que regem o programa R+G4. Estas
preferências incluem o idioma, a chave secreta da base de dados,
o tipo de fonte, etc.
Notas:
(1)
Disponível somente quando NÃO exista um Esquema de Base
aberto.
(2)
Disponível somente quando SIM exista um Esquema de Base
aberto.
MENU DE BASE DE DADOS
O menu de base de dados se relaciona com a base de dados a gerar, e se compõe das
seguintes funções:
Verificar Consistência
Consistência da informação existente no Esquema de Base, com
relação aos parâmetros das entidades e variáveis.
Criar Bases de Dados
Executa o processo de geração.
Apresentação
Seleciona o modo Horizontal ou Vertical para mostrar os painéis
de entidades e variáveis do Esquema de Base. No modo
Horizontal, o painel de entidades está "sobre" o painel de
variáveis, enquanto que no modo Vertical (default) os painéis
estão lado a lado.
67
Propriedades
Janela de propriedades da entidade ou da variável (dependendo
de onde esteja o cursor, sobre o nome de uma entidade ou de
uma variável).
MENU DO ARQUIVO DE ENTRADA
O menu de Dados de Entrada se relaciona com o arquivo e as propriedades dos dados a
utilizar como entrada para a geração de bases Redatam, e se compõe das seguintes funções:
Abrir Definição
Para um Esquema de Base que todavia não esteja conectado com um
Arquivo de entrada, o sistema mostra os possíveis formatos de
definição de variáveis (ou dicionários).
Remover Definição Desconectar a definição dos dados de entrada do Esquema de Base.
Se supõe que houve uma equivocação na eleição do arquivo de
entrada. Nesse caso, todas as variáveis que já existam no Esquema de
Base serão também eliminadas, porque se perde a conexão destas
variáveis com o arquivo de entrada.
Mostrar Definição
Para ver a janela de propriedades do arquivo de entrada (ao abrir um
Esquema de Base o sistema não mostra automaticamente esta janela).
Editar Definição
Para modificar o arquivo de definição dos dados de entrada (Chillán
.ddf). Este editor é a única maneira de modificar de forma definitiva a
informação na definição do arquivo de entrada desde una sessão de
geração. Outra forma é editar o arquivo de definição desde um editor
externo.
MENU DINÂMICO (POPUP) DE ENTIDADES
Este menu aparece ao dar um clique com o mouse direito sobre o nome de uma Entidade no
Esquema de Base. Tem as seguintes funções:
Renomear
Mudar o nome da entidade.
Agregar
entidade inferior
Criar uma nova entidade dependente da entidade assinalada. Por
exemplo, embaixo da entidade "raiz", criar a entidade de Regiao.
Inserir
entidade irmã
Criar uma nova entidade paralela à entidade assinalada, quer dizer, no
mesmo nível, sem dependência da entidade assinalada. Essa função
cria um novo ramo no Esquema de Base.
Deletar entidade
Deletar a entidade assinalada do Esquema de Base.
Cortar ramo
Cortar o ramo do Esquema de Base. A entidade assinalada, e todas
suas entidades inferiores serão cortadas do Esquema (e copiadas para
a área de transferência). Esta função é usada para eliminar todo um
ramo do Esquema, ou também para mover um ramo de lugar na árvore
do Esquema (depois de Cortar o ramo, usar a função Colar ramo).
Colar ramo embaixo Colar o ramo guardado na área de transferência embaixo da entidade
assinalada.
68
Cola ramo antes de Colar o ramo guardado na área de transferência antes da entidade
assinalada.
Selecionável
Marcar (ou desmarcar) a entidade como selecionável. As entidades
selecionáveis tem uma marca ao lado esquerdo desta função no menu.
MENU DINÂMICO (POPUP) DE VARIÁVEIS
Este menu aparece com um clique do mouse direito sobre o nome de uma Variável no
Esquema de Base. Tem as seguintes funções:
Informação
Abre a janela de informações sobre a variável.
Renomear
Mudar o nome da variável.
Código entidade
Para marcar (ou desmarcar) a variável assinalada como a variável que
contém os códigos dos elementos de entidade. Por exemplo, "18", "23",
etc, são os códigos das províncias, e estarão armazenados nesta
variável. Nesse caso, a entidade deve ser selecionável, e esta variável
tem que ser de tipo STRING. Estas variáveis têm uma marca de uma
bandeira no Esquema de Base, e uma marca ao lado esquerdo desta
função no menu.
Nome entidade
Para marcar (ou desmarcar) a variável assinalada como a variável que
contém os nomes dos elementos de entidade. Por exemplo, "Valdivia",
"Alicante", etc., são os nomes das províncias, e estarão armazenados
nesta variável. Nesse caso, a entidade deve ser selecionável, e esta
variável tem que ser de tipo STRING. Estas variáveis tem uma marca
especial (alfanumérica) no Esquema de Base, e uma marca ao lado
esquerdo desta função no menu.
Deletar variável
Deletar a variável assinalada do Esquema de Base.
Verificar valor
Para executar o processo de freqüências de categorias da variável.
Verificar Máximo
Para executar o processo de valores máximos e mínimos da variável.
Propriedades
Mostrar a janela de propriedades da variável. Tem o mesmo efeito que
um duplo clique no nome da variável.
MENU DINÂMICO (POPUP) DE CAMPOS
Este menu aparece com um clique do mouse direito sobre o nome de um campo na janela de
propriedades do arquivo de entrada. Tem as seguintes funções:
Selecionar Tudo
Selecionar todos os campos. Os nomes dos campos estarão
destacados em azul (se não foi modificado o esquema de cores das
janelas de Windows). Tem o mesmo efeito que um clique no primeiro
campo e um Shift-clique no último campo. Usado quando se quer
arrastar todos os campos para uma Entidade no Esquema de Base.
Mostrar
campos referidos
Para destacar quais campos já estão referidos (já foram arrastados)
para o Esquema de Base.
Verificar valor
Para executar o processo de freqüências de categorias do campo.
Verificar máximo
Para executar o processo de valores máximos e mínimos do campo.
69
Propriedades
Mostrar a janela de propriedades dos campos de entrada. Tem o
mesmo efeito que um duplo-clique no nome do campo.
Janelas
JANELA DO ESQUEMA DE BASE
Esta janela está conectada a um arquivo .wip que guarda o Esquema de Base. Ela aparece
quando se abre um Esquema de Base, novo ou já existente. Se é um Esquema novo, a janela
estará vazia, somente com a entidade "raiz", caso contrário a janela refletirá o conteúdo do
arquivo .wip aberto.
A janela possui dois painéis, um para as entidades e outro para as variáveis da entidade.
Estes painéis são apresentados de acordo à opção escolhida no menu principal em Base de
Dados >Apresentação.
Sua forma e função são muito similares à janela do Dicionário de Dados de uma base, no
módulo de Processo do R+G4.
Painel de Entidades
Mostra a estrutura do Esquema de Base, e as relações entre as entidades. Para manipular
este painel use o menu dinâmico de entidades (ver menu dinâmico de entidades).
Painel de Variáveis
Mostra a lista de variáveis associadas à entidade assinalada no painel de entidades. Para
manipular as variáveis deste painel, use o menu dinâmico de variáveis.
JANELA DE PROPRIEDADES DO ARQUIVO DE
ENTRADA
Esta janela está conectada a um arquivo de definição dos dados de entrada (.ddf), ou a um
dicionário em formato suportado por R+G4, tais como xBase, IMPS 4.1 e CSPro (ISSA). Esta
janela se abre por primeira vez quando chamamos o arquivo de entrada com a opção Dados
de Entrada >Abrir Definição.
Depois, cada vez que se deseja usar esta janela a abrimos com a opção Dados de Entrada
>Mostrar Definição, desde o menu principal.
A janela possui dois painéis superpostos, Geral e Campos, comandados pela barra superior.
Painel "Geral"
Este painel traz informações sobre o tipo de arquivo de dados de entrada, seu nome e
localização, e o arquivo que contém a descrição de suas variáveis (i.e., dicionário ou definição
.ddf). Esta informação está organizada em três blocos dentro da janela:
Tipo de Arquivo
70
de Dados
Traz a informação do formato do arquivo de entrada (ASCII1 para
registro simples, ASCIIM para registro múltiplo, DBF para arquivo
xBase, ISSA para formato ISSA ou IMPS4 para formato IMPS). Traz
também um identificador, que será usado na definição das variáveis no
Esquema de Base, para especificar as variáveis provenientes desse
arquivo. Estas informações NÂO podem ser modificadas pelo usuário.
Dicionário
do Arquivo
Nome do arquivo que tem a definição das variáveis e campos do
arquivo de entrada.
Arquivo
de Dados
Nome e localização do arquivo de dados, e uma marca para informar se
o mesmo se encontra disponível em disco. De não estar disponível,
usar o botão de navegação à direita para localizar o arquivo.
Painel "Campos"
Este painel traz informação sobre os tipos de registros existentes no arquivo de entrada, e
seus campos. Se ASCII1 ou DBF, somente existirá um tipo de registro, e o bloco superior
desta janela é desnecessário (não aparece). Se ASCIIM, este bloco traz a informação do
campo identificador do tipo de registro, e a lista com os tipos de registros informados.
Tipos de registros
Posição
Posição, no arquivo de entrada, do campo que define o tipo de registro.
Tamanho
Tamanho do campo de tipo de registro (em geral é 1).
Valor
Valor do campo de tipo de registro para o registro informado na caixa
de tipos. Por exemplo, "1" para o registro de domicílio, e "2" para
pessoa.
Caixa de tipos
Esta lista mostra os tipos de registro existentes no arquivo de entrada.
Em geral existe sempre um "tipo" de registro adicional (o tipo
"Common"), que apesar de não ser estritamente um tipo de registro, é
usado para referir-se aos campos comuns a todos os tipos de registro
(por exemplo, identificação geográfica). Para este "tipo de registro" a
informação de Valor está em branco.
Tabela de
Campos
Esta tabela contém a lista dos campos existentes em cada tipo de
registro apontado pela caixa de tipos, com seu nome e descrição
(rótulo). Para manipular este painel use o Menu dinâmico (popup) de
campos .
JANELA DE PROPRIEDADES DA VARIÁVEL
Esta janela aparece quando se usa o menu dinâmico no nome de uma variável no Esquema
de Base. Ela tem três painéis superpostos, Geral, Especificações Técnicas, e
Documentação, comandados pela barra superior.
A janela é usada para verificar e modificar as características da variável a ser carregada na
base de dados.
Painel "Geral"
71
Tem dois tipos de informação, o rótulo da variável e suas categorias. O rótulo aparece numa
caixa de edição, e que pode ser modificado. As categorias são apresentadas numa tabela,
contendo o código e a descrição de cada categoria. Pode-se agregar elementos (categorias) a
essa tabela, assim como eliminá-los, eliminar toda a lista, além de poder modificar seu
conteúdo. O rótulo da variável e suas categorias serão aqueles que aparecerão no dicionário
final de dados. A ordem das categorias no dicionário (e nos resultados dos programas) será a
mesma em que aparecem na tabela.
Painel "Especificações Técnicas"
Para a definição das características de geração da variável.
Tipo
Pode ser INTEGER (mais comum), REAL (para as variáveis com ponto
decimal ou com valor negativo), ou STRING (para as alfanuméricas ou
as variáveis de códigos da entidade).
Tamanho
Somente para o tipo STRING, informa o tamanho em bytes da variável.
Faixas
Informa o limite mínimo e máximo dos valores possíveis para a variável.
Valores fora desse intervalo que apareçam no arquivo de entrada,
serão transformados, em tempo de carga, para o valor informado em
Valor Omitido (Missing). Variáveis de tipo STRING não têm faixas.
Decimais
Somente para o tipo REAL, apresenta o número de decimais da
variável.
Não se Aplica
Valor que o sistema assignará aos casos em que o valor original se
apresente como branco. O default é o limite máximo mais 1. Como não
existe verificação de faixas para as variáveis de tipo STRING, estas não
necessitam a informação de Não se Aplica.
Valor Omitido
Valor que o sistema assignará aos casos em que o valor original se
apresente fora da faixa aceitável. O valor default é o limite máximo mais
2. Como não existe verificação de faixas para as variáveis de tipo
STRING, estas não necessitam a informação de Valor Omitido.
Arquivo Original
A seção seguinte traz informações copiadas diretamente do campo
fonte da variável, encontrado no Arquivo Original. Estas informações
NÃO podem ser modificadas, com exceção da Posição Relativa e
Tamanho da variável. Existe também um botão de Propriedades, para
mostrar a janela de propriedades do campo de entrada.
Posição
relativa
Deslocamento da variável com relação AO INICIO do campo. Em geral
este valor é 1, o que significa que a variável começa no inicio do campo
original. Este campo é usado quando se quer criar uma variável que
comece no meio do campo de entrada (ver Relações entre .WIP e
.DDF).
Tamanho
Tamanho da variável segundo o arquivo de entrada e de onde será
extraída a variável. Em geral é o tamanho do campo original, mas há
casos em que se deseja um tamanho menor (por exemplo, quando se
deseja um subcampo para gerar a variável).
Propriedades
Botão para mostrar a janela com informações do campo original.
Painel "Documentação"
Para informações adicionais sobre a variável.
Alias
Nome pelo qual a variável será conhecida nos resultados das listas de
área produzidas por R+G4.
72
Grupo
Identificação do grupo ao qual pertence a variável. Usado para agrupar
variáveis de um mesmo tema (por exemplo, Fecundidade).
Documentação
Texto livre para descrição de outras informações necessárias para o
futuro usuário da base, tais como unidade de medida, período de
referência, casos excepcionais, etc.
JANELA DE PROPRIEDADES DOS CAMPOS DE
ENTRADA
Esta janela aparece quando se usa o menu dinâmico sobre o nome de um campo no Arquivo
de entrada, ou se usa o botão de Propriedades na janela de variáveis. As seções mostram
informação sobre o nome do campo, seu rótulo, o registro ao qual pertence, seu
deslocamento e tamanho.
A janela é usada para verificar estas características e modificar os valores usados para o
Missing e o Não se Aplica.
Não se Aplica
Define o valor de Não se Aplica no arquivo de entrada. (Note que o
valor a ser assignado ao Não se Aplica na base de dados deve ser
definido na janela de propriedades da variável, e que este valor pode
ser diferente do valor dado para o campo de entrada.)
Exemplo: Se o valor de Não se Aplica = * no arquivo de entrada, um * aparecerá naquele
campo. Se você quiser usar o número 9 para representar o valor Não
se Aplica para este campo na base de dados que você está criando,
você deve colocar um 9 no campo apropriado na janela de
propriedades da variável.
Valor Omitido
Define o valor que simboliza a falta de informação (Missing) no arquivo
de entrada. (Note que o valor a ser assignado ao Missing na base de
dados deve ser definido na janela de propriedades da variável e que
este valor pode ser diferente do valor dado para o campo de entrada.
Branco é
Não se Aplica
(Branco é Omitido). Estes botões definem o tratamento que se dará aos
brancos existentes no arquivo de entrada. Branco é Não se Aplica
significa que aos campos em branco será assignado o valor informado
na caixa de Não se Aplica. Caso contrário o branco será tratado como
um valor fora de faixa (default). No arquivo DDF de definição, pode-se
usar a cláusula BLANK = MISSING ou BLANK = NotApplicable.
As modificações nestes campos só têm validade dentro da sessão. Para que estas tenham
uma modificação definitiva, é necessário faze-las com o Editor de definições do arquivo de
entrada ou modificá-las diretamente na janela de propriedades de variáveis.
Campos de dois ou mais bytes: Se os valores de Não se Aplica e/ou Missing são
alfanuméricos, eles devem ser representados com o mesmo tamanho do campo. Por
exemplo, se o campo é de dois bytes e o valor para Não se Aplica é um asterisco, este
parâmetro deve ser indicado como Not Applicable= *, ao invés de =*.
73
Facilidades Adicionais
FREQÜÊNCIAS DE CAMPOS
Para poder determinar as categorias de uma variável (e sua faixa), as vezes é conveniente
verificar seus valores no arquivo de entrada. O módulo de Geração proporciona esta
facilidade através de seu menu dinâmico, com o cursor posicionado sobre o nome de uma
variável no Esquema de Base, ou sobre um campo na janela de propriedades do arquivo de
entrada.
Eleger a opção Verificar Valores e o sistema passa a ler o arquivo original de entrada,
mostrando a janela de acompanhamento do processo. A qualquer momento pode-se
pressionar o botão de Abortar para terminar o processo, e o sistema ainda assim mostra o
resultado dos casos lidos até aquele momento.
Esta opção mostra os códigos existentes para a variável, com seus respectivos número de
casos, e o número total de casos no arquivo (ou até a interrupção da leitura).
Para as variáveis quantitativas, por exemplo variáveis de rendimento, superfície, fatores de
expansão, etc., para as quais não tem sentido uma distribuição de freqüências, mas sim uma
verificação de seus valores mínimo e máximo, usar a opção de Verificar máximo....
VALORES MÍNIMOS E MÁXIMOS
Para poder determinar as faixas de uma variável, as vezes é conveniente conhecer seus
limites mínimo e máximo. O módulo de Geração proporciona esta facilidade através de seu
menu dinâmico, com o cursor posicionado sobre o nome de uma variável no Esquema de
Base, ou sobre um campo na janela de propriedades do Arquivo de Entrada.
Eleger a opção Verificar Máximo e o sistema passa a ler o arquivo original de entrada,
mostrando a janela de acompanhamento do processo. A qualquer momento pode-se
pressionar o botão de Abortar para terminar o processo, e o sistema ainda assim mostra o
resultado dos casos lidos até aquele momento.
Esta opção mostra os valores mínimo e máximo para a variável, com seus respectivos
número de casos, o número de casos em branco, e o número total de casos no arquivo (ou
até a interrupção da leitura).
Para observar os valores das categorias da variável, usar a opção de Verificar valores (ver
Freqüências de campos).
VERIFICAR A CONSISTÊNCIA DO ESQUEMA DE
BASE
No menu principal eleger Base de Dados >Verificar Consistência. Este processo,
executado automaticamente sempre antes do processo de Geração e antes de salvar o
Esquema de Base, faz uma verificação de toda a informação existente no Esquema de Base,
e mostra uma caixa de mensagens com os erros, caso existam.
Estes podem ser de natureza lógica, como por exemplo, entidades selecionáveis sem as
respectivas variáveis de código, ou de outro tipo, como a falta de limites definidos para uma
variável numérica.
74
Além dos erros, o sistema também mostra a lista de advertências, que não impedem a
continuação do processo de carga ou de guardar o Esquema. A diferença entre uma
advertência e um erro é determinada pelo símbolo que aparece ao lado esquerdo da lista de
mensagens: o símbolo de exclamação denota uma advertência, enquanto que o símbolo de
Parar (STOP) denota um erro.
SALVAR E CARREGAR ESQUEMA DE GERAÇÃO
É raro que um processo de Geração de Base se execute só uma vez: os erros podem suceder
com muita freqüência, tais como os detalhes de posicionamento (ou tamanho) dos campos,
uma má definição de faixas, ou mesmo uma execução de prova com um arquivo menor.
Com o objetivo de otimizar as tarefas manuais de geração, eliminando a necessidade de
reingressar os parâmetros de carga da base, podemos usar os botões de Salvar Esquema e
depois Carregar Esquema para as re-execuções do processo.
Ao final da primeira vez que se executa o processo, ANTES da execução propriamente dita,
aperta-se o botão de Salvar Esquema, o qual abre a janela de diálogo para escolher o
arquivo (extensão .LSD de Load Scheme Definition) que irá armazenar todos os parâmetros
definidos nos passos de carga.
Como detalhe adicional, este arquivo tem um formato tipo Chillán.
Ao re-executar o processo de carga, ANTES de começar a eleger os parâmetros, usar o
botão de Carregar Esquema, que abre a janela de diálogo para que se escolha o nome do
arquivo de esquema previamente salvado.
Ainda que se use um Esquema de Geração, durante o processo de geração é necessário
seguir com o botão de Avançar até o último painel (passo), quando aparece o botão de
Executar.
EDITAR A DEFINIÇÃO DE UM ARQUIVO DE
ENTRADA
Esta função é acionada pelo menu principal em Dados de Entrada >Editar arquivo de
dicionário de dados. O editor é a única maneira de modificar de forma definitiva a
informação no dicionário (.ddw) ou definição (.ddf) do arquivo de entrada. Todas as
modificações que se façam através da janela de propriedades do arquivo de entrada serão
válidas somente durante a sessão de trabalho e não serão guardadas na definição original.
O sistema mostra a caixa de diálogos para localizar o arquivo com o dicionário (.ddw) ou
definição (.ddf), e em seguida abre uma janela com um editor livre que tem as ferramentas
normais de edição de texto.
Para guardar as modificações use o menu principal em Arquivo, com Salvar para salvar com
o mesmo nome, ou Salvar Como… para salvar com outro nome.
75
MODIFICANDO AS PROPRIEDADES DE
VARIÁVEIS E CAMPOS DE ENTRADA
Para modificar as características das variáveis do Esquema de Base, ou dos campos do
arquivo de entrada, usar as respectivas janelas de propriedades (Propriedades da Variável e
Propriedades do Arquivo Original).
Por exemplo, quando o módulo de Consistência do Esquema de Base aponta a falta de limites
para a variável SEXO, deve-se editar essa variável e informar-lhe os limites. Todos os
câmbios que se façam no Esquema de Base são guardados no arquivo .wip (com a opção de
Salvar no menu principal).
A janela de propriedades do arquivo de entrada também permite modificar algumas
características, tais como os valores para Missing e Não se Aplica, e o tratamento que se dará
aos campos em "Branco" no arquivo de entrada. Porém, estas modificações executadas na
janela de propriedades do arquivo de entrada são temporárias, só serão válidas durante a
sessão, porque o sistema não permite que se modifique a definição do arquivo de entrada, a
não ser que se utilize o editor de definição do arquivo de entrada.
Depois de arrastar o campo para o Esquema de Base, as informações sobre o campo são
traspassadas para a variável.
Ainda que se façam modificações nas características desse campo na
definição do arquivo de entrada (com exceção de sua posição de início no registro),
estas não serão repassadas para a variável, quer dizer, se por algum motivo for
necessário mudar as características de um campo, se esse campo já foi passado para o
Esquema de Base, deve-se deletar a variável e arrastá-la de novo.
Preferências
PREFERÊNCIAS GERAIS
Nas preferências gerais existem modificações de apresentação e de localização de arquivos.
· Pode-se optar por mostrar (ou não) a janela de referência a R+G4 cada vez que começa o
programa. Um ü nesta opção não mostra a referência.
· Pode-se optar por abrir automaticamente (ou não) a última base de dados usada quando
comece o programa. Um ü nesta opção abre a última base trabalhada.
· Pode-se modificar o diretório de trabalho por default. Clique sobre o ícone ao lado da caixa
para localizar o diretório desejado.
Ver também Diretório do Projeto
76
PREFERÊNCIAS DE IDIOMA
R+G4 possui interfaces de usuário em espanhol, português e inglês, e pode-se passar de
uma a outra em qualquer momento. Além disso, foi desenhado para facilitar de maneira
simples e sistemática a tradução a qualquer outro idioma.
Passos para mudar de idioma:
· No menu principal, clique Arquivo >Preferências.
· Selecione o painel Idioma.
· Selecione o idioma desejado com um clique sobre a bandeira do idioma.
· Guarde as modificações realizadas.
Nota: Se a caixa do arquivo multiidioma está vazia, isto significa que o arquivo que contém a
base de dados multilingüe (arquivo R+G4Process.wxd) não está definido. Localize-o no
diretório onde se instalou R+G4, com um clique no ícone de busca
.
PREFERÊNCIAS DE FONTE
Nas preferências de fonte se modifica o tipo e tamanho da fonte a utilizar nas distintas
instâncias de saída e edição dentro do programa. Isto é, a fonte para mostrar um texto em:
· Janela
· Edição
· Separação fixa, quer dizer, todas as letras ocupam o mesmo espaço
· Impressão
e selecionando a fonte e o
A fonte é modificada com um clique sobre o botão de busca
tamanho desejados dentro das opções apresentadas na janela de diálogo.
de processos rápidos e nos assistentes de programação.
Eliminação de Filtros da lista
Primeiro selecione o filtro na lista, pressionando a flecha vertical direita, até que o rótulo do
filtro apareça, e use o mouse esquerdo para selecioná-lo. Depois pressione o botão de
"Eliminar".
Para que as modificações sejam efetuadas é necessário pressionar o botão de "Salvar" na
barra de ferramentas.
77
Index
.
.bin ................................................................................................................................................. 18
.dat ........................................................................................................................................... 20, 23
.dbf ........................................................................................................................................... 20, 23
.ddf ......................................................................................................................... 20, 22, 32, 68, 70
.ddw ......................................................................................................................................... 31, 68
.dic ................................................................................................................................................. 20
.ptr.......................................................................................................................... 13, 15, 17, 20, 37
.rbf...................................................................................................................................... 19, 20, 37
.wip ........................................................................................................................ 20, 22, 33, 34, 70
A
Abrir definição................................................................................................................................ 43
AccessPlan ...................................................................................................................................... 6
ACDI ................................................................................................................................................ 5
Agencia Canadense ........................................................................................................................ 6
Agradecimentos............................................................................................................................... 5
Ajuda................................................................................................................................................ 4
Alfanuméricas ................................................................................................................................ 72
Alias ............................................................................................................................................... 71
Área geográfica ............................................................................................................................... 4
AREABREAK................................................................................................................................ 42
Áreas ............................................................................................................................................... 7
Arquivo........................................................................................................................................... 41
Calcular o tamanho lógico ......................................................................................................... 40
Arquivo ASCII com Registros Múltiplos......................................................................................... 27
Arquivo ASCII de Registro Simples............................................................................................... 29
ARQUIVO DE DEFINIÇÃO DOS DADOS DE ENTRADA ............................................................ 20
Arquivo de entrada .......................................... 24, 25, 26, 31, 33, 37, 38, 68, 70, 71, 73, 74, 75, 76
Análise e consistência ............................................................................................................... 26
Chillán .................................................................................................................................. 33, 68
Editar definição .......................................................................................................................... 68
Editar o layout ............................................................................................................................ 75
Formato múltiplo .................................................................................................................. 24, 25
Formato único ............................................................................................................................ 24
Freqüências de campos............................................................................................................. 74
Importar um dicionário IMPS 4.1 ............................................................................................ 31
IMPS .......................................................................................................................................... 68
ISSA ........................................................................................................................................... 68
Janela de propriedades dos campos de entrada....................................................................... 73
Janela do arquivo de entrada .................................................................................................... 70
Layout de formato dos registros ................................................................................................ 33
Menu de datos de origem .......................................................................................................... 68
Missing ....................................................................................................................................... 73
Modificar os campos .................................................................................................................. 76
Valores mínimo e máximo ......................................................................................................... 74
xBase ......................................................................................................................................... 68
ARQUIVO DE ENTRADA.............................................................................................................. 27
ARQUIVO ESTRUTURAL DA BASE ............................................................................................ 20
Arquivos......................................................................................................................................... 76
78
Arquivos transpostos ..................................................................................................................... 20
Arrastar variáveis........................................................................................................................... 34
Árvore .............................................................................................................................................. 8
ASCII ....................................................................................................................................... 23, 29
B
BACK UP DA BASE ...................................................................................................................... 42
Banco Interamericano ..................................................................................................................... 6
Bandeira do idioma........................................................................................................................ 77
Base hierárquica.............................................................................................................................. 4
Bases de dados ............................................................................................... 13, 14, 15, 20, 33, 37
Arquivo estrutural da base
.wip ......................................................................................................................................... 20
Bases com mais de um ramo hierárquico ................................................................................. 14
Criar ........................................................................................................................................... 37
Criar uma base........................................................................................................................... 37
Entidades selecionáveis e não-selecionáveis ........................................................................... 37
Esquema de geração ................................................................................................................. 37
Parâmetros da base ................................................................................................................. 37
Ponteiros .................................................................................................................................... 13
Relatório do processo de geração ............................................................................................. 37
BID ................................................................................................................................................... 5
Borland C......................................................................................................................................... 5
Branco e Não se aplica ................................................................................................................. 73
BREVE RESUMO DE Redatam+G4 ............................................................................................... 4
Builder 5.0........................................................................................................................................ 5
Bureau de Censos dos Estados Unidos........................................................................................ 31
C
Cambio de Idioma.......................................................................................................................... 77
Campos ................................................................................................................................... 69, 70
CAMPOS DE ENTRADA ............................................................................................................... 76
Características da variável ............................................................................................................ 71
Características das variáveis......................................................................................................... 36
Características principais da quarta geração da família ................................................................. 4
CARREGAR ESQUEMA DE GERAÇÃO ...................................................................................... 75
CARREGAR UMA DEFINIÇÃO DE UM ARQUIVO DE ENTRADA.............................................. 43
Casos dessa entidade ..................................................................................................................... 9
Categorias ..................................................................................................................................... 72
CELADE ...................................................................................................................................... 5, 6
CEPAL ......................................................................................................................................... 5, 6
Chave secreta da base de dados.................................................................................................. 67
Chillán.......................................................................................................................... 27, 31, 32, 68
CIID.................................................................................................................................................. 6
Código ....................................................................................................................................... 8, 15
Código identificador ....................................................................................................................... 10
Códigos...................................................................................................................................... 7, 10
Códigos da entidade...................................................................................................................... 36
COMO UTILIZAR............................................................................................................................. 4
Compatibilidade com winR+ v1.2 .................................................................................................. 37
Compressão de dados em base de dados R+G4 ......................................................................... 18
CONCEITOS DA BASE DE DADOS............................................................................................... 6
Consistência do dicionário............................................................................................................. 40
CONSISTÊNCIA DO ESQUEMA DE BASE ................................................................................. 74
Consistência do esquema de geração .......................................................................................... 74
79
CONTEÚDO FÍSICO DOS ARQUIVOS DE PONTEIROS............................................................ 17
CONTEÚDO LÓGICO DOS ARQUIVOS DE PONTEIROS.......................................................... 17
Criação
Código geográfico ...................................................................................................................... 19
Criação da base ......................................................................................................................... 19
Localização geográfica .............................................................................................................. 19
Criar ........................................................................................................... 43, 44, 46, 52, 55, 59, 63
Criar uma base a partir de um arquivo de registros múltiplos ................................................... 52
Criar uma base a partir de um arquivo de registros simples ..................................................... 43
Criar uma base a partir de um arquivo xBase ........................................................................... 59
CRIAR UMA BASE .................................................................................................................. 43, 52
Criar uma base de dados .......................... 20, 22, 26, 32, 34, 36, 37, 39, 40, 41, 42, 43, 67, 74, 75
.ddf ............................................................................................................................................. 20
Análise do arquivo de entrada ................................................................................................... 26
Definição do arquivo de entrada ................................................................................................ 32
Definir variáveis e códigos de entidade ..................................................................................... 36
Definir variáveis para cada entidade ......................................................................................... 34
Descrição resumida da geração ................................................................................................ 32
Desfragmentação da base......................................................................................................... 42
Entidades - resultados não esperados ..................................................................................... 39
Erros vs. advertências ............................................................................................................... 74
Etapas a seguir......................................................................................................................... 32
Executar geração ....................................................................................................................... 37
Garantir o conteúdo da base de dados ..................................................................................... 41
Gerar os nomes dos elementos................................................................................................. 39
Guia Simples de Criação de Bases de Dados........................................................................... 43
Layout do arquivo de entrada .................................................................................................... 20
Menu de base de dados ............................................................................................................ 67
Relações entre .wip e .ddf ......................................................................................................... 22
Relatório de erros....................................................................................................................... 40
Relatório do processo de geração ....................................................................................... 37, 39
Respaldo da base ...................................................................................................................... 42
Revisar consistência do dicionário............................................................................................. 40
Salvar e carregar esquema de geração .................................................................................... 75
Variáveis - resultados não esperados ....................................................................................... 39
Verificar a estrutura hierárquica................................................................................................. 41
Verificar consistência do esquema de geração ......................................................................... 74
Verificar freqüências de variáveis .............................................................................................. 41
CSPro ............................................................................................................................................ 27
D
Dados ............................................................................................................................................ 19
.bin ............................................................................................................................................. 19
Compressão de dados em base de dados R+G4 ..................................................................... 18
Registros .................................................................................................................................... 19
ddw ................................................................................................................................................ 31
Decimais ........................................................................................................................................ 72
Default ........................................................................................................................................... 76
DEFINIÇÃO CHILLÁN ............................................................................................................. 27, 29
Definição da estrutura hierárquica................................................................................................. 33
DEFINIÇÃO DE UM ARQUIVO DE ENTRADA ............................................................................ 75
Definição do Arquivo de Entrada................................................................................................... 32
DEFINIR OS CAMPOS DE ENTRADA ......................................................................................... 33
Definir Variáveis............................................................................................................................. 36
DEFINIR VARIÁVEIS PARA CADA ENTIDADE ........................................................................... 34
DESCRIÇÃO RESUMIDA DA GERAÇÃO .................................................................................... 32
80
desfragmentador dos arquivos ...................................................................................................... 42
Dicionário..................................................................................................................... 26, 33, 40, 41
Importar um dicionário ............................................................................................................... 15
Revisar consistência do dicionário............................................................................................. 40
dicionário IMPS 4.1 ....................................................................................................................... 31
Dicionário:.......................................................................................................................... 10, 11, 15
DICIONÁRIOS ACEITOS .............................................................................................................. 27
Diretório ......................................................................................................................................... 76
Diretório desejado.......................................................................................................................... 76
Documentação............................................................................................................................... 71
E
Elementos................................................................................................................................ 39, 40
Gerar os nomes dos elementos................................................................................................. 39
Elementos de entidades ...................................................................................................... 6, 13, 18
ELEMENTOS DE UMA ENTIDADE ................................................................................................ 9
ELEMENTOS SELECIONÁVEIS................................................................................................... 10
English ........................................................................................................................................... 77
Entidade............................................................................................................... 8, 9, 10, 11, 12, 15
ENTIDADE NÃO SELECIONÁVEL ............................................................................................... 10
ENTIDADE SELECIONÁVEL ........................................................................................................ 10
ENTIDADES ........................................................................................ 13, 14, 16, 36, 37, 39, 68, 69
Agregar entidade inferior ........................................................................................................... 68
Colar ramo antes de .................................................................................................................. 68
Colar ramo embaixo................................................................................................................... 68
Cortar ramo ................................................................................................................................ 68
Deletar........................................................................................................................................ 68
Elementos ............................................................................................................................ 13, 14
Entidades selecionáveis ............................................................................................................ 36
Inserir entidade .......................................................................................................................... 68
Número interno .......................................................................................................................... 13
Raiz ...................................................................................................................................... 13, 15
Relações entre entidades .......................................................................................................... 15
Renomear .................................................................................................................................. 68
Resultados não esperados ........................................................................................................ 39
Selecionável ou não-selecionável.............................................................................................. 68
Entidades da hierarquia................................................................................................................. 33
ENTIDADES INFERIORES ............................................................................................................. 9
Entidades selecionáveis e não-selecionáveis ............................................................................... 37
ENTIDADES SUPERIORES ........................................................................................................... 9
ENTIDADES: ................................................................................................................................... 7
Español.......................................................................................................................................... 77
Especificações Técnicas ............................................................................................................... 71
Esquema de base...................................................................................... 32, 34, 35, 36, 67, 70, 76
Imprimir ...................................................................................................................................... 67
Modificar as características das variáveis ................................................................................. 76
Esquema de Base ......................................................................................................................... 69
Esquema de Geração........................................................................................................ 37, 38, 75
Estrutura .......................................................................................................................................... 8
Estrutura da base ............................................................................................................................ 6
ESTRUTURA DA BASE DE DADOS ............................................................................................ 12
ESTRUTURA DOS ARQUIVOS.................................................................................................... 20
ESTRUTURA HIERÁRQUICA DA BASE ...................................................................................... 33
ETAPAS INICIAIS.......................................................................................................................... 23
81
F
F1..................................................................................................................................................... 4
Filtros............................................................................................................................................ 77
FNUAP............................................................................................................................................. 6
Fonte.............................................................................................................................................. 77
Forma hierárquica............................................................................................................................ 7
Formato Chillán ................................................................................................................. 27, 29, 31
Definição para registro múltiplo ................................................................................................. 27
Definição para registro simples.................................................................................................. 29
Descrição de seções ............................................................................................................... 27
Importar um dicionário IMPS 4.1 ............................................................................................... 31
FORMATO DO ARQUIVO DE ENTRADA ................................................................................... 23
Formato do arquivo de entrada ............................................................................................... 23, 24
FORMATO MÚLTIPLO.................................................................................................................. 24
Formato Redatam............................................................................................................................ 4
FORMATO ÚNICO ........................................................................................................................ 23
Formatos aceitos para o arquivo de entrada................................................................................. 27
FREQÜÊNCIAS DE CAMPOS ...................................................................................................... 74
Freqüências de variáveis............................................................................................................... 41
G
Geração ......................................................................................................................................... 32
GERAR NOMES DE ELEMENTOS .............................................................................................. 39
Gerar uma base............................................................................................................................. 37
Grupo............................................................................................................................................. 71
Guia Simples de Criação de Bases de Dados .............................................................................. 43
I
Identificação............................................................................................................................... 8, 10
Identificação de Arquivos........................................................................................................... 38
identificador ................................................................................................................................... 71
Identificar ....................................................................................................................................... 10
Idioma ............................................................................................................................................ 77
Importar um dicionário ................................................................................................................... 15
Importar un dicionário IMPS 4.1 .................................................................................................... 31
Impressão ...................................................................................................................................... 77
IMPS .................................................................................................................................. 27, 68, 70
IMPS4.1 ......................................................................................................................................... 31
Índices ........................................................................................................................................... 20
ÍNDICES ........................................................................................................................................ 13
inferiores .......................................................................................................................................... 9
INTEGER....................................................................................................................................... 71
ISSA................................................................................................................................... 27, 68, 71
J
JANELA DE PROPRIEDADES DO ARQUIVO DE ENTRADA..................................................... 70
JANELA DE PROPRIEDADES DOS CAMPOS DE ENTRADA ................................................... 73
JANELA DO ESQUEMA DE BASE ............................................................................................... 70
L
Layout do arquivo de entrada........................................................................................................ 20
Load Scheme Definition ................................................................................................................ 75
LOTUS........................................................................................................................................... 23
LSD ................................................................................................................................................ 75
82
M
MAIS DE UM RAMO ..................................................................................................................... 14
Manutenção da estrutura............................................................................................................... 33
Membros individuais ........................................................................................................................ 9
MENU DE ARQUIVO .................................................................................................................... 67
MENU DE BASE DE DADOS........................................................................................................ 67
Menu de datos de origem.............................................................................................................. 68
Menu dinâmico --popup-- de campos............................................................................................ 69
Menu dinâmico --popup-- de entidades......................................................................................... 68
Menu dinâmico --popup-- de variáveis .......................................................................................... 69
MENU DO ARQUIVO DE ENTRADA............................................................................................ 68
MENU PRINCIPAL ........................................................................................................................ 66
Metadados ..................................................................................................................................... 15
Minúsculas..................................................................................................................................... 11
Missing............................................................................................................................... 12, 71, 73
MODIFICANDO AS PROPRIEDADES DE VARIÁVEIS ............................................................... 76
Multiidioma..................................................................................................................................... 77
múltiplo .......................................................................................................................................... 52
N
Nações Unidas ................................................................................................................................ 1
Não se aplica ........................................................................................................................... 11, 12
NÃO SELECIONÁVEIS ................................................................................................................. 10
Não selecionável ....................................................................................................................... 8, 10
Nível................................................................................................................................................. 8
Nível da hierarquia ........................................................................................................................ 15
Nível geográfico............................................................................................................................... 7
Nível hierárquico.............................................................................................................................. 7
Nível zero......................................................................................................................................... 8
Nome da variável........................................................................................................................... 11
Nome do elemento ........................................................................................................................ 40
NSA ............................................................................................................................................... 12
Numeração automática ................................................................................................................. 38
Número Interno.............................................................................................................................. 13
O
Omitido .......................................................................................................................................... 73
Opções gerais................................................................................................................................ 76
Opções para o tipo de fonte .......................................................................................................... 77
Organização hierárquica ........................................................................................................... 7, 12
P
Parâmetros da Base ...................................................................................................................... 37
PARTIR DE UM ARQUIVO DE REGISTROS SIMPLES .............................................................. 43
ponteiros ........................................................................................................................................ 13
Ponteiros.................................................................................................................................. 17, 20
Conceito lógico dos arquivos de ponteiros ................................................................................ 17
Conteúdo físico dos arquivos..................................................................................................... 17
Tamanho lógico de 4 bytes........................................................................................................ 17
Português ...................................................................................................................................... 77
PREFERÊNCIAS DE FONTE ....................................................................................................... 77
PREFERÊNCIAS DE IDIOMA....................................................................................................... 77
PREFERÊNCIAS GERAIS ............................................................................................................ 76
PREPARAÇÃO DO ARQUIVO DE ENTRADA ............................................................................. 33
83
PROPRIEDADES DA VARIÁVEL ................................................................................................. 71
Ptr .................................................................................................................................................. 20
Q
Qualitativa...................................................................................................................................... 11
Quantitativa.................................................................................................................................... 11
R
Raiz.................................................................................................................................. 7, 8, 13, 15
Ramo ....................................................................................................................................... 68, 69
Colar ramo antes de .................................................................................................................. 68
Colar ramo embaixo................................................................................................................... 68
Cortar ramo ................................................................................................................................ 68
Ramo hierárquico .......................................................................................................................... 14
Ramos ......................................................................................................................................... 7, 8
Ramos da árvore ............................................................................................................................. 8
Rbf ................................................................................................................................................. 20
Referência ..................................................................................................................................... 76
REGISTRO SIMPLES ................................................................................................................... 29
Registros........................................................................................................................................ 18
Registros Múltiplos ..................................................................................................................... 27
RELAÇÕES ENTRE ENTIDADES ................................................................................................ 15
RELAÇÕES ENTRE WIP E DDF .................................................................................................. 22
Relatório do processo de geração........................................................................................... 37, 39
Respaldo da Base ......................................................................................................................... 42
Resultados não esperados......................................................................................................... 39
Resumo de Redatam+G4................................................................................................................ 4
RESUMO DO GUIA DE CRIAÇÃO DE BASES ............................................................................ 43
REVISAR CONSISTÊNCIA DO DICIONÁRIO .............................................................................. 40
REVISAR RELATÓRIO DO PROCESSO DE GERAÇÃO ............................................................ 39
S
SAS................................................................................................................................................ 23
Segurança dos dados.................................................................................................................... 10
selecionável ................................................................................................................................... 10
simples........................................................................................................................................... 43
SPSS ............................................................................................................................................. 23
STRING ................................................................................................................................... 37, 71
T
Tamanho da fonte.......................................................................................................................... 77
tamanho físico ............................................................................................................................... 40
tamanho lógico ............................................................................................................................ 41
Tecla F1........................................................................................................................................... 4
Tipo de registro.............................................................................................................................. 38
Tradução........................................................................................................................................ 77
Transposto..................................................................................................................................... 20
U
Última base trabalhada.................................................................................................................. 76
USO ALTERNATIVO DO IMPS 4.1............................................................................................... 31
V
Valor Omitido ................................................................................................................................. 73
84
VALORES FORA DE FAIXA E NÃO SE APLICA ......................................................................... 11
Valores mínimo e máximo ............................................................................................................. 74
Valores Mínimos e Máximos ......................................................................................................... 74
Variáveis .............................................................................................. 11, 13, 34, 35, 39, 41, 42, 69
Alias ........................................................................................................................................... 71
Arquivo de entrada..................................................................................................................... 72
Código entidade ......................................................................................................................... 69
Decimais .................................................................................................................................... 71
Deletar variable .......................................................................................................................... 69
Documentação ........................................................................................................................... 71
Faixas......................................................................................................................................... 72
Grupo ......................................................................................................................................... 73
Janela de propriedades da variable........................................................................................... 71
Não se aplica ............................................................................................................................. 72
Nome de variável ....................................................................................................................... 11
Nome entidade........................................................................................................................... 69
Número interno .......................................................................................................................... 13
Posição relativa.......................................................................................................................... 71
Propriedades........................................................................................................................ 69, 72
Renomear .................................................................................................................................. 69
Resultados não esperados ........................................................................................................ 39
Revisar freqüências ................................................................................................................... 41
Tamanho .................................................................................................................................... 72
Tipo ............................................................................................................................................ 72
Valor omitido .............................................................................................................................. 72
Valores Fora de faixa e Não se Aplica ...................................................................................... 11
Valores Missing ou Omitidos ..................................................................................................... 11
Verificar valores de freqüências de categorias.......................................................................... 69
Verificar valores máximos e mínimos ........................................................................................ 69
Variáveis: ................................................................................................................................. 11, 71
Verificar Consistência .................................................................................................................... 74
Versão R+G4 ................................................................................................................................... 4
Vetor .............................................................................................................................................. 20
W
Waterloo .......................................................................................................................................... 6
wip ................................................................................................................................................. 33
Www.eclac.cl/celade/redatam ......................................................................................................... 5
X
xBase..................................................................................................................... 27, 60, 68, 70, 71
Z
zip .................................................................................................................................................. 42
85
Download

criação de bases de dados