Redatam+G4 ta REcuperação de DAdos para Areas pequenas por Microcomputador, 4 Geração Manual do Módulo de Criação de Bases de Dados NOTA: Este manual foi gerado a partir do arquivo de Ajuda em linha que acompanha o software Redatam+G4; o documento resultante desta conversão, em formato Microsoft Word, foi novamente convertido para um documento em formato Adobe pdf, o qual pode ser visualizado com o Adobe Acrobat© v3.0 ou mais recente. O sistema de Ajuda foi escrito usando-se o software RoboHelp© produzido por eHelp Corporation. REDATAM+G4 é um programa computacional desenvolvido pelo Centro Latinoamericano e Caribenho de Demografia (CELADE), que é a Divisão de População da Comissão Econômica para América Latina e o Caribe, (CEPAL), Nações Unidas. www.eclac.cl\celade\redatam Man_RpG4CPrt1.doc 03/07/02 13:08; Man_RpG4CPrt1.pdf Table of Contents Introdução 4 COMO UTILIZAR A AJUDA DURANTE O TRABALHO ................................. 4 BREVE RESUMO DE Redatam+G4 ............................................................... 4 AGRADECIMENTOS ...................................................................................... 5 Conceitos de uma base de dados 6 Conceitos de uma base de dados R+G4 ........................................................ 6 CONCEITOS DA BASE DE DADOS R+ G4 - ENTIDADES e ELEMENTOS ENTIDADES.............................................................................................. 7 NÍVEL ........................................................................................................ 8 RAMO ....................................................................................................... 8 ENTIDADES SUPERIORES..................................................................... 9 ENTIDADES INFERIORES ...................................................................... 9 ELEMENTOS DE UMA ENTIDADE.......................................................... 9 ENTIDADE SELECIONÁVEL ................................................................. 10 ENTIDADE NÃO SELECIONÁVEL......................................................... 10 ELEMENTOS SELECIONÁVEIS E NÃO SELECIONÁVEIS.................. 10 VARIÁVEIS ............................................................................................. 11 VALORES FORA DE FAIXA E NÃO SE APLICA................................... 11 Algumas definições para trabalhar com R+G4 ............................................. 12 ESTRUTURA DA BASE DE DADOS...................................................... 12 NÚMERO INTERNO ............................................................................... 13 ÍNDICES.................................................................................................. 13 MAIS DE UM RAMO ............................................................................... 14 DICIONÁRIO........................................................................................... 15 RELAÇÕES ENTRE ENTIDADES.......................................................... 15 CONTEÚDO LÓGICO DOS ARQUIVOS DE PONTEIROS ................... 17 CONTEÚDO FÍSICO DOS ARQUIVOS DE PONTEIROS ..................... 17 DADOS ................................................................................................... 18 CÓDIGO GEOGRÁFICO ........................................................................ 19 ESTRUTURA DOS ARQUIVOS ............................................................. 20 Arquivos envolvidos na criação ..................................................................... 20 ARQUIVO ESTRUTURAL DA BASE (.WIP)........................................... 20 ARQUIVO DE DEFINIÇÃO DOS DADOS DE ENTRADA (.DDF) .......... 20 RELAÇÕES ENTRE .wip E .ddf ............................................................. 22 Preparação do Arquivo de Entrada 23 ETAPAS INICIAIS ......................................................................................... 23 FORMATO DO ARQUIVO DE ENTRADA ................................................... 23 FORMATO ÚNICO ........................................................................................ 23 FORMATO MÚLTIPLO.................................................................................. 24 CUIDADOS COM O ARQUIVO DE ENTRADA ............................................ 26 DICIONÁRIOS ACEITOS PARA O ARQUIVO DE ENTRADA ..................... 27 DEFINIÇÃO CHILLÁN – REGISTRO MÚLTIPLO......................................... 27 DEFINIÇÃO CHILLÁN - REGISTRO SIMPLES ............................................ 29 USO ALTERNATIVO DO IMPS 4.1 .............................................................. 31 Geração 32 DESCRIÇÃO RESUMIDA DA GERAÇÃO .................................................... 32 PREPARAÇÃO DO ARQUIVO DE ENTRADA ............................................. 33 DEFINIR OS CAMPOS DE ENTRADA ......................................................... 33 2 6 DEFINIR A ESTRUTURA HIERÁRQUICA DA BASE ................................... 33 DEFINIR VARIÁVEIS PARA CADA ENTIDADE ........................................... 34 DEFINIR VARIÁVEIS E CÓDIGOS DE ENTIDADE ..................................... 36 GERAR A BASE R+G4 ................................................................................. 37 REVISAR RELATÓRIO DO PROCESSO DE GERAÇÃO............................ 39 GERAR NOMES DE ELEMENTOS .............................................................. 39 REVISAR CONSISTÊNCIA DO DICIONÁRIO.............................................. 40 REVISAR FREQÜÊNCIAS DE VARIÁVEIS.................................................. 41 BACK UP DA BASE ...................................................................................... 42 Uma Volta pela Geração 43 RESUMO DO GUIA DE CRIAÇÃO DE BASES ............................................ 43 CARREGAR UMA DEFINIÇÃO DE UM ARQUIVO DE ENTRADA.............. 43 CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE REGISTROS SIMPLES 43 CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE REGISTROS MÚLTIPLOS 52 CRIAR UMA BASE A PARTIR DE UM ARQUIVO XBase ............................ 59 Menus 66 MENU PRINCIPAL ........................................................................................ 66 MENU DE ARQUIVO .................................................................................... 67 MENU DE BASE DE DADOS........................................................................ 67 MENU DO ARQUIVO DE ENTRADA............................................................ 68 MENU DINÂMICO (POPUP) DE ENTIDADES ............................................. 68 MENU DINÂMICO (POPUP) DE VARIÁVEIS............................................... 69 MENU DINÂMICO (POPUP) DE CAMPOS .................................................. 69 Janelas 70 JANELA DO ESQUEMA DE BASE ............................................................... 70 JANELA DE PROPRIEDADES DO ARQUIVO DE ENTRADA..................... 70 JANELA DE PROPRIEDADES DA VARIÁVEL............................................. 71 JANELA DE PROPRIEDADES DOS CAMPOS DE ENTRADA ................... 73 Facilidades Adicionais 74 FREQÜÊNCIAS DE CAMPOS ...................................................................... 74 VALORES MÍNIMOS E MÁXIMOS ............................................................... 74 VERIFICAR A CONSISTÊNCIA DO ESQUEMA DE BASE.......................... 74 SALVAR E CARREGAR ESQUEMA DE GERAÇÃO ................................... 75 EDITAR A DEFINIÇÃO DE UM ARQUIVO DE ENTRADA........................... 75 MODIFICANDO AS PROPRIEDADES DE VARIÁVEIS E CAMPOS DE ENTRADA ....................................................................................................................... 76 Preferências................................................................................................... 76 PREFERÊNCIAS GERAIS ..................................................................... 76 PREFERÊNCIAS DE IDIOMA ................................................................ 77 PREFERÊNCIAS DE FONTE................................................................. 77 Index 78 3 Introdução COMO UTILIZAR A AJUDA DURANTE O TRABALHO · Através da ajuda organizada por conteúdos ou por índice. ou a tecla F1 sobre o tema ou janela da qual se necessita · Através do ícone Ajuda ajuda. O sistema de Ajuda é sensitivo de contexto, e traz o capítulo de ajuda associado à janela ativa. · Através dos textos marcados que aparecem embaixo de alguns botões ou telas. BREVE RESUMO DE Redatam+G4 REDATAM é uma família de software elaborada pelo CELADE, que permite a qualquer profissional processar de maneira fácil e rápida dados censitários e de outras fontes, organizados numa base hierárquica, para qualquer área geográfica de interesse para o usuário (por exemplo, um conjunto de quadras de uma cidade). A continuação se descrevem as características principais da quarta geração da família, Redatam+G4 (abreviatura R+G4). Cabe mencionar que a versão R+G4 é de distribuição gratuita. Que faz R+G4? Por uma parte permite processar informação contida em bases de dados comprimidas (criadas em formato Redatam), como as provenientes de censos de população, censos agropecuários, pesquisas domiciliares, etc., que, por exemplo, contém dados sobre milhões de pessoas, domicílios e famílias, na sua totalidade. Isto faz com que habitualmente uma base de dados R+G4 contenha microdados, quer dizer, dados ou variáveis referidas a indivíduos, domicílios, famílias ou outros elementos de informação que permitem gerar diversas tabulações para qualquer área geográfica definida pelo usuário. Estes dados, organizados hierarquicamente para permitir um acesso rápido, são processados em busca de resultados específicos para determinadas áreas de interesse geográfico. Ademais, pode-se derivar novas variáveis e processar rapidamente tabulações e outros resultados estatísticos mediante janelas gráficas e sem assistência de um programador. R+G4 pode ser usado em qualquer computador funcionando com Microsoft Windows 95, 98, 2000 ou NT4. winR+ v1.2 (e ZonPlan), a geração anterior, também podem ser executadas com Windows 3.x. O programa contém facilidades para tratar a manipulação de mapas e pode vincular-se com vários deles. O vínculo permite ao usuário levar adiante diversas análises espaciais das estatísticas agregadas que podem ser produzidas pelo programa para qualquer dos níveis geográficos e área(s) de interesse. Ver também Que estatísticas podem ser produzidas com R+G4 4 AGRADECIMENTOS Redatam+G4, que é a quarta geração de Redatam, foi programado por Serge Poulard, Chefe da Unidade de Processamento de Dados do CELADE, a Divisão de População da CEPAL. Com o objetivo de permitir o uso do sistema em outras plataformas da mesma forma que para o atual Microsoft Windows, ele rescreveu e redesenhou a versão anterior, winR+ v1.2, que também é de sua autoria, em Borland C++ Builder 5.0. Alem disso, Serge desenhou e escreveu dois grandes módulos novos: R+Create para criar bases de dados Redatam junto com novas capacidades em R+Process para manipular bases de dados, e o módulo R+xPlan, com o qual profissionais capacitados podem criar aplicações específicas para que os usuários finais elaborem e mapeiem indicadores, sem conhecer a linguagem de comandos Redatam. Atualmente Serge está na Sede Subregional da CEPAL para o Caribe em Porto Espanha, com a tarefa de apoiar aos países no processamento dos censos de 2000 e promover o uso e disseminação de R+G4 para analisar os censos. Não teria sido possível finalizar a tarefa de criar R+G4 sem o valioso trabalho em equipe de um pequeno e variado grupo de profissionais que durante todo o tempo mostraram sua dedicação e capacidade de ir mais além de seus horários normais de trabalho. Este grupo inclui a Ari Silva, ex Chefe da Unidade de Processamento de Dados do CELADE, e que atualmente trabalha no Brasil; ele proporcionou insumos tanto do ponto de vista do usuário como do programador. Também traduziu os textos para o português e escreveu e reelaborou grande parte do programa Ajuda em espanhol que traduziu para o inglês e português; seu filho, Rafael Nunan, traduziu parte da versão em español da Ajuda à inglesa. Lenin Aguinaga, analista de sistemas, trabalhou diretamente com Serge Poulard na programação e uso dos módulos iniciais de R+G4, e criaram aplicações para a Unidade de Desenvolvimento Agrícola da CEPAL. Alejandra Silva, especialista em Sistemas de Informação Geográfica, deu forma a várias seções da documentação do programa Ajuda, desenvolveu aspectos relacionados com o tratamento de mapas no sistema, e trabalhou no desenho do módulo R+xPlan; também testou o funcionamento e ensinou o software em vários cursos de pré-lançamento. Sebastián Carrasco, sociólogo, desempenhou um valioso papel na tediosa tarefa de comprovar em forma intensiva os componentes do sistema, enquanto o usava para estudos específicos substantivos e ensinava na etapa de pré-lançamento. Dirk Jaspers Faijer, Chefe da Área de Treinamento e Informação em População do CELADE, impulsou o trabalho conjunto da equipe e de outras pessoas envolvidas, buscou e encontrou tanto os recursos financeiros como os profissionais "trabalcoólicos" que se dedicaram à tarefa. A Unidade de Desenvolvimento Agrícola da Divisão de Desenvolvimento Produtivo e Empresarial da CEPAL proporcionou um apoio substantivo de envergadura, tanto financiando pessoas que trabalharam em R+G4 (e novas aplicações) como usando o sistema em busca de resultados. Em forma especial, María Beatriz David, chefe da Unidade, promoveu o desenvolvimento de diversas atividades novas baseadas em Redatam, que abriram caminho para o uso do sistema com dados de campos "não tradicionais" (quer dizer, aqueles não relacionados con população), como os censos agrícolas e o comercio internacional. Vão também nossos agradecimentos aos profissionais de diversas disciplinas que contribuíram de distintas formas ao trabalho de R+G4; citados em ordem alfabética, trata-se de Waldo Aracena, Ángel Baeza, David Candia, Ángel Fucaraccio, Daniela González, Víctor González, Victoria Horment, Daniel Macadar, Hernán Orellana, Enrique Peláez, Luis Rivadeneira, Jorge Rodríguez Vignoli, Alejandro Sabag, Edwin St. Catherine e Jaime Salvador. Não podemos passar por alto a positiva retroalimentação das versões beta de R+G4 que nos entregaram diversos profissionais de projetos da CEPAL; neste grupo se inclui Juan Eduardo Faúndez, Bárbara Castelletti, Mónica Rodrigues, Laura Ortiz e Rodolfo Vilches. Enrique Pemjean editou os textos em espanhol e fez traduções do inglês quando foi necessário. Adelaida Rahmer e Alejandra Reyes se encarregaram da assistência administrativa e corrigiram a versão em espanhol do programa Ajuda. Outro apoio muito significativo foi o que nos chegou dos usuários de R+G4 dos institutos nacionais de estatística 5 do Brasil, Chile, Colombia, Nicaragua, Equador, Panamá, Santa Luzia, Venezuela e outros países. O software R+G4 está disponível no site RedatamWeb do CELADE (http://www.eclac.cl/celade/redatam) através de uma facilidade de descarga que aproveita o sistema de manejo da página Web da CEPAL para "automatizar" a entrada de conteúdo descentralizado e a compilação de dados. Javier Pi, analista de sistema para sites Web da CEPAL, programou a facilidade de descarga a petição do CELADE. Orly Winer, desenhadora gráfica e de sites web, criou os gráficos e desenhou Redatam Informa Al Día (e também o site do CELADE, desde o qual se pode descarregar o software); os conteúdos são proporcionados por Arthur Conning, que também trabalhou intensamente no sistema Ajuda de R+G4. Juan Rojo, Coordenador do portal web da CEPAL e Jorge Balzo, analista de sistemas que trabalha no sistema Web, nos entregaram, respectivamente, apoio administrativo e técnico. É para nós de singular relevância enfatizar que os esforços para produzir esta última geração de Redatam recebeu em todo momento o impulso contínuo do anterior diretor do CELADE, Reynaldo Bajraj –atualmente Secretário Adjunto da CEPAL– e do atual diretor do CELADE, Daniel Blanchard. Por último, vai também nossa gratidão e agradecimento às diversas fontes financeiras que suportaram o desenvolvimento e uso de R+G4 e dos outros componentes da família Redatam. O orçamento regular das Nações Unidas cobriu as remunerações dos membros chaves do pessoal; por outra parte, o FNUAP financiou um número de outros membros da equipe, a maioria deles consultores a tempo parcial. O Banco Interamericano de Desenvolvimento (BID) proporcionou fundos para apoiar aos países no trabalho com as versões pré-lançamento de R+G4 e está dando seu respaldo financeiro ao projeto 2001-2003 para ajudar aos países a usar e disseminar seus dados censitários do ciclo de 2000, especificamente mediante bases de dados Redatam e suas aplicações. A Agencia Canadense de Desenvolvimento Internacional (ACDI), suportou, mediante projetos durante a década de 90, o desenvolvimento de Redatam, diversos cursos e pessoal, e permitiu que o CELADE "descobrisse" e buscasse Serge Poulard para trabalhar no CELADE. Finalizemos estendendo nossa gratidão ao Centro Internacional de Investigações para o Desenvolvimento (CIID) do Canadá, que entregou a contribuição inicial que resultou na criação de Redatam; ademais, proporcionou importantes quantidades de recursos no período 1985-1997, mediante três projetos que financiaram as três primeiras gerações de Redatam; o último (e maior) destes projetos tornou possível que CELADE trabalhasse em conjunto com a Universidade de Waterloo, que originou os três membros da família Redatam baseados em SIG, AccessPlan, EduPlan e TourPlan; esse mesmo projeto doe CIID financiou o desenvolvimento de winR+ em conjunto com ZonPlan, precursor do módulo R+xPlan em R+G4. Conceitos de uma base de dados Conceitos de uma base de dados R+G4 CONCEITOS DA BASE DE DADOS R+ G4 - ENTIDADES e ELEMENTOS A estrutura da base de dados é composta de entidades ou níveis. Em cada nível se agrupam os elementos que a conformam. 6 Cada um dos níveis, como "comuna" ou "distrito", representa um nível geográfico que possui um nível hierárquico em relação ao nível prévio; por exemplo, as quadras são áreas de nível menor que as comunas. Um conjunto específico de distritos, cada um com seu próprio nome e código único na base de dados, constitui uma comuna. Cada nível leva o nome de entidade. O conjunto de áreas dentro de uma entidade dada é denominado elementos da entidade (indivíduos). O indivíduo, ou unidade estatística, é um elemento que pertence ao conjunto de referência, ou população. Nas hierarquias geográficas censitárias podem existir alguns níveis de entidades num ramo sem nomes para seus elementos (por exemplo, as quadras) mas com códigos que os conectam claramente com áreas específicas em um mapa. Os dois últimos níveis, "domicílio" e "pessoa", são também entidades. Os domicílios dentro de uma quadra são os elementos domicílio de uma "quadra" particular e, similarmente, as pessoas dentro de um domicílio são os elementos pessoa deste domicílio. Uma base de dados em Redatam, como a base de dados de demonstração NMIR2000 de Nova Miranda, que acompanha o programa (ver figura), pode ter vários ramos de dois ou mais censos, pesquisas e outros dados que podem ser incluídos numa mesma base. A base de dados, que aparece na janela do dicionário R+G4, mostra a forma em que estão estruturadas as entidades da base de dados de Nova Miranda. Note-se que aparecem ramos e sub-ramos; por exemplo, a entidade manzan se divide em dois ramos, vivien e educac, onde esta última representa a(s) escola(s) que existem na "quadra", se corresponde. ENTIDADES As variáveis descrevem entidades, que são conjuntos de objetos lógicos organizados em forma hierárquica na base de dados. Uma entidade dada pode ser o conjunto de províncias, ou o conjunto de cidades, ou domicílios ou pessoas, etc., num país. Todas as variáveis que pertencem a uma entidade possuem certos atributos em comum, como o número de 7 elementos, e o mesmo nível de hierarquia. A entidade de mais alta hierarquia de uma base é chamada entidade "raiz". A característica de selecionável ou não selecionável para uma entidade dada é definida pelo administrador no momento de criar a base de dados (com o Módulo de Criação de Bases de R+G4). Também se usa o termo de entidade identificada e não identificada, com o mesmo propósito de Selecionável e Não Selecionável, pela existência de um código de identificação para seus elementos. Ver também entidades inferiores, entidades superiores NÍVEL É o grau de profundidade de uma entidade dentro de seu ramo. Por construção, a entidade "raiz" tem nível zero, a(s) entidade(s) imediatamente inferiores tem nível 1, e assim consecutivamente. RAMO É o "caminho" desde a "raiz" a uma determinada entidade. Por definição (veja Entidades Superiores), uma entidade (e consequentemente suas variáveis) pertence a um único ramo. Se comparamos a estrutura de uma base multidisciplinar com uma árvore, os "ramos" da estrutura são exatamente o mesmo que os ramos da árvore, e as entidades correspondem às folhas da árvore. A figura mostra a base de dados de Nova Miranda com quatro ramos com distinta informação. 8 ENTIDADES SUPERIORES São todas as entidades que se encontram no "caminho" desde a entidade "raiz" até a entidade propriamente dita. As entidades distrito e comuna são superiores à entidade bloco. A entidade imediatamente superior pode ser chamada também entidade "mãe". Por definição, cada entidade tem só uma entidade "mãe". Ver também entidades inferiores ENTIDADES INFERIORES São todas as entidades que se encontram "dependentes" ou "penduradas" da entidade determinada. Referindo-se à figura, a entidade domicílio é inferior à entidade distrito. As entidades imediatamente inferiores podem ser chamadas entidades "filhas". Uma entidade pode ter um número variável de entidades "filhas" (zero ou mais). Ver também entidades superiores ELEMENTOS DE UMA ENTIDADE Os membros individuais de uma entidade são denominados elementos de uma entidade. Por exemplo, as comunas pertencentes à entidade "comuna" são os elementos ou casos dessa entidade. Pode ser que existam poucos elementos para uma entidade, por exemplo, as 9 regiões de um país para a entidade "região", ou pode ser que existam milhões de elementos numa entidade, como no caso de pessoas para a entidade "pessoa" dessa mesma base de dados. ENTIDADE SELECIONÁVEL As entidades selecionáveis tem a propriedade de distinguir (identificar) seus elementos por seus códigos e, portanto, podem participar no processo de seleção hierárquica. Quer dizer, para ser selecionável uma entidade necessita possuir uma variável que permita armazenar este código identificador. Isto significa, por exemplo, que as províncias A e B podem ser escolhidas para o processamento, mas não se pode selecionar especificamente o domicílio X se a entidade DOMICÍLIO não é definida como selecionável. Ver também entidade não selecionável ENTIDADE NÃO SELECIONÁVEL Se os elementos individuais de uma entidade não tem códigos de identificação (visível no dicionário), trata-se de uma entidade não selecionável. Esta entidade não pode ser usada numa seleção hierárquica. Da mesma maneira, não pode ser usada como entidade de saída para uma Lista de Áreas. Ver também entidade selecionável ELEMENTOS SELECIONÁVEIS E NÃO SELECIONÁVEIS Por definição, todos os elementos de uma base de dados são selecionáveis, quer dizer, podem ser analisados em detalhe. Entretanto, baseado na segurança dos dados (especificamente o segredo estatístico das bases censitárias) e nas necessidades substantivas, pode definir-se qualquer entidade e suas inferiores como não selecionável no momento de criação de uma base de dados Redatam+G4, ou ao utilizar as ferramentas de administração de bases de dados. Existe um conflito entre segurança e utilidade dos dados. Por exemplo, se a entidade Quadra é definida como não selecionável, não será possível obter resultados para cada quadra a partir da informação dos domicílios e das pessoas existentes em cada uma delas. Só se poderá obter informação agregada das quadras a um nível superior como distrito, comuna ou região. Pode-se gerar resultados para elementos individuais de entidades selecionáveis, mas não se pode produzir resultados para entidades individuais não selecionáveis, por exemplo, para um domicílio específico na base de dados de Nova Miranda. Evidentemente, é possível gerar tabulações de domicílios e pessoas para uma área determinada toda vez que os domicílios e as pessoas específicas não sejam individualizadas. 10 VARIÁVEIS Os itens de informação dos elementos individuais de uma entidade estão armazenados em variáveis. Uma variável é uma propriedade ou característica de cada indivíduo, quer dizer, é assunto comum a todos os indivíduos de uma população: idade, estado civil, quantidade de chuva, etc. A característica pode ser qualitativa (atributo) ou quantitativa (variável). Em conseqüência, cada entidade tem sua própria lista de variáveis e cada elemento da entidade tem seu próprio conjunto de valores para estas variáveis. Assim, a entidade Pessoa poderia ter, entre outras, a variável sexo e um de seus elementos poderia ter o valor de sexo = feminino. É possível que qualquer entidade possua variáveis, por exemplo, Província poderia ter variáveis, como a média de chuva caída por ano, ou a percentagem de mães solteiras em idade fértil. Em R+G4 uma variável é identificada pela entidade à qual pertence e o nome da variável, com um ponto entre eles, isto é, Nome_de_Entidade.Nome_de_Variável. Por exemplo, PESSOA.SEXO, DOMICIL.TVCOLOR, etc. Uma mudança importante em R+G4 com relação a seu predecessor, winR+ v1.2, é que agora letras maiúsculas e minúsculas tem diferença, sobretudo nos nomes de variáveis e entidades. Por exemplo, PESSOA.SEXO, do dicionário de NMIR2000, não és o mesmo que PESSOA.sexo, ou pessoa.SEXO, ou pessoa.sexo; tem que se respeitar exatamente a escritura de cada variável no dicionário. VALORES FORA DE FAIXA E NÃO SE APLICA O conceito de Fora de Faixa (as vezes chamado de Omitido ou Missing) e o Não se Aplica se vinculam somente com as variáveis numéricas de uma base de dados. Ao carregar variáveis numéricas numa base de dados, o sistema R+G4 verifica sua integridade com relação aos limites informados, e caso o valor não se encontre dentro da faixa definida para a variável, o sistema assignará um único valor para todos estes casos. Por exemplo, a variável Estado Civil tem uma faixa de 1 a 4 ((1) solteiro, (2) casado, (3) viúvo e (4) divorciado). Qualquer valor que apareça no arquivo de entrada que não esteja entre 1 e 4 será transformado para o Valor Missing informado na janela de propriedades da variável. Por exemplo, seja este valor um 8. Nesse caso, depois da carga a variável Estado Civil terá os valores possíveis de 1 a 4 e 8. Por outro lado, o sistema R+G4 não é capaz de armazenar os brancos nas variáveis numéricas, o que significa que eles têm que ser convertidos a um outro valor numérico. Em geral, num arquivo de entrada consistente, estes brancos correspondem aos casos para os quais a pergunta NÃO É APLICADA. Por exemplo, para a variável Estado Civil, no censo de Chile de 1992, a pergunta se aplica somente para as pessoas maiores de 14 anos, pelo que as pessoas de até 13 anos têm um valor em branco para esta variável. Em tempo de carga estes valores são transformados para o Valor Não se Aplica informado na janela de propriedades da variável. Por exemplo, seja este valor um 9. Nesse caso, depois da carga a variável Estado Civil terá os valores possíveis de 1 a 4, 8 e 9. 11 Os valores para Fora de Faixa e Não se Aplica são especiais para o sistema R+G4 no momento de exploração da base. Eles são excluídos dos resultados tabulados, e no caso de que alguma variável com Missing ou Não se Aplica esteja envolvida numa expressão de cálculo ou de filtro, o resultado será um Missing ou Não se Aplica, de acordo à ordem de prioridade estabelecida pelo sistema. Isto faz com que os resultados de alguns tabulados não mostrem todos os casos existentes na base. Uma alternativa para eliminar estes problemas de casos "faltosos" é colocar os valores de Missing e Não se Aplica DENTRO da faixa de valores possíveis da variável. Esse procedimento terá a mesma função de assignar o Missing e o Não se Aplica no momento da carga, mas no momento da exploração, os valores estarão dentro da faixa, e SEMPRE aparecerão para o usuário. No exemplo acima, se informaria a faixa de Estado Civil como 1 – 9 (incorporando os valores 8 e 9). Além disso, se informaria também as categorias 8 – Omitido, e 9 – NSA (para Não Se Aplica). A vantagem de ter os valores de Missing e Não se Aplica dentro da faixa é ter o controle total das tabulações. Nunca faltariam casos nas tabulações, ou nos filtros ou expressões. A desvantagem é que estes valores NÃO podem mais ser filtrados automaticamente pelo sistema, sempre teremos que usar uma expressão de filtro, como FOR pessoa.ecivil < 5 para eliminar o Missing e o Não se Aplica dos cálculos. Outra desvantagem dessa solução é que os valores 5, 6, 7, 8 e 9 seriam considerados como valores "bons", quer dizer, dentro da faixa, e poderiam aparecer na base definitiva. Isto não seria problema se estamos trabalhando com um arquivo original passado pela consistência. No caso de estarmos trabalhando com arquivos antes da consistência, a alternativa é gerar a base com a faixa "oficial" 1 – 4 e modificar esta faixa no dicionário, depois da carga. A desvantagem é o trabalho de efetuar estas modificações a cada vez que se gere a base (ou fazer uma vez e salvar o dicionário em outro diretório). Algumas definições para trabalhar com R+G4 ESTRUTURA DA BASE DE DADOS A estrutura da base de dados define as relações hierárquicas entre as entidades, isto é, as relações pais-filhos. Isto define as relações entre elementos, dado que cada entidade pode ter elementos, ou instâncias específicas da entidade. Na figura se mostra a estrutura da base de dados Nova Miranda, a qual acompanha o programa R+G4 como base de demonstração. 12 Se necessitará ver a estrutura quando se selecione a(s) área(s) de interesse com a(s) qual(is) se deseja trabalhar. NÚMERO INTERNO Cada uma das entidades (e variáveis) possui, além de seu nome pelo qual são conhecidas nos processos estatísticos, um número interno, único, assignado pelo sistema na criação (ou edição) do Dicionário. Por definição, a primeira entidade (entidade "raiz", com o nome da base de dados), é a 0. Estes números podem ser consultados (mas não modificados) pelo usuário no Dicionário de Dados (consulta em linha). ÍNDICES Estes arquivos, também chamados de "ponteiros" , são os responsáveis pela conexão física entre os elementos das entidades e suas entidades inferiores. Cada entidade tem um arquivo de índices, com elementos que "apontam" desde a entidade superior até a entidade mesma. Eles têm a extensão ".ptr" (de "ponteiro"), e o nome de cada um deles é formado pelo nome da base de dados, agregando-se o número interno da entidade, com quatro posições, completado com zeros à esquerda. Todas as entidades na base de dados (inclusive a entidade "raiz") têm um arquivo ".ptr" associado. Para entender o funcionamento destes arquivos, tomemos como exemplo a base de dados mostrada na figura abaixo. PAIS PROVINC DISTRITO VIVIENDA 13 Cada um dos níveis, como "provinc", se denomina uma entidade. Cada entidade tem um ou mais elementos. A entidade "provinc" pode ter, por exemplo, dois elementos, as províncias denominadas: Província Oriental e Província Ocidental. Seguindo a hierarquia, debaixo da entidade "provinc" se encontra a entidade "distrito". Por exemplo, cada elemento da província está subdividido em elementos distritos, os que por sua vez estão divididos em domicílios. Se os elementos de uma entidade têm nomes e códigos, se diz que a entidade pode ser selecionável, já que os elementos individuais podem ser identificados fisicamente e selecionados em R+G4 para uso posterior. Habitualmente, este é o caso de entidades geográficas tais como uma província, município, distritos, etc., permitindo que os elementos da base de dados sejam conectados às áreas por meio de mapas. Neste exemplo, embaixo da entidade "distrito" se encontra a entidade "domicílio", composta de elementos individuais de dimicílio, cada um dos quais está localizado dentro de um distrito. As entidades como domicílio e pessoa podem ter milhões de elementos. Geralmente, estes se encontram não-identificados numa base de dados Redatam, ou seja, que não se pode selecionar domicílios ou indivíduos em forma isolada. Estas entidades são chamadas de não-selecionáveis. Porém, um conjunto de pessoas ou domicílios numa área podem ser selecionados através de sua localização em um ou mais elementos identificados nas entidades de alto nível. Isto se faz por meio do procedimento de seleção hierárquica de R+G4. MAIS DE UM RAMO Uma base de dados R+G4 pode ter mais de um ramo hierárquico e estes, por sua vez, podem ter sub-ramos, os conceitos e elementos de entidade são os mesmos. Uma entidade selecionável não necessita ser geográfica. Por exemplo, na figura a continuação se apresenta a estrutura hierárquica da base de dados de demonstração que se distribui com o programa R+G4, correspondente ao país fictício de Nova Miranda. Nesta estrutura a entidade "EDUCAC" é o estabelecimento educacional, "TENSENAN" é o tipo de educação, e "CURSOS" são os cursos existentes, o que significa que você pode selecionar só os dados de educação para um domicílio onde se agregam os dados de tipo de educação e cursos. 14 A informação sobre os elementos individuais de uma entidade são guardadas em variáveis, como o número de quilômetros quadrados de um distrito, ou o sexo de uma pessoa, de forma que se pode ver uma entidade como se fosse uma matriz, onde as linhas são os elementos (casos) e as colunas são as variáveis. DICIONÁRIO Toda a informação referente às entidades e às variáveis são guardadas num conjunto de arquivos chamado Dicionário da base de dados que são os "metadados", quer dizer, trata-se de "informação sobre informação". O Dicionário proporciona uma ponte entre os arquivos de dados e o usuário. Permite visualizar os dados em termos de variáveis e de registros, afastando-o dos detalhes físicos de armazenamento e manipulação interna. O dicionário contém uma lista de todas as variáveis de uma base de dados para cada nível da hierarquia (entidade), assim como os códigos (valores) para cada variável, com uma descrição do significado de cada código. Por exemplo, os códigos para a variável sexo pertencente ao nível pessoa são 1 e 2, onde 1 = masculino e 2 = feminino. O dicionário para uma determinada Base de Dados geralmente é definido uma só vez; por isto a maioria dos usuários o utiliza para obter uma lista das variáveis disponíveis e seus valores possíveis. O Dicionário pode ser revisado mediante a janela do dicionário que se abre desde o menu principal. RELAÇÕES ENTRE ENTIDADES 15 Esta base têm quatro entidades, e portanto, deverá ter quatro arquivos ".ptr". Para simplificação, suponhamos que as entidades tenham números internos correlativos começando de zero (PAIS é a entidade 0, PROVINC é a 1, DISTRITO é a 2, etc.). A entidade VIVENDA "pertence a" (ou depende de) entidade DISTRITO, que por sua vez "pertence" a PROVINC, que "pertence" a PAIS, e esta, por definição, "pertence" ao sistema. O conceito de "pertinência", numa divisão político-administrativa por exemplo, pode ser entendido como: a província 3 "do" país, o distrito 14 "da" província 2, a vivenda 358 "do" distrito 21, etc. Cada entidade pode ter um número distinto de elementos (casos), quer dizer, x distritos, y províncias, etc. Para efeito de exemplo, suponhamos que se tenha os seguintes números de casos para as entidades: PROVINC 5 DISTRITO 23 VIVENDA 4587 NOTA: Por definição, a entidade "raiz" tem SEMPRE um único caso, ou seja, é como se fosse o país. Suponhamos também as seguintes distribuições PROVINCIA DISTRITOS 1 3 2 5 3 4 4 6 5 5 DISTRITOS VIVIENDAS 1 300 2 250 3 130 … 16 23 90 Quer dizer, a primeira província têm três distritos, a segunda cinco distritos, etc., e o primeiro distrito tem 300 vivendas, o segundo 250 vivendas, etc. CONTEÚDO LÓGICO DOS ARQUIVOS DE PONTEIROS O conceito lógico dos arquivos de índices (ponteiros) é um vetor de contadores, cada registro com o número de casos da entidade inferior que "pertencem" a cada elemento da entidade superior. Em outras palavras, cada arquivo índice têm tantos elementos quantos sejam os elementos da entidade "que aponta", e cada elemento destes contém o número de casos da entidade "apontada". Por exemplo, o conteúdo lógico do arquivo de índices de DISTRITO, ou seja, PAIS0002.PTR, é exatamente a coluna da direita da tabela de Distritos por Província no tópico de Relações entre Entidades, quer dizer, o arquivo tem cinco registros lógicos (um para cada província), com os valores, 3, 5, 4, 6 e 5. O arquivo PAIS0003.PTR (para a entidade VIVENDA) corresponde à coluna da direita da tabela de Vivendas por Distrito, a seguir no mesmo tópico, com 23 registros lógicos, contendo respectivamente 300, 250, 130, etc. Pode-se dizer que um arquivo de ponteiros, apesar de levar o número da entidade para a qual ele aponta, funciona como um arquivo de dados da entidade superior, porque tem o mesmo número de elementos desta entidade. CONTEÚDO FÍSICO DOS ARQUIVOS DE PONTEIROS Na verdade, o conteúdo físico dos arquivos índice é um pouco distinto, assemelhando-se mais a um conceito de ponteiros que de número de elementos. Em vez do número de elementos, cada registro contém o número correlativo (começando de zero) do primeiro elemento da entidade inferior. Além disso, existe sempre um elemento adicional, ao final do arquivo, com o número total de casos da entidade inferior. Referindo-se às tabelas descritas em Conteúdo Lógico, o conteúdo físico do arquivo PAIS0002.PTR para a entidade DISTRITO seria como a primeira tabela abaixo, e para a entidade VIVENDA seria como na segunda tabela. PROVINCIA DISTRITOS Registro Conteúdo 1 3 1 0 2 5 2 3 3 4 3 8 4 6 4 12 5 5 5 18 6 23 VIVIENDAS Registro Conteúdo 1 300 1 0 2 250 2 300 3 130 3 550 DISTRITOS 17 … 23 90 23 4497 4587 Nota: Existe sempre um registro a mais ao final da lista, para armazenar o número de casos da última observação. Para ter acesso aos elementos da entidade inferior, o sistema usa então dois registros, o registron para o início dos elementos, e o registron+1 para calcular, por subtração, o número de casos. Por exemplo, os distritos da província 3 começam no distrito 7 (no registro está 8, mas devemos subtrair 1 porque se conta a partir do elemento zero), e são 4 (12 - 8). A figura mostra um exemplo desta relação em forma gráfica, onde pode-se apreciar que cada entidade tem variáveis (arquivos .bin, veja em Dados), dentro das quais se dispõe de uma variável que contém um código para os elementos daquelas entidades selecionáveis. Além disso pode-se ter uma variável que contém um nome associado ao código. Para recorrer a estrutura hierárquica das entidades existem os índices (arquivos .ptr) que estabelecem a conexão entre um elemento de uma entidade superior com seus elementos da entidade inferior, os quais podem ser visualizados como as flechas da figura. Os arquivos de índices são criados em tempo de geração da base de dados. Cada registro (elemento do arquivo) tem um tamanho de 4 bytes, e seu conteúdo NÃO está em formato ASCII. DADOS O sistema R+G4 guarda cada variável de uma entidade em um arquivo distinto, com um "registro" por cada elemento da entidade, o que significa que cada variável pode ser vista 18 como um vetor de dados (tais arquivos se conhecem como arquivos transpostos). Existe então um arquivo para a variável sexo, outro para a variável tipo de domicílio, etc. Cada arquivo conterá tantos registros (elementos) quantos sejam o número de casos da entidade à qual pertença a variável. Reportando-se ao exemplo descrito para os arquivos de Índices, uma variável a nível de PROVINCI terá 5 elementos, e uma variável a nível de VIVENDA terá 4.587 elementos. Estes arquivos têm a extensão .bin (de "binários"), se foram criados pela versão anterior de winR+, ou .rbf (de "Redatam Data Format") se foram criados por esta versão. Uma das vantagens deste tipo de arquivo é que, como cada registro (quer dizer, cada valor da variável, ou cada elemento do vetor) tem o mesmo tamanho, pode-se usar uma técnica de compressão de dados muito simples para economizar espaço de armazenamento. A decisão de comprimir (ou não) estes arquivos é tomada pelo usuário ao definir a variável no Esquema de Base. Se por um lado, as variáveis comprimidas ocupam muitíssimo menos espaço, o processo de descompressão ao le-la gasta um tempo maior que uma variável armazenada em formato caracter. Entretanto, o próprio fato de que a variável esteja comprimida, melhora a eficiência na leitura de seus dados de disco para a memória, já que se transfere menos volume de informação. O processo de compressão consiste em transformar em números binários os valores dos elementos de cada arquivo. O número de "bits" necessários para cada variável depende do valor máximo que a variável possa conter (também definido pelo usuário). Uma variável, por exemplo sexo, que contém os valores 1 e 2 (para homens e mulheres respectivamente), é comprimida em 2 bits (com 2 bits pode-se armazenar um número menor ou igual a 3). A variável idade, que pode variar, por exemplo de 0 até 99, necessita de 7 bits (armazena um número menor ou igual a 127), etc. Estes arquivos NÃO podem ser lidos fora do sistema R+G4, já que não estão em um formato ASCII. CÓDIGO GEOGRÁFICO Uma informação de vital importância para a criação da base de dados numérica, que se construirá depois de coletar e validar toda a informação do país e para cada uma de suas divisões político administrativas (regiões, províncias e comunas, etc.), é a que contém a localização geográfica de cada um dos domicílios em que se aplicou o questionário. Desta maneira é possível que, uma vez construída a base de dados censitária, se possa recuperar a informação recolhida até o nível mais baixo de desagregação geográfica que, no caso do Chile, corresponde ao "setor censitário", o qual está formado por uma agrupação de domicílios. Por razões legais e para proteger o segredo estatístico, que assegura a inviolabilidade da intimidade das pessoas, a base de dados não permite a individualização de um domicílio, família nem de pessoas em particular. Esta informação composta de códigos numéricos é a que dá origem ao código geográfico que, segundo se verá mais adiante, possui uma relevância especial no momento de trabalhar com dita base de dados. Ver também Segurança dos dados 19 ESTRUTURA DOS ARQUIVOS Além dos arquivos do Dicionário, uma Base de dados Redatam está formada por outros dois conjuntos de arquivos: a) os arquivos de dados e, b) os arquivos de ponteiros ou índices. Arquivos de Dados (.rbf) O sistema R+G4 guarda cada variável de uma entidade em seu próprio arquivo, com um "registro" para cada elemento da entidade. Assim, cada variável é um vetor de dados. Tais arquivos são conhecidos como arquivos transpostos, para distingui-los da forma mais comum de organização de dados estatísticos, onde todas as variáveis de cada elemento são guardadas em registros individuais, de maneira que um só arquivo contém todas as variáveis para todos os elementos. Na estrutura de arquivo transposto de Redatam, existe um arquivo para sexo, outro para tipo de domicílio, etc. Isto, entre outras vantagens, faz com que o processamento do sistema seja eficiente, já que permite que o sistema leia somente as variáveis especificamente envolvidas num determinado processo. Arquivos de Ponteiros (Índices .ptr) Estes arquivos são os responsáveis pela conexão entre os elementos das entidades e suas entidades inferiores. Cada entidade tem um arquivo de índices, com elementos que "apontam" desde os elementos da entidade superior até os elementos da entidade propriamente dita. Arquivos envolvidos na criação ARQUIVO ESTRUTURAL DA BASE (.WIP) Este arquivo é criado pelo módulo de Geração de Bases de Dados e nele se armazena o Esquema de Base, quer dizer, a estrutura das entidades e a informação sobre os registros e variáveis extraídas do dicionário importado que, junto com o arquivo de dados originais (.dat ou .dbf) se utiliza para criar as distintas bases de dados em formato R+G4. Quer dizer, se guarda o marco de referência (com entidades e variáveis) a utilizar para gerar uma ou mais bases de dados em Redatam+G4. Na Geração, este arquivo é a parte correspondente do arquivo final do dicionário da base (.dic). Em outras palavras, é como se fosse um arquivo .dic do dicionário, mas ainda não se construiu toda a informação necessária para que seja considerado um "verdadeiro" dicionário, o que acontecerá quando se gere a base (faltam os ponteiros e variáveis). Este arquivo trabalha em conjunto com o arquivo de definição de campos (.ddf), ou os dicionários IMPS, ISSA ou DBF do arquivo de entrada, para estabelecer quais campos serão gerados, e em que entidades. ARQUIVO DE DEFINIÇÃO DOS DADOS DE ENTRADA (.DDF) Este arquivo tem a finalidade de definir as propriedades do arquivo de entrada para a geração da base. Nesse arquivo se define também o tipo de arquivo de entrada, se é de formato 20 Simples ou Múltiplo (quer dizer, se o arquivo de entrada possui mais de um tipo de registro é múltiplo, se possui um registro único é simples). A definição dos campos do arquivo de entrada deve conter a informação básica necessária para localizar o campo no arquivo (tipo de registro ao qual pertence o campo), seu deslocamento (onde começa no registro) e seu tamanho. Estas são chamadas de definições físicas do campo. O arquivo também deve conter as definições lógicas de cada campo, quais sejam seu nome, rótulo (opcional), seu tipo (inteiro, real ou alfanumérico), sua faixa (valores mínimo e máximo aceitáveis) e suas categorias (código e nome). Os campos existentes no arquivo de entrada serão as futuras variáveis da base de dados. Claro, não é obrigatória a geração de todos os campos para a base de dados: pode-se escolher quais campos pertencerão à base, e em quais entidades. Como todo arquivo tipo Chillán, o DDF pode ter várias seções, cada uma com suas cláusulas específicas. seção descrição General Única para todo o arquivo, descreve o tipo de arquivo, número de tipos de registro, número de campos, e a posição e tamanho do identificador do tipo de registro. Field Uma seção para cada campo no arquivo de entrada. Record Uma seção para cada tipo de registro no arquivo de entrada. Existe somente no caso de Registros Múltiplos. Seção General cláusulas descrição DataSetType Tipo de arquivo, pode ser ASCII1(registro simples) ou ASCIIM (registros múltiplos). Fields Número de campos no arquivo. O arquivo DDF terá tantas seções [FIELDn] quanto o conteúdo desta cláusula. Records Número de tipos de registro. O arquivo DDF terá tantas seções [RECORDn] quanto o conteúdo desta cláusula. Somente se DataSetType=ASCIIM RecTypeStart Posição do tipo de registro no arquivo. Somente se DataSetType=ASCIIM RecTypeSize Tamanho do tipo de registro no archivo. Somente se DataSetType=ASCIIM Seção Field cláusulas descrição Name Nome do campo. Label Rótulo do campo. 21 Record Tipo de registro ao qual pertence. Se é um campo comum a todos os tipos de registro, Record=COMMON Type Tipo de campo. INTEGER, REAL ou STRING Start Posição no registro de entrada. Size Tamanho do campo. NotApplicable Valor no arquivo de entrada que significa Não se Aplica. Opcional. Missing Valor no arquivo de entrada que significa Valor Omitido. Opcional. Blank Valores possíveis NOTAPP ou MISSING. Se o branco no arquivo de entrada é Não se Aplica ou Missing. RangeMin Valor para a faixa mínima aceitável. RangeMax Valor para a faixa máxima aceitável. ValueLabels Número de rótulos para as categorias do campo. Existirão tantas cláusulas VLn quanto o conteúdo desta cláusula. VLn Código e valor da categoria n, no formato VLn=x texto, onde x é a categoria, e texto é a descrição da mesma. Seção Record cláusulas descrição Name Identifica o tipo de registro, para ser usado na cláusula Record dos FIELD. Label Rótulo do registro. Value Valor do tipo de registro. RELAÇÕES ENTRE .wip E .ddf O arquivo .ddf contém a definição dos campos do arquivo de entrada, assim como informação sobre os tipos de registros e forma de ordenamento contidos no arquivo de entrada, e é usado para "povoar" o esquema de entidades e variáveis da futura base de dados Redatam. O arquivo .wip, ao contrário, guarda o esquema estrutural, que armazena as entidades e variáveis da base. O arquivo estrutural da base (.wip), contém o Esquema de Base, e com ele todas as variáveis assignadas às entidades correspondentes. Quando se arrasta uma variável desde a janela de propriedades do arquivo de entrada para a janela de variáveis do Esquema de Base, o sistema copia as características do campo informadas no arquivo de definição .ddf, e as coloca na variável copiada para o Esquema de Base. O sistema copia as características tais como Nome, Rótulo, Categorias, Tipo, Tamanho, Decimais e Comentários. Entretanto, não copia todas as características. A característica de deslocamento do campo NÃO é copiada para a variável: o que o sistema faz é armazenar o nome do campo origem da variável, e armazenar o início da variável EM RELAÇÃO AO INÍCIO DO CAMPO. Por 22 exemplo, o campo IDADE, na posição 17 e tamanho 3 no registro de entrada, ao ser arrastado para a entidade PESSOA terá as mesmas características, mas seu deslocamento será 1 (porque é relativo ao início do campo) e seu tamanho será 3. Esta estratégia de não copiar o deslocamento tem a vantagem de poder modificar a definição do arquivo de entrada com relação aos deslocamentos, por exemplo, ao equivocar-se ao definir este parâmetro, ou esquecer-se de um campo. Outra vantagem é possibilitar a definição de variáveis como parte de um campo: por exemplo, o campo de ATIVIDADE (início 28 e tamanho 4) pode estar conectado a três variáveis no Esquema, a primeira como ATIVIDADE, mesmo tamanho (deslocamento 1), uma segunda como GRUPO (grupo de atividade, primeiro dígito da atividade), com tamanho 1 e deslocamento também 1, e a terceira como as duas últimas posições da atividade, com tamanho 2 e deslocamento 3. Depois de executar a carga da base, o dicionário (.dic) é gerado automaticamente, assim como os arquivos de ponteiros (.ptr) e de variáveis (.rbf), e será, em principio, uma versão de trabalho do Esquema de Base (.wip), sem ter mais nenhuma conexão com o arquivo de definição (.ddf) Preparação do Arquivo de Entrada ETAPAS INICIAIS Uma base de dados R+G4 pode ter uma estrutura muito simples, com um só ramo de informação, ou tão complexa como você possa imaginar, com múltiplos ramos na árvore hierárquica. Pode ser muito pequena em tamanho (só uns quantos Megabytes), ou muito grande, incluindo dados censitários com centenas de Megabytes. Independentemente de qual seja o seu caso, antes de começar o processo de geração, você tem que considerar as etapas aqui descritas. (1) Revisar e definir o formato do arquivo de entrada (2) Cuidados com o arquivo de entrada (3) Verificar formatos aceitos para a definição do arquivo de entrada (4) Definir os campos de entrada (5) Proceder a criar o Esquema de Base e carregar a base R+G4 FORMATO DO ARQUIVO DE ENTRADA Para gerar uma base de dados, R+G4 pode ler arquivos ASCII (.dat) e Dbase (.dbf). Os registros num arquivo podem estar organizados de duas maneiras: com um formato único ou com um formato múltiplo. Se seu arquivo de entrada está armazenado em um tipo especial de formato, tais como aqueles usados em aplicativos comerciais, por exemplo, LOTUS, SAS, SPSS, etc., você tem que convertê-los a um formato DBF ou a arquivos planos de formato ASCII antes de gerar a base em R+G4. FORMATO ÚNICO 23 O arquivo de entrada tem um só tipo de registro, isto é, todos os registros têm o mesmo formato e identificam a uma mesma entidade. Nesse caso, R+G4 assume que eles pertencem somente a uma entidade, por exemplo "pessoa". Você pode misturar variáveis de diferentes entidades num arquivo com um formato único sempre e quando a entidade inferior esteja presente. Por exemplo, se o arquivo com formato único representa a pessoas, mas também inclui variáveis do domicílio, todas as variáveis do domicílio deverão estar duplicadas em cada registro correspondente às pessoas dentro desse domicílio. Identificação-variáveis Dados Provincia | Comuna | | Distrito | | | Manzana Numviv Nper | | | | 01 01 001 358 01 01 01 001 358 01 01 001 01 01 01 01 Luz agua sexo idade P1 1 1 2 23 01 P2 1 1 1 33 358 01 P3 1 1 2 12 001 358 02 P1 2 1 1 56 01 001 358 02 P2 2 1 2 52 01 001 358 02 P3 2 1 2 16 As outras variáveis que devem estar presentes num arquivo com um único formato de registro são aquelas que identificam as entidades superiores à entidade específica na estrutura de árvore hierárquica. Por exemplo, se você está carregando dados para a entidade PESSOA desde um arquivo de formato simples, as variáveis que estão presentes são aquelas que pertencem a esta entidade, e além disso se duplicam as variáveis de entidades superiores incluindo as variáveis de identificação de entidades superiores como MANZANA, DISTRITO, COMUNA y PROVINCIA, as quais são, respectivamente, as entidades superiores. FORMATO MÚLTIPLO Se você está tratando com um arquivo de formato múltiplo, tal como aqueles encontrados em pesquisas domiciliares e censos de população, existem dois ou mais tipos de registros num mesmo arquivo. Por exemplo, quando você tem um tipo de registro para os dados de domicílio e outro registro para os dados de população, este arquivo deve ter uma coluna específica para identificar o tipo de registro, por exemplo, "1" para domicílio e "2" para população, como se mostra na tabela abaixo. Tipo-reg Identificação-variáveis Dados Provincia | Comuna | | Distrito | | | Manzana | | | | 24 1 01 01 001 358 Domicílio 2 01 01 001 358 Pessoa 1 2 01 01 001 358 Pessoa 2 2 01 01 001 358 Pessoa 3 1 01 01 001 358 Outro Domicílio 2 01 01 001 358 Pessoa 1 Nesse caso, cada tipo de registro (o tipo 1 para domicílio, e o tipo 2 para pessoas) será referido a uma entidade diferente na base de dados criada em R+G4, e os dados de cada tipo de registro serão carregados só para essa entidade. Cada tipo de registro deve ter variáveis pertencentes só à entidade específica a que se refere, mais as variáveis de identificação geográfica das entidades de níveis superiores na hierarquia como MANZANA, DISTRITO, COMUNA e PROVINCIA. Estas variáveis de identificação para as entidades superiores são necessárias para construir as relações entre os diferentes níveis, isto é, os arquivos de índices (".PTR"). É a única maneira que o sistema tem para "conhecer" como enlaçar os dados desde uma entidade de menor nível a uma de maior nível. Para as entidades que não têm variável de identificação, como é o caso de DOMICÍLIO, o sistema "saberá" quando criar um elemento detectando seu tipo de registro no arquivo de entrada. Isto é, usando o mesmo exemplo de um típico arquivo de censo, cada tipo de registro "1" criará um elemento domicílio para a entidade DOMICÍLIO, e os registros tipo "2" que vierem depois deste registro tipo "1" criarão registros de pessoas para a entidade PESSOA, mantendo a dependência ao domicílio anterior. Os domicílios sem pessoas não terão registros tipo "2" a continuação de seu registro tipo "1". Para detectar aqueles domicílios sem pessoas se aconselha trabalhar com registros de formato múltiplo, já que com o formato único se criaria sempre uma entrada para uma pessoa ainda que as variáveis pudessem ser consideradas com valores não se aplica. É importante notar que o registro de domicílio tem que vir ANTES dos registros de população correspondentes. Quer dizer, o arquivo deve ter os registros ordenados. O arquivo de formato de registros múltiplo é algumas vezes chamado arquivo "hierárquico", porque existe uma certa "hierarquia" entre os registros tipo "1" e "2", isto é, os registros tipo "2" "dependem" do registro prévio tipo "1". Porém, este não é realmente um arquivo hierárquico, porque a parte identificatória (geralmente a informação geográfica) está duplicada para todos os registros. Um verdadeiro arquivo hierárquico teria um tipo de registro por cada nível de informação (entidade), como na tabela a seguir. Cada entidade teria um tipo de registro específico para armazenar seus dados. A informação "geográfica" não seria repetida para cada registro no arquivo, mas apareceria só no tipo de registro específico. Por exemplo, a informação de província (como seu código, nome ou outra informação desse nível) seria armazenada só nos registros tipo "1". Este tipo de arquivo não é comum em processamento estatístico, ainda que seja muito útil para economizar espaço. Tipo-reg Dados | | 1 Província (código e outra informação) 2 Comuna 3 Distrito 4 Manzana 5 Domicílio 6 Pessoa 1 25 6 Pessoa 2 ... 5 Outro Domicílio 6 Pessoa 1 … CUIDADOS COM O ARQUIVO DE ENTRADA Antes de entrar em detalhe na geração de uma base de dados é necessário analisar o conteúdo dos arquivos originais e verificar sua consistência. Se não se conta com um dicionário de dados, é imprescindível conhecer a distribuição de cada campo para poder defini-los corretamente na base. Para isto se recomenda gerar freqüências de cada campo. Uma vez que se conheça todos os possíveis valores de cada campo com exatidão, deve-se definir um dicionário com a seguinte informação: a) O formato de entrada dos dados (registro únicos ou múltiplos) b) Se é múltiplo, o campo que define o tipo de registro (nome, posição, e tamanho) c) Para cada campo definir o nome, posição e tamanho d) Além disso, o tipo de campo (real, inteiro, caracter) e) A faixa, isto é, o valor mínimo e máximo possível de encontrar f) Os valores fora desta faixa (brancos, ignorados e possíveis inconsistências). g) O número de categorias possíveis de encontrar h) Descrição das categorias Uma vez definido o dicionário deve-se verificar a consistência dos dados: i) Verificar que não exista duplicidade de registros, quer dizer, dois registros para um mesmo elemento. Por exemplo, verificar que não se encontre uma pessoa definida duas vezes. j) Verificar que um campo definido como código identificador de entidade tenha somente números. Esta é uma limitação de R+G4 já que o código é um valor numérico armazenado como caracter. Por exemplo, mudar códigos como 02001A para número. k) Verificar que o código definido como identificador de um elemento seja único para esse elemento. Por exemplo, que dentro de um bloco não existam dois domicílios 01. l) Decidir os campos geográficos a utilizar na estrutura hierárquica, além de identificar quais levarão nome ou rótulos (por exemplo, província, região, distrito, segmento, etc.). m) Ordenar os dados segundo a seqüência da hierarquia que se vai utilizar: O arquivo de entrada deve ser classificado utilizando como padrão o conjunto de campos de identificação de geografia, necessários para o acesso geográfico à base de dados de Redatam. Pode-se utilizar um utilitário como LSORT, ou aplicativos como FoxPro ou IMPS para tais efeitos. 26 DICIONÁRIOS ACEITOS PARA O ARQUIVO DE ENTRADA Os dados do arquivo de entrada (arquivo com dados originais) se comunicam com o esquema de base em Redatam através do dicionário (ou arquivo de definição) o qual pode vir em qualquer dos formatos aceitos por R+G4: As alternativas de formatos são: · Arquivo xBase. Nesse caso o arquivo de definição é diretamente o arquivo original de carga (.dbf), não há necessidade de ter uma definição a parte. · IMPS4. O arquivo de definição (dicionário) foi definido usando-se o software IMPS4.1, e tem a extensão .ddw. · ISSA. O arquivo de definição (dicionário) foi definido usando-se o software ISSA ou CSPro e tem a extensão .map. · Chillán. É o formato interno de R+G4 para a definição dos dados de entrada (extensão .ddf). Para facilitar os processos posteriores e eventuais câmbios na definição de variáveis, se recomenda exportar o dicionário de ISSA ou IMPS para o formato Chillán . DEFINIÇÃO CHILLÁN – REGISTRO MÚLTIPLO Arquivo ASCII com Registros Múltiplos A seguinte estrutura afeta a: 1. Arquivos de registros múltiplos 2. Registros sem hierarquia Descrição de seções com um exemplo [General] Fields=17 RecTypeStart=2 RecTypeSize=1 Records=4 [Record1] Name=VIVIENDA Label=Vivienda Value=1 MaxNumber=27 BrotherRecord=HOGAR [Record2] Name=HOGAR 27 Label=Hogar Value=2 MaxNumber=27 ParentRecord=Common BrotherRecord=PERSONA [Record3] Name=PERSONA Label=Persona Value=3 MaxNumber=27 ParentRecord=Common [Field1] Name=ORDVIV Type=STRING Size=5 Start=19 Record=Common ValueLabels=0 [Field2] Name=REGION Type=STRING Size=2 Start=39 Record=Common ValueLabels=0 [Field3] Name=PROVINC Type=STRING Size=1 Start=41 Record=Common ValueLabels=0 [Field4] Name=COMUNA Type=STRING Size=3 Start=42 28 Record=Common ValueLabels=0 [Field5] Name=DISTRITO Type=STRING Size=2 Start=45 Record=Common ValueLabels=0 [Field6] Name=AREAC Type=STRING Size=1 Start=47 Record=Common ValueLabels=0 [Field7] Name=ZONALOC Type=STRING Size=3 Start=48 Record=Common ValueLabels=0 Nota: As variáveis que pertencem à raiz devem declarar um pai comum (common). DEFINIÇÃO CHILLÁN - REGISTRO SIMPLES Arquivo ASCII de Registro Simples Descrição de seções Exemplo [General] Fields=401 DataSetType=ASCII1 [Field1] Name=CLAVE 29 Type= Size=15 Start=1 Record=Common ValueLabels=0 [Field2] Name=REGION Type=INTEGER Size=2 Start=1 Record=SECCION ValueLabels=0 [Field3] Name=PROVIN Type=INTEGER Size=1 Start=3 Record=SECCION ValueLabels=0 [Field4] Name=COMUNA Type=INTEGER Size=3 Start=4 Record=SECCION ValueLabels=0 [Field5] Name=IFOLIO Type=INTEGER Size=4 Start=7 Record=SECCION ValueLabels=0 [Field6] Name=IDVF Type=INTEGER Size=1 30 Start=11 Record=SECCION ValueLabels=0 [Field7] Name=CIIU Type=INTEGER Size=4 Start=12 Record=SECCION ValueLabels=0 [Field8] Name=P106 Type=INTEGER Size=1 Start=16 Record=SECCION ValueLabels=0 [Field9] Name=P107 Type=INTEGER Size=1 Start=17 Record=SECCION ValueLabels=4 VL1=1 Privada Nacional VL2=2 Privada Extranjera VL3=3 Mixta VL4=4 Estatal USO ALTERNATIVO DO IMPS 4.1 Uma das maneiras de evitar a tarefa tediosa de ingressar à mão toda a informação necessária para descrever o arquivo de entrada em formato Chillán é fazer uso do software IMPS 4.1, do Bureau de Censos dos Estados Unidos, que tem um editor muito bom de definição de arquivos. Esse dicionário (extensão .ddw), produzido pelo IMPS 4.1, pode ser importado ao formato Chillán pelo Gerador de Bases de Dados de R+G4 de uma maneira muito simples. Passos a seguir para Importar um dicionário IMPS 4.1 a Chillán 31 Entrar no modulo R+Create e abrir um Esquema de Base novo. O sistema mostra um Esquema de Base vazio, com o nome de "Sem Título" e com uma única entidade "raiz". No menu Dados de Entrada >Abrir Definição >IMPS4.1, navegar no disco e buscar o arquivo do dicionário de IMPS correspondente. Depois de aceitar o arquivo IMPS (.ddw), o sistema dá uma mensagem dizendo que o arquivo de dados não foi encontrado, não se preocupe: esta mensagem se refere ao arquivo de dados que contém os dados de entrada, o qual não é necessário nesse momento, e não a seu arquivo de definição (.ddw). O sistema mostra a janela de Propriedades do Arquivo de Origem. Em menu Arquivo >Exportar para Chillán, eleger o diretório e nome do arquivo tipo Chillán (.ddf) a ser criado. Fechar a janela de Propriedades do arquivo de entrada e fechar também o Esquema de Base, sem salvá-lo. Geração DESCRIÇÃO RESUMIDA DA GERAÇÃO A Geração de uma base de dados R+G4 nada mais é do que um processo de modificação de formato do arquivo de entrada ao formato final em R+G4. Claro está que, para executá-la bem, é necessário cumprir uma série de condições e procedimentos. Em primeiro lugar, deve-se verificar se o arquivo original de entrada está preparado para a geração, se está classificado na ordem que se necessita, se a estrutura de casos pode ser "entendida" pelo Gerador, etc. Em segundo lugar, como se trata de um câmbio de formato, é necessário definir ambos formatos, tanto o formato original do arquivo de entrada como o formato definitivo da base. Isso significa a criação da Definição do Arquivo de Entrada (extensão .ddf) e do Esquema de Base. Além disso, deve-se "mapear" os campos de uma definição para a outra, quer dizer, quais (e de que maneira) os campos de entrada estarão representados na base de saída. Por último, Gerar a base propriamente dita, fazendo uma revisão do processo e do dicionário produzido. Etapas a seguir Anteriores a R+G4 Preparar original Verificar se o arquivo cumpre com as condições necessárias para a Geração. Definir entrada Descrever as propriedades do arquivo de entrada. Em Geração R+G4 Estrutura Hierárquica Desenhar a estrutura da base com suas entidades. Mapear variáveis Empalmar as definições de campos no arquivo de entrada com as variáveis da base. Propriedades das Variáveis Verificar rótulos, categorias, faixas, valores não se aplica e missing. Definir também os códigos selecionáveis das entidades. Criar a Base Executar o processo de Geração propriamente dito. Revisão do Processo Examinar o relatório de geração. 32 Em Process R+G4 Nomes de elementos Gerar as variáveis correspondentes aos nomes dos elementos das entidades que possuam nomes. Revisão do Dicionário Verificar a relação entre o dicionário e os arquivos de dados e ponteiros. Revisão das Variáveis Verificar a distribuição de freqüências das categorias das variáveis, e compará-las com as freqüências do arquivo original de entrada. Fora de R+G4 Back Up Compressão e cópia da base. PREPARAÇÃO DO ARQUIVO DE ENTRADA A preparação do arquivo de entrada consiste em programar a função de geração da base, ter um conhecimento mais aprofundado do arquivo a ser trabalhado, verificar se as condições de carga se cumprem, classificar, se necessário, o arquivo, preparando-o para a carga, enfim, todas as tarefas preparatórias necessárias para possibilitar a geração da base. Estas tarefas estão melhor descritas no tópico de Cuidados com o Arquivo. DEFINIR OS CAMPOS DE ENTRADA Com a informação que se obtém ao analisar um arquivo com dados originais é necessário criar um dicionário ou definição de dados para R+G4. O dicionário de um arquivo de entrada é também denominado definição do arquivo de entrada. No dicionário ou definição se indica o nome do arquivo com os dados, se indicam os campos a incluir na base de dados, seu nome, tipo, tamanho, faixa, possíveis categorias e o tipo de registro a que pertencem. Para a definição pode-se utilizar algum dos formatos aceitos por R+G4 (ver formatos aceitos para o arquivo de entrada) ou pode-se gerar utilizando o formato Chillán. DEFINIR A ESTRUTURA HIERÁRQUICA DA BASE O processo de geração de uma base de dados R+G4 começa por estabelecer as entidades da hierarquia e suas variáveis no Esquema de Base, que se armazena num arquivo com a extensão .wip. Para começar a criação de um esquema novo se seleciona a opção Arquivo >Novo desde o menu principal, e se começa a preencher a janela com a nova definição da estrutura hierárquica. O programa mostra a Janela do Esquema de Base onde aparece a definição das Entidades que formam a estrutura hierárquica da nova base de dados que vai ser gerada (por exemplo Região, Província, Comuna, Distrito, etc.). 33 Para agregar uma entidade, ou para as outras funções de manutenção dessa estrutura, tais como deletar entidades, mover entidades para outro ramo, etc., usar o menu dinâmico de entidades. Ao salvar este esquema, o sistema cria um arquivo de Esquema de Base, no diretório definido, com a extensão .wip. DEFINIR VARIÁVEIS PARA CADA ENTIDADE Essa atividade consiste em arrastar variáveis desde a janela de Propriedades do Arquivo de Entrada para a janela do Esquema de Base, tendo marcado previamente (com um clique do mouse) a entidade para à qual pertencerá a variável. Para definir as variáveis para cada entidade deve-se abrir a janela de propriedades dos dados de entrada (onde aparecem os campos todos juntos ou separados pelo tipo de registro). Isso se faz com a opção do menu principal em Dados de Entrada >Mostrar definição de dados de entrada. A mecânica de todo o processo se baseia em selecionar a entidade à qual vai se agregar uma variável no Esquema de Base e em seguida arrastar os campos desde a janela de propriedades do arquivo de entrada, até o painel de variáveis do Esquema de Base. Esta é a única forma de definir variáveis para cada entidade, uma vez que NÃO EXISTE OUTRA MANEIRA de criar variáveis no Esquema de Base que não seja a partir dos campos existentes no arquivo de entrada (dados pela descrição de campos adjunta). Não se pode, por exemplo, agregar uma variável nova, como se faz com as entidades, no Esquema de Base. Cabe mencionar que o menu dinâmico de variáveis não tem a função de agregar variáveis ao Esquema de Base. Passos a seguir Selecionar a entidade Com o botão esquerdo do mouse, clicar no nome da entidade no Esquema de Base. Selecionar os campos Na janela de propriedades do arquivo de entrada, localizar o(s) campo(s) que se deseja colocar na entidade selecionada. É possível selecionar um ou mais campos, da maneira usual em Windows, com um clique no mouse esquerdo no nome do campo, ou acompanhado das teclas Ctrl para selecionar campos separados, ou com a tecla Shift para selecionar um intervalo de campos. 34 Arrastar os campos Com o mouse esquerdo, arrastar os campos para a parte de variáveis (direita) do Esquema de Base. Os nomes dos campos serão movidos para a parte de variáveis do Esquema de Base, e estarão conectados com a entidade marcada. É possível arrastar um campo mais de uma vez para o Esquema de Base, no caso de que se queira gerar variáveis correspondentes a seções ou partes de um campo (por exemplo, ocupação e grupo de ocupação, ou uma variável numérica e também a mesma variável como string). Nesse caso, antes de arrastar o campo pela segunda vez, mudar o nome da variável no Esquema. 35 DEFINIR VARIÁVEIS E CÓDIGOS DE ENTIDADE Esta etapa tem duas funções distintas: a) Verificar as características das variáveis; e b) Definir os códigos que identificam as entidades. Verificar as características das variáveis O processo de definir variáveis para cada entidade estabelece quais variáveis vão "pertencer" a quais entidades no Esquema de Base. Estas variáveis têm propriedades que provêm da descrição dos campos do arquivo de entrada, que as vezes não foram totalmente definidas, mas são necessárias para a geração de uma base Redatam. No momento de salvar o Esquema de Base, ou então quando se Verifica a Consistência do Esquema o sistema faz uma verificação de seu conteúdo e das propriedades das variáveis. Se faltar alguma definição necessária o sistema mostra uma caixa de mensagens e advertências com a explicação da informação que falta (ou que está errada). Cada variável deve ter a seguinte informação: · posição · tamanho (no arquivo de entrada) · tipo (inteira, real ou alfanumérica), 36 · limites mínimo e máximo (se variável numérica, quer dizer, inteira ou real), e · definição dos valores para fora de faixa e não se aplica. Definir os códigos das entidades As entidades podem ser selecionáveis ou não selecionáveis. Para que uma entidade seja selecionável é necessário que ela tenha uma variável de identificação, de valores únicos para cada elemento da entidade, e de tipo alfanumérico (STRING). Para marcar uma entidade como selecionável, chamar o menu dinâmico com o mouse sobre o nome da entidade, e escolher a opção Entidade Selecionável. O sistema colocará uma marca ao lado esquerdo desta opção, significando que a entidade está marcada como selecionável. Para desmarcar uma entidade (passá-la para não selecionável), chamar o menu dinâmico e desmarcar a opção. Toda entidade selecionável necessita uma variável para identificar seus elementos, e É OBRIGATÓRIO que esta variável seja do tipo STRING. Se a entidade não tem nenhuma variável do tipo STRING, o sistema não permite que seja marcada como selecionável, ainda que se chame o menu dinâmico e se tente marcar a opção. Depois de marcar a entidade como selecionável, deve-se definir sua variável de identificação. Com o mouse sobre a variável elegida, chamar o menu dinâmico e escolher a opção Código de Entidade. O sistema reconhece este comando mostrando uma bandeira ao lado do nome da entidade. GERAR A BASE R+G4 No menu principal eleger a opção Base de Dados >Executar Geração. O sistema verifica a consistência do Esquema de Base e, caso positivo, inicia o processo de carga, com uma serie de painéis (ou passos) manejados pelos botões de Avançar e Voltar, na parte inferior da janela. É possível usar um Esquema de Geração salvo anteriormente usando o botão de Carregar Esquema. Ainda que se use um Esquema de Geração, é necessário seguir com o botão de Avançar até o último painel (passo), quando aparece o botão de Executar. Passo 1 – Definir parâmetros da Base Nome da Base Nome genérico da base de dados. Por default é o nome da entidade raiz. Este nome será usado como prefixo dos nomes dos arquivos .rbf e .ptr da base. Se é necessário manter a compatibilidade com a versão anterior de winR+ v1.2, este nome deve ter até quatro caracteres alfanuméricos, e começar com uma letra. Nome do dicionário e sua localização Nome do arquivo .dic a ser gravado para o dicionário da base, com seu passo completo. É possível ingressar este nome à mão, ou usar o botão de navegação à direita. Se recomenda um diretório em separado para armazenar os arquivos da base. Compatibilidade de Versões Se a base vai ser usada também pela versão anterior de Redatam (winR+ v1.2). Se recomenda manter esta compatibilidade. Passo 2 – Definir Arquivo Original Identificador Tipo do arquivo de entrada. Na verdade, este tipo já está definido pelo tipo indicado no dicionário do arquivo de entrada (simples ou múltiplo). 37 Nome do arquivo Define o nome (localização completa) do arquivo de entrada a ser usado na geração. Em geral, este campo já deveria vir definido na janela de propriedades do arquivo de entrada, mas se não existir essa informação, usar o botão de navegação ao lado do identificador para eleger o arquivo de entrada. Passo 3 – Definir Esquema de Identificação de Arquivos O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base. Estes arquivos necessitam ter nomes, para que possam ser referenciados apropriadamente pelo dicionário. O esquema de geração destes nomes pode ser: a) numeração automática; ou b) usando os nomes de entidades e variáveis. Numeração automática Os arquivos são nomeados em seqüência numérica, todos com o prefixo do nome da base. Por exemplo AGRO0020.RBF, AGRO0035.PTR, etc. Nomes de Entidades Os arquivos são nomeados usando-se os nomes de suas respectivas entidades e variáveis. Por exemplo, SEXO.RBF Nota: Por compatibilização com a versão anterior se recomenda a numeração automática. Passo 4 – Selecionar Entidades a Gerar O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas deve-se estabelecer os parâmetros a seguir. Gerar Ponteiro Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta marca deve estar sempre ligada. Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por definição, já foi estabelecido pelo sistema quando se definiu o esquema de nomes no passo anterior, mas existe a possibilidade de editar este campo e modificar o nome do arquivo que armazenará os ponteiros da entidade. Verificar seqüência Para as entidades selecionáveis, eleger se o sistema deverá verificar a ordem dos elementos em tempo de carga, para garantir a seqüência. Tipo de registro Para as entidades não selecionáveis, eleger o tipo de registro, definido no arquivo de entrada, como ponto de quebra ao qual corresponderá a entidade a ser carregada. Passo 5 – Selecionar Variáveis O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas, deve-se marcar as variáveis a serem carregadas. Pode-se usar os botões de Selecionar Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de uma entidade. Passo Final – Gerar a Base Usar o botão de Executar para começar a carga da base. Nesse momento, ANTES da geração propriamente tal, pode-se usar o botão de Salvar Esquema para que o mesmo possa ser reusado em caso de necessidade de reexecutar o processo. 38 Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com dados de início, previsão de término, percentagem de execução, etc. Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de Geração. REVISAR RELATÓRIO DO PROCESSO DE GERAÇÃO Ao término da carga o sistema mostra uma janela com o Relatório do Processo de Geração. Este informe deve ser salvo para posterior consulta (no menu principal, Arquivo >Salvar Como). O Relatório contém as quantidades de elementos gerados para cada entidade, e as quantidades de elementos gerados por variável, separados em Valores Válidos, Valores Não se Aplica, e Valores Missing. Verificar estes valores contra o esperado em cada uma das variáveis. As quantidades de elementos nas entidades, para as entidades não selecionáveis, deve ser a mesma que o número de registros do arquivo original de entrada, por exemplo, o número de domicílios e de pessoas. Para as entidades selecionáveis, este número deve ser o número esperado de casos das entidades geográficas, como por exemplo, províncias. Para as entidades, resultados não esperados podem ter várias causas: Arquivo original de entrada não classificado. Isto faz com que as entidades superiores possam aparecer mais de uma vez na contagem (a cada "quebra" deste código o sistema contabiliza um novo elemento da entidade). Deslocamento do campo de código. Uma definição equivocada do campo de província, por exemplo, começando na coluna errada (ou com o tamanho equivocado), seguramente irá ocasionar um número errado de províncias na base. Tipo de registro equivocado. O empalme entre a entidade e o tipo de registro na janela de propriedades do arquivo de entrada está incorreto. Por exemplo, se inverteu o tipo de registro de domicílio com o de pessoa. Para as variáveis, os resultados não esperados podem ter as seguintes causas: Deslocamento do campo de entrada. Uma definição equivocada do campo de entrada, por exemplo, começando na coluna errada (ou com o tamanho equivocado), seguramente irá ocasionar um resultado errado para a variável. Faixa de valores. A definição dos limites mínimo e máximo para a variável determina os valores de entrada que serão convertidos a missing (fora de faixa). GERAR NOMES DE ELEMENTOS Em geral, o arquivo original de dados não possui os campos de nomes de elementos das entidades, somente seus códigos. Por exemplo, as posições 2 e 3 do registro trazem o código das províncias, (01, 02, 03, etc.), mas seus nomes (Bellavista, Eldorado, etc.) não estão no arquivo. Desta maneira não há como gerar a informação de nomes diretamente do arquivo de entrada. 39 Por outro lado, essa é uma informação importante, porque além de servir para documentar os resultados dos processos (com os nomes das províncias e não seus códigos), é usado também no módulo de seleção geográfica para facilitar a localização (e seleção) das províncias a processar. Apesar de tratar-se de um processo de carga de variáveis, esta função é executada pelo Processador Estatístico de R+G4, e está descrita em Agregar Variável. Para gerar os nomes dos elementos se recomenda partir de um arquivo que tenha somente os registros desta entidade, com um registro para cada elemento, com o código e o nome do elemento. Por exemplo, 123 Aranjuez 175 Marguerita 178 Carbajal de los Montes Os nomes devem estar separados dos códigos pelo menos por um espaço (não usar o caracter tabulador). Seguir as instruções em Agregar Variável, usando a técnica de Tabelas Lookup para carregar os nomes. REVISAR CONSISTÊNCIA DO DICIONÁRIO Depois da geração da base deve-se verificar todo o processo e o conteúdo do dicionário. Parte dessa revisão já deve ter sido executada na etapa de revisão do Relatório do Processo. A revisão do dicionário é executada no módulo de Processo de Bases de Dados. Esse módulo, no menu principal de Dicionário >Consistência, executar ambos processos, o de Localizar Arquivos, e o de Relatório de Erros. Localizar Arquivos Verificação e atualização do dicionário com respeito às entidades e variáveis descritas nele, e à LOCALIZAÇÃO de seus correspondentes arquivos binários ou ponteiros que lhes armazenam. O processo verifica se todos os arquivos mencionados no dicionário estão localizáveis. Caso contrário, mostra uma mensagem dizendo que não encontrou determinado arquivo, e pergunta se deseja localizá-lo. O sistema abre a caixa de diálogo para que se navegue no disco em busca do arquivo "perdido". Essa possível falta de arquivos pode ser também um indicador de que algo não foi bem na carga da base, porque seu dicionário tem informações contraditórias em relação ao conteúdo da mesma. Nesse caso, da falta de um arquivo correspondente a uma variável ou ponteiro, deve-se revisar o processo de carga, olhando seu Relatório de Processo. Caso se apresente uma falta de arquivos mas que estes sejam posteriormente localizados usando a caixa de diálogos, o sistema dá uma mensagem de que não se encontraram erros na base. Entretanto, deve-se salvar o dicionário para que seja atualizada a informação da localização destes arquivos "perdidos". Relatório de Erros Gerar um relatório em que se descreve a verificação de consistência de TAMANHOS entre o dicionário e os arquivos que armazenam as entidades (ponteiros) e variáveis (arquivos .rbf). O processo verifica se todos os arquivos têm os tamanhos que deveriam ter de acordo à informação no dicionário. 40 Caso não encontre erros, o resultado desse processo é uma lista das entidades com seu respectivo número de casos. Caso contrário, o resultado apresenta o arquivo com o tamanho inconsistente, e a informação do tamanho que deveria ter (tamanho lógico) e seu tamanho real (tamanho físico). Estes erros de tamanho são indicações claras de que a base não foi carregada com precisão. Verificar se as entidades correspondentes aos registros de entrada têm o mesmo número de casos que no arquivo original (as vezes existe um equívoco na ligação das entidades com os tipos de registro). O tamanho lógico de um arquivo é calculado da seguinte maneira: Arquivo de ponteiros Cada ponteiro ocupa 4 bytes, pelo que se multiplica o número de casos da entidade mãe por 4. Quer dizer, para calcular o tamanho do arquivo de ponteiros de pessoas, multiplicar o número de domicílios por 4 (assumindo-se que a entidade pessoa seja diretamente dependente de domicílio). Arquivo de dados Dependendo de seu tipo, cada variável ocupa um certo número de bits se é INTEGER, ou alguns bytes, se é REAL ou STRING. No primeiro caso, tomar o tamanho da variável (informado no dicionário, painel de propriedades da variável) e dividir por 8, para ter seu tamanho em bytes. Em seguida, multiplicar o tamanho da variável (seja de qualquer tipo) pelo número de casos de sua entidade mãe. Por exemplo, tomemos a variável estado civil, que é de formato INTEGER e tem 4 bits. A entidade pessoa, à qual a variável pertence, tem 2.400.000 pessoas (informação existente no Relatório de Erros). O tamanho lógico do arquivo de estado civil deverá ser o resultado de 2.400.000 * 4 / 8. Nota: Em função da estratégia interna de armazenamento, pela qual se usam blocos de 4 bytes na criação dos arquivos, podem aparecer pequenas diferenças (até 4 bytes), mas o sistema não as leva em consideração, apontando somente as maiores que 4. REVISAR FREQÜÊNCIAS DE VARIÁVEIS Freqüências Para garantir o conteúdo da base de dados é necessária uma revisão na distribuição de freqüências das categorias das variáveis, e compará-las com os valores obtidos a partir do arquivo original de entrada. Este processo se executa com o módulo de Processo, usando no menu principal a opção Processos Estatísticos > Freqüências, arrastando para essa janela os nomes de todas as variáveis categorizadas do dicionário. Para as variáveis quantitativas se recomenda uma recodificação das mesmas, com o mesmo esquema usado para as freqüências do arquivo original. Nesse caso não se pode usar o processo de freqüências diretas, deve-se fazer um pequeno programa para recodificar as variáveis (DEFINE AS RECODE) e depois ter uma tabulação das recodificações (TABLE AS FREQUENCY). Relações entre entidades O conceito de estrutura hierárquica de uma base de dados R+G4 tem uma série de vantagens, entre elas a possibilidade de armazenamento das variáveis no nível adequado, sem repetição. Por exemplo, os códigos de província estão na entidade PROVINCIA, os dados do domicílio estão na entidade DOMICIL, etc. Esta hierarquia permite que uma 41 determinada tabela tenha variáveis de distintos níveis, sempre que elas estejam no mesmo ramo da árvore hierárquica. Por isso, é possível, por exemplo, ter um cruzamento de DOMICIL.AGUA por PESSOAA.SEXO, sem que o usuário final tenha que se preocupar com as diferentes entidades. Entretanto, deve-se verificar que o processo executou bem o seu trabalho de estruturação entre as entidades, e que, por exemplo, as pessoas pertençam ao domicílio adequado, que os domicílios estejam sob a província real, etc. Uma maneira simples de verificar estas relações é através de cruzamentos entre variáveis dos distintos níveis, ou com freqüências simples com quebras de área. Se recomenda fazer uma série de tabulações cruzadas entre as variáveis de entidades distintas, e compará-las com os tabulados existentes do arquivo de entrada. Este passo se executa com o módulo de Processo, usando no menu principal a opção Processos Estatísticos >Freqüências, ou >Cruzamentos, e arrastando para essa janela os nomes de todas as variáveis necessárias do dicionário, usando também a opção de AREABREAK. Exemplos TABLE uma AS FREQUENCY OF pessoa.sexo AREABREAK provincia TABLE dois AS FREQUENCY OF domicil.luz AREABREAK provincia Estas duas tabelas verificam a relação estrutural entre as províncias e pessoas, e entre as províncias e os domicílios (número de pessoas e domicílios por província). TABLE tres AS CROSSTABS OF domicil.situac BY pessoa.sexo Esta tabela verifica a relação entre os domicílios e as pessoas (número de homens e mulheres por área urbana e rural). BACK UP DA BASE O processo de back up, além de sua finalidade direta de salvar a base de dados em outro lugar, tem também uma necessidade prática para a base RG+4, dada as características internas do programa de geração: o fato de que se trabalhe com muitas variáveis (e em conseqüência, muitos arquivos) de cada vez, o processo de carga tem que fechar e depois abrir estes arquivos de gravação da base, o que fragmenta o armazenamento destes arquivos. Para eliminar essa fragmentação se recomenda o uso de um programa de compactação de arquivos (winZip, por exemplo), com os seguintes passos: Compactação Compactação dos arquivos da base (.dic, .rbf e .ptr), produzindo o arquivo compactado (.zip). Limpeza Eliminação dos arquivos da base (.dic, .rbf .ptr) do diretório (para não correr riscos desnecessários, antes copiar estes mesmos arquivos para uma área de trabalho temporária). Regeneração Descomprimir os arquivos desde o .zip para o diretório da base. Este passo funciona como um desfragmentador dos arquivos. Cópia Gravação de um (ou mais) CD-ROM ou outro meio de armazenamento com o arquivo .zip para respaldo da base. 42 Uma Volta pela Geração RESUMO DO GUIA DE CRIAÇÃO DE BASES Neste guia, você aprenderá os passos básicos para gerar uma base em R+G4. Em particular, aprenderá os conceitos de e para: · Criar um Esquema de Base · Carregar uma definição de um arquivo de entrada · Definir variáveis para as entidades · Gerar a base · Revisar o relatório do processo Guia prático: · Criar uma base a partir de um arquivo de registros simples · Criar uma base a partir de um arquivo de registros múltiplos · Criar uma base a partir de um arquivo xBase CARREGAR UMA DEFINIÇÃO DE UM ARQUIVO DE ENTRADA Quando você quiser criar uma base de dados em Redatam, deve ter dados originais que sirvam de entrada para esta geração da base. Ao começar a criação de um esquema novo parte-se com uma nova definição de estrutura hierárquica e depois se chama a janela de definição do arquivo de entrada. Para isto se seleciona a opção Dados de Entrada >Abrir definição de dados de entrada desde o menu principal. Os dados de entrada se comunicam com o esquema novo através do dicionário, que pode vir em qualquer dos formatos aceitos por R+G4 (ver formatos aceitos para o arquivo de entrada) CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE REGISTROS SIMPLES Para trabalhar este guia e os outros similares se incluiu junto com o programa R+G4 uma série de arquivos de dados para serem usados como modelo para criar bases em R+G4. Estes arquivos são os seguintes: Arquivos com os dados de entrada: C:\Program Files\redatam\Samples\simple.dat C:\Program Files\redatam\Samples\multiple.dat C:\Program Files\redatam\Samples\simple.dbf Arquivos com as definições dos dados de entrada: C:\Program Files\redatam\Samples\simple.ddf 43 C:\Program Files\redatam\Samples\multiple.ddf C:\Program Files\redatam\Samples\multiple.ddw Este guia se concentra na utilização de um arquivo de formato único como entrada e para isto se utilizará o arquivo de dados simple.dat e o arquivo de definição destes dados simple.ddf. Procedimento Passo 1 – Criar um Esquema de Base Abrir um Esquema de Base novo desde o menu principal Arquivo >Novo. Na janela que se abre deve-se começar a definir a estrutura da nova base de dados. Esta estrutura é armada agregando níveis inferiores ao nível RAIZ, que é criado automaticamente. Para agregar níveis utilize o menu dinâmico do mouse (botão direito) e selecione a opção Agregar Entidade Inferior. Em seguida digite o nome desejado na caixa agregada (até 8 caracteres). Para este exemplo, devem ser inseridos os níveis mostrados na figura. 44 Passo 2 – Carregar definição do arquivo de entrada Uma vez completada a estrutura hierárquica deve-se chamar o arquivo que será utilizado como arquivo de entrada. Para isto, não se chama diretamente o arquivo com os dados (.dat), mas sim o arquivo que guarda a definição dos dados (o dicionário). Desde o menu principal escolher Dados de Entrada >Abrir definição de dados de entrada. A definição pode vir em algum destes formatos: Arquivo xBase, IMPS4, ISSA, Chillán. Neste exemplo, se escolhe o formato Chillán e localizar o arquivo simple.ddf. Abre-se a janela de propriedades do arquivo de entrada. Esta janela mostra toda a informação relevante do arquivo de entrada, assim como também lista todas as variáveis (tipo de arquivo, formato, localização, etc.). Passo 3 – Assignação de variáveis e códigos a cada entidade 45 Para cada entidade devemos agregar as variáveis correspondentes a ela. Utilizando o mouse se toma o campo da janela da direita (propriedades do arquivo de entrada) e se arrasta até a janela da esquerda (lado direito do Esquema de Base). Na figura se mostram as variáveis telefone e rádio que são arrastadas ao nível de Hogar. Deve-se declarar a variável identificadora de cada entidade. Para aquelas entidades que contêm entidades inferiores e que são selecionáveis (por exemplo comuna, distrito, domicílio) é obrigatório que tenham uma variável definida como o código identificador. Isto se faz com o mouse sobre o nome da variável correspondente e escolhendo a opção Código de entidade desde o menu dinâmico. Ao marcar uma variável como código aparece um check ao lado da opção no menu dinâmico e aparece uma bandeirinha ao lado do nome da variável. Nem todos os níveis ou entidades devem ter variáveis identificadoras, mas SIM é obrigatório que cada entidade selecionável tenha um código identificador. Quer dizer, se a entidade é selecionável é obrigatório o código. Se uma entidade tem entidades inferiores que não são selecionáveis (por exemplo domicílio e pessoas) não é obrigatório que elas tenham um código identificador (ordenador), ainda que seja altamente recomendável que cada entidade o tenha para assim poder verificar a consistência dos registros no momento de criar a base de dados Redatam. Passo 4 – Definir cada entidade como selecionável ou não selecionável Uma vez terminada a assignação de códigos a cada entidade mostrada na janela da esquerda do Esquema de Base, deve-se definir a propriedade de selecionável ou não selecionável a cada uma. Isto se faz com o mouse posicionado sobre o nome da entidade e selecionando a opção Entidade selecionável desde o menu dinâmico, como mostra a figura. Ao marcar uma entidade como selecionável aparece um check ao lado da opção Entidade selecionável. Na figura aparecem as variáveis da entidade pessoa: ordper, sexo e ecivil. Depois aparece a janela de propriedades da variável sexo (que se abre com a opção Propriedades do menu dinâmico) para analisar ou completar sua faixa, tipo, categorias, etc. A variável sexo contém as categorias 1 para homem e 2 para mulher. A variável ordper corresponde ao código identificador da pessoa. 46 Passo 5 – Verificar consistência do Esquema de Base Uma vez terminada a assignação de variáveis e atributos das entidades se procede a verificar a consistência do dicionário e da assignação recentemente efetuada. Desde o menu principal escolha a opção Base de dados >Verificar consistência do dicionário. Passo 6 – Gerar a base de dados Procede-se a gerar a base de dados. Desde o menu principal escolha a opção Base de dados >Gerar base de dados. O sistema abre um assistente que o guia no processo de geração. Em cada página do assistente que se abre preencha a informação solicitada: Nome da Base Nome genérico da base de dados. 47 Nome do dicionário e sua localização Nome do dicionário (.dic) a ser gravado para o dicionário da base, com sua localização completa. Escreva (ou localize) o arquivo C:\Program Files\redatam\Samples\SIMPLE.DIC Compatibilidade de Versões Escreva versão 2.0 somente. Passo 7 – Definir Arquivo Original Identificador Tipo do arquivo de entrada. O tipo já vem definido desde que se abre a definição do arquivo de entrada (simples). Nome do arquivo Define o nome (localização completa) do arquivo de entrada (.dat) a ser usado na geração. Escreva (ou localize) o arquivo C:\Program Files\redatam\Samples\SIMPLE.DAT 48 Passo 8 – Definir Esquema de Identificação de Arquivos O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base. Estes arquivos necessitam ter nomes, para que possam ser referenciados propriamente pelo dicionário. O esquema de geração destes nomes pode ser: a) numeração automática; ou b) usando os nomes de entidades e variáveis. Por compatibilização com a versão anterior se usa a numeração automática. 49 Passo 9 – Selecionar Entidades a Gerar O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas deve-se estabelecer os parâmetros a seguir. Gerar Ponteiro Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta marca deve estar ligada. Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por definição, já foi estabelecido pelo sistema quando se definiu o esquema de nomes no passo anterior, mas há a possibilidade de editar este campo e mudar o nome do arquivo que armazenará os ponteiros da entidade. Verificar seqüência Para as entidades selecionáveis, escolher se o sistema deverá testar a ordem dos elementos em tempo de carga, para garantir a seqüência. Tipo de registro Para as entidades não selecionáveis, escolher o tipo de registro, definido no arquivo de entrada, como ponto de quebra que corresponderá à entidade a ser carregada. 50 Passo 10 – Selecionar Variáveis O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas, ao posicionar o mouse sobre seu nome, se listam as variáveis correspondentes. Deve-se marcar as variáveis que se deseja incluir nesta geração. Pode-se usar os botões de Selecionar Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de uma entidade. Passo Final – Gerar a Base 51 Usar o botão de Executar para iniciar a carga da base. Nesse momento, ANTES da geração propriamente dita, pode-se usar o botão de Guardar Esquema para que o mesmo possa ser reusado em caso de necessidade. Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com dados de início, previsão de término, percentagem de execução, etc. Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de Geração. Revise este relatório para comprovar que todas as variáveis foram geradas em formato Redatam de forma correta. CRIAR UMA BASE A PARTIR DE UM ARQUIVO DE REGISTROS MÚLTIPLOS Para trabalhar este guia e os outros similares foi incluído junto com o programa R+G4 uma série de arquivos de dados a serem usados como modelo para criar bases em R+G4. Estes arquivos são os seguintes: Arquivos com os dados de entrada: C:\Program Files\redatam\Samples\simple.dat C:\Program Files\redatam\Samples\multiple.dat C:\Program Files\redatam\Samples\simple.dbf Arquivos com as definições dos dados de entrada: C:\Program Files\redatam\Samples\simple.ddf C:\Program Files\redatam\Samples\multiple.ddf C:\Program Files\redatam\Samples\multiple.ddw Este guia se concentra na utilização de um arquivo de formato múltiplo como entrada e para isto se utilizara o arquivo de dados multiple.dat e o arquivo de definição destes dados multiple.ddf. De igual forma se poderia utilizar o dicionário IMPS multiple.ddw que contém a mesma informação sobre os dados de entrada, mas em outro formato (ver formatos aceitos do arquivo de entrada). Procedimento Passo 1 – Criar um Esquema de Base 52 Abrir um Esquema de Base novo desde o menu principal Arquivo >Novo. Na janela que se abre deve-se começar a definir a estrutura da nova base de dados. A estrutura é armada agregando níveis inferiores ao nível RAIZ colocado automaticamente pelo sistema. Para agregar níveis utilize o menu dinâmico do mouse (botão direito) e selecione a opção Agregar Entidade Inferior. Em seguida se escreve o nome desejado na caixa agregada (máximo de 8 caracteres). Para este exemplo, devem ser inseridos os níveis mostrados na figura. Passo 2 – Carregar definição do arquivo de entrada Uma vez completada a estrutura hierárquica deve-se chamar o arquivo que será utilizado como arquivo de entrada. Para isto, não se chama diretamente o arquivo com os dados (.dat), mas sim o arquivo que guarda a definição dos dados (o dicionário). Desde o menu principal 53 escolher Dados de Entrada >Abrir definição de dados de entrada. Neste exemplo, se escolhe o formato Chillán e localizar o arquivo multiple.ddf. Abre-se a janela de propriedades do arquivo de entrada. Esta janela mostra toda a informação relevante do arquivo de entrada, assim como também lista todas as variáveis (tipo de arquivo, formato, localização, etc.). No caso de arquivo de entrada de registros múltiplos as variáveis se ordenam por tipo de registro em páginas separadas. Em multiple.dat existem 3 tipos de registros: (1) VIVIENDA que se assignará à entidade vivienda, (2) HOGAR que se assignará à entidade hogar e (3) PESSOA que se assignará à entidade pessoa. Passo 3 – Assignação de variáveis e códigos a cada entidade Para cada entidade devemos agregar as variáveis correspondentes a ela. A figura mostra as variáveis dentro do tipo de registro VIVIENDA. 54 Utilizando o mouse se toma o campo da janela da direita (propriedades do arquivo de entrada) e se arrasta até a janela da esquerda (lado direito do Esquema de Base). Em seguida deve-se declarar a variável identificadora de cada entidade. Para aquelas entidades que contêm entidades inferiores e que são selecionáveis (por exemplo comuna, distrito, vivienda) é obrigatório que tenham uma variável ordenadora definida como o código identificador. Isto se faz com o mouse sobre o nome da variável correspondente e escolhendo a opção Código de entidade desde o menu dinâmico. Ao marcar uma variável como código aparece um check ao lado da opção no menu dinâmico e aparece uma bandeirinha ao lado do nome da variável. Nem todos os níveis ou entidades devem ter variáveis identificadoras, mas SIM é obrigatório que cada entidade selecionável tenha um código identificador. Quer dizer, se a entidade é selecionável é obrigatório o código. Se uma entidade tem entidades inferiores que não são selecionáveis (por exemplo domicílio e pessoas) não é obrigatório que elas tenham um código identificador (ordenador), ainda que seja altamente recomendável que cada entidade o tenha para assim poder verificar a consistência dos registros no momento de criar a base de dados Redatam. Passo 4 – Definir cada entidade como selecionável ou não selecionável Uma vez terminada a assignação de códigos a cada entidade mostrada na janela da esquerda do Esquema de Base, deve-se definir a propriedade de selecionável ou não selecionável a 55 cada uma. Isto se faz com o mouse posicionado sobre o nome da entidade e selecionando a opção Entidade selecionável desde o menu dinâmico, como mostra a figura. Ao marcar uma entidade como selecionável aparece um check ao lado da opção Entidade selecionável. Neste exercício todas as entidades geográficas são selecionáveis e VIVIENDA, HOGAR e PERSONA são NÃO selecionáveis. Passo 5 – Verificar consistência do Esquema de Base Uma vez terminada a assignação de variáveis e atributos das entidades se procede a verificar a consistência do dicionário e da assignação recentemente efetuada. Desde o menu principal escolha a opção Base de dados >Verificar consistência do dicionário. Passo 6 – Gerar a base de dados Procede-se a gerar a base de dados. Desde o menu principal escolha a opção Base de dados >Gerar base de dados. O sistema abre um assistente que o guia no processo de geração. Em cada página do assistente que se abre preencha a informação solicitada: Nome da Base Nome genérico da base de dados. Nome do dicionário e sua localização Nome do dicionário (.dic) a ser gravado para o dicionário da base, com sua localização completa. Escreva (ou localize) o arquivo C:\Program Files\ redatam\ Samples\ MULTIPLE.DIC Compatibilidade de Versões Escreva versão 2.0 somente. Passo 7 – Definir Arquivo Original Identificador Tipo do arquivo de entrada. O tipo já vem definido desde que se abre a definição do arquivo de entrada (múltiplo). Nome do arquivo Define o nome (localização completa) do arquivo de entrada (.dat) a ser usado na geração. Escreva (ou localize) o arquivo C:\Program Files\redatam\Samples\multiple.dat Passo 8 – Definir Esquema de Identificação de Arquivos O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base. 56 Estes arquivos necessitam ter nomes, para que possam ser referenciados propriamente pelo dicionário. O esquema de geração destes nomes pode ser: a) numeração automática; ou b) usando os nomes de entidades e variáveis. Por compatibilização com a versão anterior se usa a numeração automática. Passo 9 – Selecionar Entidades a Gerar O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas deve-se estabelecer os parâmetros a seguir. Gerar Ponteiro Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta marca deve estar ligada. Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por definição, já foi estabelecido pelo sistema quando se definiu o esquema de nomes no passo anterior, mas há a possibilidade de editar este campo e mudar o nome do arquivo que armazenará os ponteiros da entidade. Verificar seqüência Para as entidades selecionáveis, escolher se o sistema deverá testar a ordem dos elementos em tempo de carga, para garantir a seqüência. Tipo de registro Para as entidades não selecionáveis (VIVIENDA, HOGAR e PERSONA), escolher o tipo de registro, definido no arquivo de entrada, como ponto de quebra que corresponderá à entidade a ser carregada. 57 Passo 10 – Selecionar Variáveis O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas, ao posicionar o mouse sobre seu nome, se listam as variáveis correspondentes. Deve-se marcar as variáveis que se deseja incluir nesta geração. Pode-se usar os botões de Selecionar Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de uma entidade. Passo Final – Gerar a Base 58 Usar o botão de Executar para iniciar a carga da base. Nesse momento, ANTES da geração propriamente dita, pode-se usar o botão de Guardar Esquema para que o mesmo possa ser reusado em caso de necessidade. Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com dados de início, previsão de término, percentagem de execução, etc. Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de Geração. Revise este relatório para comprovar que todas as variáveis foram geradas em formato Redatam de forma correta. CRIAR UMA BASE A PARTIR DE UM ARQUIVO XBase Para trabalhar este guia e os outros similares se incluiu junto com o programa R+G4 uma série de arquivos de dados para serem usados como modelo para criar bases em R+G4. Estes arquivos são os seguintes: Arquivos com os dados de entrada: C:\Program Files\redatam\Samples\simple.dat C:\Program Files\redatam\Samples\multiple.dat C:\Program Files\redatam\Samples\simple.dbf Arquivos com as definições dos dados de entrada: C:\Program Files\redatam\Samples\simple.ddf C:\Program Files\redatam\Samples\multiple.ddf C:\Program Files\redatam\Samples\multiple.ddw Este guia se concentra na utilização de um arquivo de formato único e DBF como entrada e para isto se utilizará o arquivo de dados simple.dbf. Este arquivo leva implícita a definição dos dados e não se requer portanto outro arquivo externo com a definição ou dicionário de dados (ver formatos aceitos do arquivo de entrada). Procedimento Passo 1 – Criar um Esquema de Base Abrir um Esquema de Base novo desde o menu principal Arquivo >Novo. Na janela que se abre deve-se começar a definir a estrutura da nova base de dados. A estrutura é armada agregando níveis inferiores ao nível RAIZ colocado automaticamente pelo sistema. Para agregar níveis utilize o menu dinâmico do mouse (botão direito) e selecione a opção Agregar Entidade Inferior. Em seguida se escreve o nome desejado na caixa agregada (máximo de 8 caracteres). 59 Para este exemplo, devem ser inseridos os níveis mostrados na figura. Passo 2 – Carregar definição do arquivo de entrada Uma vez completada a estrutura hierárquica deve-se chamar o arquivo que será utilizado como arquivo de entrada. Para isto, como a definição e os dados em DBF estão no mesmo arquivo, chama-se diretamente o arquivo com os dados (.dbf). Desde o menu principal escolher Dados de Entrada >Abrir definição de dados de entrada. Neste exemplo, se escolhe o formato xBase e localizar o arquivo simple.dbf . Abre-se a janela de propriedades do arquivo de entrada. Esta janela mostra toda a informação relevante do arquivo de entrada, assim como também lista todas as variáveis (tipo de arquivo, formato, localização, etc.). 60 No caso de arquivo de entrada de tipo DBF as variáveis são listadas todas juntas numa mesma página. 61 Passo 3 – Assignação de variáveis e códigos a cada entidade Para cada entidade devemos agregar as variáveis correspondentes a ela. Utilizando o mouse se toma o campo da janela da direita (propriedades do arquivo de entrada) e se arrasta até a janela da esquerda (lado direito do Esquema de Base). Em seguida deve-se declarar a variável identificadora de cada entidade. Para aquelas entidades que contêm entidades inferiores e que são selecionáveis (por exemplo comuna, distrito, vivienda) é obrigatório que tenham uma variável ordenadora definida como o código identificador. Isto se faz com o mouse sobre o nome da variável correspondente e escolhendo a opção Código de entidade desde o menu dinâmico. Ao marcar uma variável como código aparece um check ao lado da opção no menu dinâmico e aparece uma bandeirinha ao lado do nome da variável. Por exemplo: Entidade MANZENT código identificador é MANZENT Entidade VIVIENDA código identificador é ORDVIV Entidade PERSONA código identificador é ORDPER Quando se trata de um arquivo DBF, as variáveis trazem a informação mínima (tipo, tamanho e posição). Para não escrever uma faixa exagerada na base de dados é conveniente editar as propriedades da variável e corrigir a faixa, agregar as categorias correspondentes e os valores para Não Aplica. 62 A faixa assumida por default depende do tamanho que é informado para essa variável, por exemplo, se uma variável extraída de um arquivo DBF, como AGUA, ocupa um campo de 4 caracteres, essa variável terá uma faixa de 0 – 9999 ainda que em realidade os valores somente sejam de 0 – 5. Como mostra a figura deve-se editar esta informação na janela de propriedades da variável. Nem todos os níveis ou entidades devem ter variáveis identificadoras, mas SIM é obrigatório que cada entidade selecionável tenha um código identificador. Quer dizer, se a entidade é selecionável é obrigatório o código. Se uma entidade tem entidades inferiores que não são selecionáveis (por exemplo domicílio e pessoas) não é obrigatório que elas tenham um código identificador (ordenador), ainda que seja altamente recomendável que cada entidade o tenha para assim poder verificar a consistência dos registros no momento de criar a base de dados Redatam. Passo 4 – Definir cada entidade como selecionável ou não selecionável Uma vez terminada a assignação de códigos a cada entidade mostrada na janela da esquerda do Esquema de Base, deve-se definir a propriedade de selecionável ou não selecionável a cada uma. Isto se faz com o mouse posicionado sobre o nome da entidade e selecionando a opção Entidade selecionável desde o menu dinâmico, como mostra a figura. Ao marcar uma entidade como selecionável aparece um check ao lado da opção Entidade selecionável. Neste exercício todas as entidades geográficas são selecionáveis e VIVIENDA, HOGAR e PERSONA são NÃO selecionáveis. 63 Passo 5 – Verificar consistência do Esquema de Base Uma vez terminada a assignação de variáveis e atributos das entidades se procede a verificar a consistência do dicionário e da assignação recentemente efetuada. Desde o menu principal escolha a opção Base de dados >Verificar consistência do dicionário. Passo 6 – Gerar a base de dados Procede-se a gerar a base de dados. Desde o menu principal escolha a opção Base de dados >Gerar base de dados. O sistema abre um assistente que o guia no processo de geração. Em cada página do assistente que se abre preencha a informação solicitada: Nome da Base Nome genérico da base de dados. Nome do dicionário e sua localização Nome do dicionário (.dic) a ser gravado para o dicionário de la base, com sua localização completa. Escreva (ou localize) o arquivo C:\Program Files\ redatam\ Samples\ DBF.DIC Compatibilidade de Versões Escreva versão 2.0 somente. Passo 7 – Definir Arquivo Original Identificador Tipo do arquivo de entrada. O tipo já vem definido desde que se abre a definição do arquivo de entrada (dbf). Nome do arquivo Define o nome (localização completa) do arquivo de entrada (.dbf) a ser usado na geração. Escreva (ou localize) o arquivo C:\Program Files\ redatam\ Samples\ DBF.DIC Passo 8 – Definir Esquema de Identificação de Arquivos O processo de carga gera uma série de arquivos de dados (.rbf) correspondentes às variáveis da base, e outra série de arquivos de ponteiros (.ptr) correspondentes às entidades da base. Estes arquivos necessitam ter nomes, para que possam ser referenciados propriamente pelo dicionário. O esquema de geração destes nomes pode ser: a) numeração automática; ou b) usando os nomes de entidades e variáveis. Por compatibilização com a versão anterior se usa a numeração automática. 64 Passo 9 – Selecionar Entidades a Gerar O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas deve-se estabelecer os parâmetros a seguir. Gerar Ponteiro Marca para gerar o arquivo de ponteiro (.ptr) correspondente. Em geral esta marca deve estar ligada. Nome do arquivo Define o nome (passo completo) do arquivo de ponteiro. Este nome, por definição, já foi estabelecido pelo sistema quando se definiu o esquema de nomes no passo anterior, mas há a possibilidade de editar este campo e mudar o nome do arquivo que armazenará os ponteiros da entidade Verificar seqüência Para as entidades selecionáveis, escolher se o sistema deverá testar a ordem dos elementos em tempo de carga, para garantir a seqüência. 65 Passo 10 – Selecionar Variáveis O painel mostra a lista de entidades existentes no Esquema de Base, e para cada uma delas, ao posicionar o mouse sobre seu nome, se listam as variáveis correspondentes. Deve-se marcar as variáveis que se deseja incluir nesta geração. Pode-se usar os botões de Selecionar Todas e Deselecionar Todas para marcar ou desmarcar todas as variáveis de uma entidade. Passo Final – Gerar a Base Usar o botão de Executar para iniciar a carga da base. Nesse momento, ANTES da geração propriamente dita, pode-se usar o botão de Guardar Esquema para que o mesmo possa ser reusado em caso de necessidade. Ao iniciar a Geração o sistema mostra uma janela de acompanhamento do processo, com dados de início, previsão de término, percentagem de execução, etc. Ao terminar o processo o sistema mostra uma janela com o Relatório do Processo de Geração. Revise este relatório para comprovar que todas as variáveis foram geradas em formato Redatam de forma correta. Menus MENU PRINCIPAL O menu principal (algumas vezes o chamamos de barra principal) tem as seguintes funções: Arquivo Maneja todas as operações que têm relação com abrir, fechar, o Esquema de Base. Base de Dados Para gerar a base. 66 Dados de Origem Para a conexão com as propriedades do arquivo de entrada. Janela Ordena as janelas. Ajuda Entrega ajuda ao usuário para manejar o programa, inclui informação sobre o programa, número de versão, endereço para contato, etc. MENU DE ARQUIVO O menu de Arquivo se compõe das seguintes funções: Novo Abrir um novo Esquema de Base para geração. O sistema mostra (1) a janela de um Esquema de Base vazio, com a entidade "raiz". Abrir Para abrir um Esquema de Base existente. O sistema mostra a caixa de diálogo para localizar o arquivo .wip desejado. É possível também selecionar diretamente o arquivo .wip desde o menu Arquivo, desde que ele esteja entre os quatro últimos arquivos .wip usados (seu nome aparece ao final da lista no menu (1) Arquivo). Fechar Fechar o Esquema de Base existente na tela. Salvar Salvar o Esquema de Base existente na tela. Salvar como… Salvar o Esquema de Base com outro nome. O sistema abre a (2) caixa de diálogo para determinar o nome e o diretório de saída. (2) (2) Imprimir Imprimir o Esquema de Base. Configurar Impressora Definir os parâmetros da impressora. Preferências Abrir a janela de preferências que regem o programa R+G4. Estas preferências incluem o idioma, a chave secreta da base de dados, o tipo de fonte, etc. Notas: (1) Disponível somente quando NÃO exista um Esquema de Base aberto. (2) Disponível somente quando SIM exista um Esquema de Base aberto. MENU DE BASE DE DADOS O menu de base de dados se relaciona com a base de dados a gerar, e se compõe das seguintes funções: Verificar Consistência Consistência da informação existente no Esquema de Base, com relação aos parâmetros das entidades e variáveis. Criar Bases de Dados Executa o processo de geração. Apresentação Seleciona o modo Horizontal ou Vertical para mostrar os painéis de entidades e variáveis do Esquema de Base. No modo Horizontal, o painel de entidades está "sobre" o painel de variáveis, enquanto que no modo Vertical (default) os painéis estão lado a lado. 67 Propriedades Janela de propriedades da entidade ou da variável (dependendo de onde esteja o cursor, sobre o nome de uma entidade ou de uma variável). MENU DO ARQUIVO DE ENTRADA O menu de Dados de Entrada se relaciona com o arquivo e as propriedades dos dados a utilizar como entrada para a geração de bases Redatam, e se compõe das seguintes funções: Abrir Definição Para um Esquema de Base que todavia não esteja conectado com um Arquivo de entrada, o sistema mostra os possíveis formatos de definição de variáveis (ou dicionários). Remover Definição Desconectar a definição dos dados de entrada do Esquema de Base. Se supõe que houve uma equivocação na eleição do arquivo de entrada. Nesse caso, todas as variáveis que já existam no Esquema de Base serão também eliminadas, porque se perde a conexão destas variáveis com o arquivo de entrada. Mostrar Definição Para ver a janela de propriedades do arquivo de entrada (ao abrir um Esquema de Base o sistema não mostra automaticamente esta janela). Editar Definição Para modificar o arquivo de definição dos dados de entrada (Chillán .ddf). Este editor é a única maneira de modificar de forma definitiva a informação na definição do arquivo de entrada desde una sessão de geração. Outra forma é editar o arquivo de definição desde um editor externo. MENU DINÂMICO (POPUP) DE ENTIDADES Este menu aparece ao dar um clique com o mouse direito sobre o nome de uma Entidade no Esquema de Base. Tem as seguintes funções: Renomear Mudar o nome da entidade. Agregar entidade inferior Criar uma nova entidade dependente da entidade assinalada. Por exemplo, embaixo da entidade "raiz", criar a entidade de Regiao. Inserir entidade irmã Criar uma nova entidade paralela à entidade assinalada, quer dizer, no mesmo nível, sem dependência da entidade assinalada. Essa função cria um novo ramo no Esquema de Base. Deletar entidade Deletar a entidade assinalada do Esquema de Base. Cortar ramo Cortar o ramo do Esquema de Base. A entidade assinalada, e todas suas entidades inferiores serão cortadas do Esquema (e copiadas para a área de transferência). Esta função é usada para eliminar todo um ramo do Esquema, ou também para mover um ramo de lugar na árvore do Esquema (depois de Cortar o ramo, usar a função Colar ramo). Colar ramo embaixo Colar o ramo guardado na área de transferência embaixo da entidade assinalada. 68 Cola ramo antes de Colar o ramo guardado na área de transferência antes da entidade assinalada. Selecionável Marcar (ou desmarcar) a entidade como selecionável. As entidades selecionáveis tem uma marca ao lado esquerdo desta função no menu. MENU DINÂMICO (POPUP) DE VARIÁVEIS Este menu aparece com um clique do mouse direito sobre o nome de uma Variável no Esquema de Base. Tem as seguintes funções: Informação Abre a janela de informações sobre a variável. Renomear Mudar o nome da variável. Código entidade Para marcar (ou desmarcar) a variável assinalada como a variável que contém os códigos dos elementos de entidade. Por exemplo, "18", "23", etc, são os códigos das províncias, e estarão armazenados nesta variável. Nesse caso, a entidade deve ser selecionável, e esta variável tem que ser de tipo STRING. Estas variáveis têm uma marca de uma bandeira no Esquema de Base, e uma marca ao lado esquerdo desta função no menu. Nome entidade Para marcar (ou desmarcar) a variável assinalada como a variável que contém os nomes dos elementos de entidade. Por exemplo, "Valdivia", "Alicante", etc., são os nomes das províncias, e estarão armazenados nesta variável. Nesse caso, a entidade deve ser selecionável, e esta variável tem que ser de tipo STRING. Estas variáveis tem uma marca especial (alfanumérica) no Esquema de Base, e uma marca ao lado esquerdo desta função no menu. Deletar variável Deletar a variável assinalada do Esquema de Base. Verificar valor Para executar o processo de freqüências de categorias da variável. Verificar Máximo Para executar o processo de valores máximos e mínimos da variável. Propriedades Mostrar a janela de propriedades da variável. Tem o mesmo efeito que um duplo clique no nome da variável. MENU DINÂMICO (POPUP) DE CAMPOS Este menu aparece com um clique do mouse direito sobre o nome de um campo na janela de propriedades do arquivo de entrada. Tem as seguintes funções: Selecionar Tudo Selecionar todos os campos. Os nomes dos campos estarão destacados em azul (se não foi modificado o esquema de cores das janelas de Windows). Tem o mesmo efeito que um clique no primeiro campo e um Shift-clique no último campo. Usado quando se quer arrastar todos os campos para uma Entidade no Esquema de Base. Mostrar campos referidos Para destacar quais campos já estão referidos (já foram arrastados) para o Esquema de Base. Verificar valor Para executar o processo de freqüências de categorias do campo. Verificar máximo Para executar o processo de valores máximos e mínimos do campo. 69 Propriedades Mostrar a janela de propriedades dos campos de entrada. Tem o mesmo efeito que um duplo-clique no nome do campo. Janelas JANELA DO ESQUEMA DE BASE Esta janela está conectada a um arquivo .wip que guarda o Esquema de Base. Ela aparece quando se abre um Esquema de Base, novo ou já existente. Se é um Esquema novo, a janela estará vazia, somente com a entidade "raiz", caso contrário a janela refletirá o conteúdo do arquivo .wip aberto. A janela possui dois painéis, um para as entidades e outro para as variáveis da entidade. Estes painéis são apresentados de acordo à opção escolhida no menu principal em Base de Dados >Apresentação. Sua forma e função são muito similares à janela do Dicionário de Dados de uma base, no módulo de Processo do R+G4. Painel de Entidades Mostra a estrutura do Esquema de Base, e as relações entre as entidades. Para manipular este painel use o menu dinâmico de entidades (ver menu dinâmico de entidades). Painel de Variáveis Mostra a lista de variáveis associadas à entidade assinalada no painel de entidades. Para manipular as variáveis deste painel, use o menu dinâmico de variáveis. JANELA DE PROPRIEDADES DO ARQUIVO DE ENTRADA Esta janela está conectada a um arquivo de definição dos dados de entrada (.ddf), ou a um dicionário em formato suportado por R+G4, tais como xBase, IMPS 4.1 e CSPro (ISSA). Esta janela se abre por primeira vez quando chamamos o arquivo de entrada com a opção Dados de Entrada >Abrir Definição. Depois, cada vez que se deseja usar esta janela a abrimos com a opção Dados de Entrada >Mostrar Definição, desde o menu principal. A janela possui dois painéis superpostos, Geral e Campos, comandados pela barra superior. Painel "Geral" Este painel traz informações sobre o tipo de arquivo de dados de entrada, seu nome e localização, e o arquivo que contém a descrição de suas variáveis (i.e., dicionário ou definição .ddf). Esta informação está organizada em três blocos dentro da janela: Tipo de Arquivo 70 de Dados Traz a informação do formato do arquivo de entrada (ASCII1 para registro simples, ASCIIM para registro múltiplo, DBF para arquivo xBase, ISSA para formato ISSA ou IMPS4 para formato IMPS). Traz também um identificador, que será usado na definição das variáveis no Esquema de Base, para especificar as variáveis provenientes desse arquivo. Estas informações NÂO podem ser modificadas pelo usuário. Dicionário do Arquivo Nome do arquivo que tem a definição das variáveis e campos do arquivo de entrada. Arquivo de Dados Nome e localização do arquivo de dados, e uma marca para informar se o mesmo se encontra disponível em disco. De não estar disponível, usar o botão de navegação à direita para localizar o arquivo. Painel "Campos" Este painel traz informação sobre os tipos de registros existentes no arquivo de entrada, e seus campos. Se ASCII1 ou DBF, somente existirá um tipo de registro, e o bloco superior desta janela é desnecessário (não aparece). Se ASCIIM, este bloco traz a informação do campo identificador do tipo de registro, e a lista com os tipos de registros informados. Tipos de registros Posição Posição, no arquivo de entrada, do campo que define o tipo de registro. Tamanho Tamanho do campo de tipo de registro (em geral é 1). Valor Valor do campo de tipo de registro para o registro informado na caixa de tipos. Por exemplo, "1" para o registro de domicílio, e "2" para pessoa. Caixa de tipos Esta lista mostra os tipos de registro existentes no arquivo de entrada. Em geral existe sempre um "tipo" de registro adicional (o tipo "Common"), que apesar de não ser estritamente um tipo de registro, é usado para referir-se aos campos comuns a todos os tipos de registro (por exemplo, identificação geográfica). Para este "tipo de registro" a informação de Valor está em branco. Tabela de Campos Esta tabela contém a lista dos campos existentes em cada tipo de registro apontado pela caixa de tipos, com seu nome e descrição (rótulo). Para manipular este painel use o Menu dinâmico (popup) de campos . JANELA DE PROPRIEDADES DA VARIÁVEL Esta janela aparece quando se usa o menu dinâmico no nome de uma variável no Esquema de Base. Ela tem três painéis superpostos, Geral, Especificações Técnicas, e Documentação, comandados pela barra superior. A janela é usada para verificar e modificar as características da variável a ser carregada na base de dados. Painel "Geral" 71 Tem dois tipos de informação, o rótulo da variável e suas categorias. O rótulo aparece numa caixa de edição, e que pode ser modificado. As categorias são apresentadas numa tabela, contendo o código e a descrição de cada categoria. Pode-se agregar elementos (categorias) a essa tabela, assim como eliminá-los, eliminar toda a lista, além de poder modificar seu conteúdo. O rótulo da variável e suas categorias serão aqueles que aparecerão no dicionário final de dados. A ordem das categorias no dicionário (e nos resultados dos programas) será a mesma em que aparecem na tabela. Painel "Especificações Técnicas" Para a definição das características de geração da variável. Tipo Pode ser INTEGER (mais comum), REAL (para as variáveis com ponto decimal ou com valor negativo), ou STRING (para as alfanuméricas ou as variáveis de códigos da entidade). Tamanho Somente para o tipo STRING, informa o tamanho em bytes da variável. Faixas Informa o limite mínimo e máximo dos valores possíveis para a variável. Valores fora desse intervalo que apareçam no arquivo de entrada, serão transformados, em tempo de carga, para o valor informado em Valor Omitido (Missing). Variáveis de tipo STRING não têm faixas. Decimais Somente para o tipo REAL, apresenta o número de decimais da variável. Não se Aplica Valor que o sistema assignará aos casos em que o valor original se apresente como branco. O default é o limite máximo mais 1. Como não existe verificação de faixas para as variáveis de tipo STRING, estas não necessitam a informação de Não se Aplica. Valor Omitido Valor que o sistema assignará aos casos em que o valor original se apresente fora da faixa aceitável. O valor default é o limite máximo mais 2. Como não existe verificação de faixas para as variáveis de tipo STRING, estas não necessitam a informação de Valor Omitido. Arquivo Original A seção seguinte traz informações copiadas diretamente do campo fonte da variável, encontrado no Arquivo Original. Estas informações NÃO podem ser modificadas, com exceção da Posição Relativa e Tamanho da variável. Existe também um botão de Propriedades, para mostrar a janela de propriedades do campo de entrada. Posição relativa Deslocamento da variável com relação AO INICIO do campo. Em geral este valor é 1, o que significa que a variável começa no inicio do campo original. Este campo é usado quando se quer criar uma variável que comece no meio do campo de entrada (ver Relações entre .WIP e .DDF). Tamanho Tamanho da variável segundo o arquivo de entrada e de onde será extraída a variável. Em geral é o tamanho do campo original, mas há casos em que se deseja um tamanho menor (por exemplo, quando se deseja um subcampo para gerar a variável). Propriedades Botão para mostrar a janela com informações do campo original. Painel "Documentação" Para informações adicionais sobre a variável. Alias Nome pelo qual a variável será conhecida nos resultados das listas de área produzidas por R+G4. 72 Grupo Identificação do grupo ao qual pertence a variável. Usado para agrupar variáveis de um mesmo tema (por exemplo, Fecundidade). Documentação Texto livre para descrição de outras informações necessárias para o futuro usuário da base, tais como unidade de medida, período de referência, casos excepcionais, etc. JANELA DE PROPRIEDADES DOS CAMPOS DE ENTRADA Esta janela aparece quando se usa o menu dinâmico sobre o nome de um campo no Arquivo de entrada, ou se usa o botão de Propriedades na janela de variáveis. As seções mostram informação sobre o nome do campo, seu rótulo, o registro ao qual pertence, seu deslocamento e tamanho. A janela é usada para verificar estas características e modificar os valores usados para o Missing e o Não se Aplica. Não se Aplica Define o valor de Não se Aplica no arquivo de entrada. (Note que o valor a ser assignado ao Não se Aplica na base de dados deve ser definido na janela de propriedades da variável, e que este valor pode ser diferente do valor dado para o campo de entrada.) Exemplo: Se o valor de Não se Aplica = * no arquivo de entrada, um * aparecerá naquele campo. Se você quiser usar o número 9 para representar o valor Não se Aplica para este campo na base de dados que você está criando, você deve colocar um 9 no campo apropriado na janela de propriedades da variável. Valor Omitido Define o valor que simboliza a falta de informação (Missing) no arquivo de entrada. (Note que o valor a ser assignado ao Missing na base de dados deve ser definido na janela de propriedades da variável e que este valor pode ser diferente do valor dado para o campo de entrada. Branco é Não se Aplica (Branco é Omitido). Estes botões definem o tratamento que se dará aos brancos existentes no arquivo de entrada. Branco é Não se Aplica significa que aos campos em branco será assignado o valor informado na caixa de Não se Aplica. Caso contrário o branco será tratado como um valor fora de faixa (default). No arquivo DDF de definição, pode-se usar a cláusula BLANK = MISSING ou BLANK = NotApplicable. As modificações nestes campos só têm validade dentro da sessão. Para que estas tenham uma modificação definitiva, é necessário faze-las com o Editor de definições do arquivo de entrada ou modificá-las diretamente na janela de propriedades de variáveis. Campos de dois ou mais bytes: Se os valores de Não se Aplica e/ou Missing são alfanuméricos, eles devem ser representados com o mesmo tamanho do campo. Por exemplo, se o campo é de dois bytes e o valor para Não se Aplica é um asterisco, este parâmetro deve ser indicado como Not Applicable= *, ao invés de =*. 73 Facilidades Adicionais FREQÜÊNCIAS DE CAMPOS Para poder determinar as categorias de uma variável (e sua faixa), as vezes é conveniente verificar seus valores no arquivo de entrada. O módulo de Geração proporciona esta facilidade através de seu menu dinâmico, com o cursor posicionado sobre o nome de uma variável no Esquema de Base, ou sobre um campo na janela de propriedades do arquivo de entrada. Eleger a opção Verificar Valores e o sistema passa a ler o arquivo original de entrada, mostrando a janela de acompanhamento do processo. A qualquer momento pode-se pressionar o botão de Abortar para terminar o processo, e o sistema ainda assim mostra o resultado dos casos lidos até aquele momento. Esta opção mostra os códigos existentes para a variável, com seus respectivos número de casos, e o número total de casos no arquivo (ou até a interrupção da leitura). Para as variáveis quantitativas, por exemplo variáveis de rendimento, superfície, fatores de expansão, etc., para as quais não tem sentido uma distribuição de freqüências, mas sim uma verificação de seus valores mínimo e máximo, usar a opção de Verificar máximo.... VALORES MÍNIMOS E MÁXIMOS Para poder determinar as faixas de uma variável, as vezes é conveniente conhecer seus limites mínimo e máximo. O módulo de Geração proporciona esta facilidade através de seu menu dinâmico, com o cursor posicionado sobre o nome de uma variável no Esquema de Base, ou sobre um campo na janela de propriedades do Arquivo de Entrada. Eleger a opção Verificar Máximo e o sistema passa a ler o arquivo original de entrada, mostrando a janela de acompanhamento do processo. A qualquer momento pode-se pressionar o botão de Abortar para terminar o processo, e o sistema ainda assim mostra o resultado dos casos lidos até aquele momento. Esta opção mostra os valores mínimo e máximo para a variável, com seus respectivos número de casos, o número de casos em branco, e o número total de casos no arquivo (ou até a interrupção da leitura). Para observar os valores das categorias da variável, usar a opção de Verificar valores (ver Freqüências de campos). VERIFICAR A CONSISTÊNCIA DO ESQUEMA DE BASE No menu principal eleger Base de Dados >Verificar Consistência. Este processo, executado automaticamente sempre antes do processo de Geração e antes de salvar o Esquema de Base, faz uma verificação de toda a informação existente no Esquema de Base, e mostra uma caixa de mensagens com os erros, caso existam. Estes podem ser de natureza lógica, como por exemplo, entidades selecionáveis sem as respectivas variáveis de código, ou de outro tipo, como a falta de limites definidos para uma variável numérica. 74 Além dos erros, o sistema também mostra a lista de advertências, que não impedem a continuação do processo de carga ou de guardar o Esquema. A diferença entre uma advertência e um erro é determinada pelo símbolo que aparece ao lado esquerdo da lista de mensagens: o símbolo de exclamação denota uma advertência, enquanto que o símbolo de Parar (STOP) denota um erro. SALVAR E CARREGAR ESQUEMA DE GERAÇÃO É raro que um processo de Geração de Base se execute só uma vez: os erros podem suceder com muita freqüência, tais como os detalhes de posicionamento (ou tamanho) dos campos, uma má definição de faixas, ou mesmo uma execução de prova com um arquivo menor. Com o objetivo de otimizar as tarefas manuais de geração, eliminando a necessidade de reingressar os parâmetros de carga da base, podemos usar os botões de Salvar Esquema e depois Carregar Esquema para as re-execuções do processo. Ao final da primeira vez que se executa o processo, ANTES da execução propriamente dita, aperta-se o botão de Salvar Esquema, o qual abre a janela de diálogo para escolher o arquivo (extensão .LSD de Load Scheme Definition) que irá armazenar todos os parâmetros definidos nos passos de carga. Como detalhe adicional, este arquivo tem um formato tipo Chillán. Ao re-executar o processo de carga, ANTES de começar a eleger os parâmetros, usar o botão de Carregar Esquema, que abre a janela de diálogo para que se escolha o nome do arquivo de esquema previamente salvado. Ainda que se use um Esquema de Geração, durante o processo de geração é necessário seguir com o botão de Avançar até o último painel (passo), quando aparece o botão de Executar. EDITAR A DEFINIÇÃO DE UM ARQUIVO DE ENTRADA Esta função é acionada pelo menu principal em Dados de Entrada >Editar arquivo de dicionário de dados. O editor é a única maneira de modificar de forma definitiva a informação no dicionário (.ddw) ou definição (.ddf) do arquivo de entrada. Todas as modificações que se façam através da janela de propriedades do arquivo de entrada serão válidas somente durante a sessão de trabalho e não serão guardadas na definição original. O sistema mostra a caixa de diálogos para localizar o arquivo com o dicionário (.ddw) ou definição (.ddf), e em seguida abre uma janela com um editor livre que tem as ferramentas normais de edição de texto. Para guardar as modificações use o menu principal em Arquivo, com Salvar para salvar com o mesmo nome, ou Salvar Como… para salvar com outro nome. 75 MODIFICANDO AS PROPRIEDADES DE VARIÁVEIS E CAMPOS DE ENTRADA Para modificar as características das variáveis do Esquema de Base, ou dos campos do arquivo de entrada, usar as respectivas janelas de propriedades (Propriedades da Variável e Propriedades do Arquivo Original). Por exemplo, quando o módulo de Consistência do Esquema de Base aponta a falta de limites para a variável SEXO, deve-se editar essa variável e informar-lhe os limites. Todos os câmbios que se façam no Esquema de Base são guardados no arquivo .wip (com a opção de Salvar no menu principal). A janela de propriedades do arquivo de entrada também permite modificar algumas características, tais como os valores para Missing e Não se Aplica, e o tratamento que se dará aos campos em "Branco" no arquivo de entrada. Porém, estas modificações executadas na janela de propriedades do arquivo de entrada são temporárias, só serão válidas durante a sessão, porque o sistema não permite que se modifique a definição do arquivo de entrada, a não ser que se utilize o editor de definição do arquivo de entrada. Depois de arrastar o campo para o Esquema de Base, as informações sobre o campo são traspassadas para a variável. Ainda que se façam modificações nas características desse campo na definição do arquivo de entrada (com exceção de sua posição de início no registro), estas não serão repassadas para a variável, quer dizer, se por algum motivo for necessário mudar as características de um campo, se esse campo já foi passado para o Esquema de Base, deve-se deletar a variável e arrastá-la de novo. Preferências PREFERÊNCIAS GERAIS Nas preferências gerais existem modificações de apresentação e de localização de arquivos. · Pode-se optar por mostrar (ou não) a janela de referência a R+G4 cada vez que começa o programa. Um ü nesta opção não mostra a referência. · Pode-se optar por abrir automaticamente (ou não) a última base de dados usada quando comece o programa. Um ü nesta opção abre a última base trabalhada. · Pode-se modificar o diretório de trabalho por default. Clique sobre o ícone ao lado da caixa para localizar o diretório desejado. Ver também Diretório do Projeto 76 PREFERÊNCIAS DE IDIOMA R+G4 possui interfaces de usuário em espanhol, português e inglês, e pode-se passar de uma a outra em qualquer momento. Além disso, foi desenhado para facilitar de maneira simples e sistemática a tradução a qualquer outro idioma. Passos para mudar de idioma: · No menu principal, clique Arquivo >Preferências. · Selecione o painel Idioma. · Selecione o idioma desejado com um clique sobre a bandeira do idioma. · Guarde as modificações realizadas. Nota: Se a caixa do arquivo multiidioma está vazia, isto significa que o arquivo que contém a base de dados multilingüe (arquivo R+G4Process.wxd) não está definido. Localize-o no diretório onde se instalou R+G4, com um clique no ícone de busca . PREFERÊNCIAS DE FONTE Nas preferências de fonte se modifica o tipo e tamanho da fonte a utilizar nas distintas instâncias de saída e edição dentro do programa. Isto é, a fonte para mostrar um texto em: · Janela · Edição · Separação fixa, quer dizer, todas as letras ocupam o mesmo espaço · Impressão e selecionando a fonte e o A fonte é modificada com um clique sobre o botão de busca tamanho desejados dentro das opções apresentadas na janela de diálogo. de processos rápidos e nos assistentes de programação. Eliminação de Filtros da lista Primeiro selecione o filtro na lista, pressionando a flecha vertical direita, até que o rótulo do filtro apareça, e use o mouse esquerdo para selecioná-lo. Depois pressione o botão de "Eliminar". Para que as modificações sejam efetuadas é necessário pressionar o botão de "Salvar" na barra de ferramentas. 77 Index . .bin ................................................................................................................................................. 18 .dat ........................................................................................................................................... 20, 23 .dbf ........................................................................................................................................... 20, 23 .ddf ......................................................................................................................... 20, 22, 32, 68, 70 .ddw ......................................................................................................................................... 31, 68 .dic ................................................................................................................................................. 20 .ptr.......................................................................................................................... 13, 15, 17, 20, 37 .rbf...................................................................................................................................... 19, 20, 37 .wip ........................................................................................................................ 20, 22, 33, 34, 70 A Abrir definição................................................................................................................................ 43 AccessPlan ...................................................................................................................................... 6 ACDI ................................................................................................................................................ 5 Agencia Canadense ........................................................................................................................ 6 Agradecimentos............................................................................................................................... 5 Ajuda................................................................................................................................................ 4 Alfanuméricas ................................................................................................................................ 72 Alias ............................................................................................................................................... 71 Área geográfica ............................................................................................................................... 4 AREABREAK................................................................................................................................ 42 Áreas ............................................................................................................................................... 7 Arquivo........................................................................................................................................... 41 Calcular o tamanho lógico ......................................................................................................... 40 Arquivo ASCII com Registros Múltiplos......................................................................................... 27 Arquivo ASCII de Registro Simples............................................................................................... 29 ARQUIVO DE DEFINIÇÃO DOS DADOS DE ENTRADA ............................................................ 20 Arquivo de entrada .......................................... 24, 25, 26, 31, 33, 37, 38, 68, 70, 71, 73, 74, 75, 76 Análise e consistência ............................................................................................................... 26 Chillán .................................................................................................................................. 33, 68 Editar definição .......................................................................................................................... 68 Editar o layout ............................................................................................................................ 75 Formato múltiplo .................................................................................................................. 24, 25 Formato único ............................................................................................................................ 24 Freqüências de campos............................................................................................................. 74 Importar um dicionário IMPS 4.1 ............................................................................................ 31 IMPS .......................................................................................................................................... 68 ISSA ........................................................................................................................................... 68 Janela de propriedades dos campos de entrada....................................................................... 73 Janela do arquivo de entrada .................................................................................................... 70 Layout de formato dos registros ................................................................................................ 33 Menu de datos de origem .......................................................................................................... 68 Missing ....................................................................................................................................... 73 Modificar os campos .................................................................................................................. 76 Valores mínimo e máximo ......................................................................................................... 74 xBase ......................................................................................................................................... 68 ARQUIVO DE ENTRADA.............................................................................................................. 27 ARQUIVO ESTRUTURAL DA BASE ............................................................................................ 20 Arquivos......................................................................................................................................... 76 78 Arquivos transpostos ..................................................................................................................... 20 Arrastar variáveis........................................................................................................................... 34 Árvore .............................................................................................................................................. 8 ASCII ....................................................................................................................................... 23, 29 B BACK UP DA BASE ...................................................................................................................... 42 Banco Interamericano ..................................................................................................................... 6 Bandeira do idioma........................................................................................................................ 77 Base hierárquica.............................................................................................................................. 4 Bases de dados ............................................................................................... 13, 14, 15, 20, 33, 37 Arquivo estrutural da base .wip ......................................................................................................................................... 20 Bases com mais de um ramo hierárquico ................................................................................. 14 Criar ........................................................................................................................................... 37 Criar uma base........................................................................................................................... 37 Entidades selecionáveis e não-selecionáveis ........................................................................... 37 Esquema de geração ................................................................................................................. 37 Parâmetros da base ................................................................................................................. 37 Ponteiros .................................................................................................................................... 13 Relatório do processo de geração ............................................................................................. 37 BID ................................................................................................................................................... 5 Borland C......................................................................................................................................... 5 Branco e Não se aplica ................................................................................................................. 73 BREVE RESUMO DE Redatam+G4 ............................................................................................... 4 Builder 5.0........................................................................................................................................ 5 Bureau de Censos dos Estados Unidos........................................................................................ 31 C Cambio de Idioma.......................................................................................................................... 77 Campos ................................................................................................................................... 69, 70 CAMPOS DE ENTRADA ............................................................................................................... 76 Características da variável ............................................................................................................ 71 Características das variáveis......................................................................................................... 36 Características principais da quarta geração da família ................................................................. 4 CARREGAR ESQUEMA DE GERAÇÃO ...................................................................................... 75 CARREGAR UMA DEFINIÇÃO DE UM ARQUIVO DE ENTRADA.............................................. 43 Casos dessa entidade ..................................................................................................................... 9 Categorias ..................................................................................................................................... 72 CELADE ...................................................................................................................................... 5, 6 CEPAL ......................................................................................................................................... 5, 6 Chave secreta da base de dados.................................................................................................. 67 Chillán.......................................................................................................................... 27, 31, 32, 68 CIID.................................................................................................................................................. 6 Código ....................................................................................................................................... 8, 15 Código identificador ....................................................................................................................... 10 Códigos...................................................................................................................................... 7, 10 Códigos da entidade...................................................................................................................... 36 COMO UTILIZAR............................................................................................................................. 4 Compatibilidade com winR+ v1.2 .................................................................................................. 37 Compressão de dados em base de dados R+G4 ......................................................................... 18 CONCEITOS DA BASE DE DADOS............................................................................................... 6 Consistência do dicionário............................................................................................................. 40 CONSISTÊNCIA DO ESQUEMA DE BASE ................................................................................. 74 Consistência do esquema de geração .......................................................................................... 74 79 CONTEÚDO FÍSICO DOS ARQUIVOS DE PONTEIROS............................................................ 17 CONTEÚDO LÓGICO DOS ARQUIVOS DE PONTEIROS.......................................................... 17 Criação Código geográfico ...................................................................................................................... 19 Criação da base ......................................................................................................................... 19 Localização geográfica .............................................................................................................. 19 Criar ........................................................................................................... 43, 44, 46, 52, 55, 59, 63 Criar uma base a partir de um arquivo de registros múltiplos ................................................... 52 Criar uma base a partir de um arquivo de registros simples ..................................................... 43 Criar uma base a partir de um arquivo xBase ........................................................................... 59 CRIAR UMA BASE .................................................................................................................. 43, 52 Criar uma base de dados .......................... 20, 22, 26, 32, 34, 36, 37, 39, 40, 41, 42, 43, 67, 74, 75 .ddf ............................................................................................................................................. 20 Análise do arquivo de entrada ................................................................................................... 26 Definição do arquivo de entrada ................................................................................................ 32 Definir variáveis e códigos de entidade ..................................................................................... 36 Definir variáveis para cada entidade ......................................................................................... 34 Descrição resumida da geração ................................................................................................ 32 Desfragmentação da base......................................................................................................... 42 Entidades - resultados não esperados ..................................................................................... 39 Erros vs. advertências ............................................................................................................... 74 Etapas a seguir......................................................................................................................... 32 Executar geração ....................................................................................................................... 37 Garantir o conteúdo da base de dados ..................................................................................... 41 Gerar os nomes dos elementos................................................................................................. 39 Guia Simples de Criação de Bases de Dados........................................................................... 43 Layout do arquivo de entrada .................................................................................................... 20 Menu de base de dados ............................................................................................................ 67 Relações entre .wip e .ddf ......................................................................................................... 22 Relatório de erros....................................................................................................................... 40 Relatório do processo de geração ....................................................................................... 37, 39 Respaldo da base ...................................................................................................................... 42 Revisar consistência do dicionário............................................................................................. 40 Salvar e carregar esquema de geração .................................................................................... 75 Variáveis - resultados não esperados ....................................................................................... 39 Verificar a estrutura hierárquica................................................................................................. 41 Verificar consistência do esquema de geração ......................................................................... 74 Verificar freqüências de variáveis .............................................................................................. 41 CSPro ............................................................................................................................................ 27 D Dados ............................................................................................................................................ 19 .bin ............................................................................................................................................. 19 Compressão de dados em base de dados R+G4 ..................................................................... 18 Registros .................................................................................................................................... 19 ddw ................................................................................................................................................ 31 Decimais ........................................................................................................................................ 72 Default ........................................................................................................................................... 76 DEFINIÇÃO CHILLÁN ............................................................................................................. 27, 29 Definição da estrutura hierárquica................................................................................................. 33 DEFINIÇÃO DE UM ARQUIVO DE ENTRADA ............................................................................ 75 Definição do Arquivo de Entrada................................................................................................... 32 DEFINIR OS CAMPOS DE ENTRADA ......................................................................................... 33 Definir Variáveis............................................................................................................................. 36 DEFINIR VARIÁVEIS PARA CADA ENTIDADE ........................................................................... 34 DESCRIÇÃO RESUMIDA DA GERAÇÃO .................................................................................... 32 80 desfragmentador dos arquivos ...................................................................................................... 42 Dicionário..................................................................................................................... 26, 33, 40, 41 Importar um dicionário ............................................................................................................... 15 Revisar consistência do dicionário............................................................................................. 40 dicionário IMPS 4.1 ....................................................................................................................... 31 Dicionário:.......................................................................................................................... 10, 11, 15 DICIONÁRIOS ACEITOS .............................................................................................................. 27 Diretório ......................................................................................................................................... 76 Diretório desejado.......................................................................................................................... 76 Documentação............................................................................................................................... 71 E Elementos................................................................................................................................ 39, 40 Gerar os nomes dos elementos................................................................................................. 39 Elementos de entidades ...................................................................................................... 6, 13, 18 ELEMENTOS DE UMA ENTIDADE ................................................................................................ 9 ELEMENTOS SELECIONÁVEIS................................................................................................... 10 English ........................................................................................................................................... 77 Entidade............................................................................................................... 8, 9, 10, 11, 12, 15 ENTIDADE NÃO SELECIONÁVEL ............................................................................................... 10 ENTIDADE SELECIONÁVEL ........................................................................................................ 10 ENTIDADES ........................................................................................ 13, 14, 16, 36, 37, 39, 68, 69 Agregar entidade inferior ........................................................................................................... 68 Colar ramo antes de .................................................................................................................. 68 Colar ramo embaixo................................................................................................................... 68 Cortar ramo ................................................................................................................................ 68 Deletar........................................................................................................................................ 68 Elementos ............................................................................................................................ 13, 14 Entidades selecionáveis ............................................................................................................ 36 Inserir entidade .......................................................................................................................... 68 Número interno .......................................................................................................................... 13 Raiz ...................................................................................................................................... 13, 15 Relações entre entidades .......................................................................................................... 15 Renomear .................................................................................................................................. 68 Resultados não esperados ........................................................................................................ 39 Selecionável ou não-selecionável.............................................................................................. 68 Entidades da hierarquia................................................................................................................. 33 ENTIDADES INFERIORES ............................................................................................................. 9 Entidades selecionáveis e não-selecionáveis ............................................................................... 37 ENTIDADES SUPERIORES ........................................................................................................... 9 ENTIDADES: ................................................................................................................................... 7 Español.......................................................................................................................................... 77 Especificações Técnicas ............................................................................................................... 71 Esquema de base...................................................................................... 32, 34, 35, 36, 67, 70, 76 Imprimir ...................................................................................................................................... 67 Modificar as características das variáveis ................................................................................. 76 Esquema de Base ......................................................................................................................... 69 Esquema de Geração........................................................................................................ 37, 38, 75 Estrutura .......................................................................................................................................... 8 Estrutura da base ............................................................................................................................ 6 ESTRUTURA DA BASE DE DADOS ............................................................................................ 12 ESTRUTURA DOS ARQUIVOS.................................................................................................... 20 ESTRUTURA HIERÁRQUICA DA BASE ...................................................................................... 33 ETAPAS INICIAIS.......................................................................................................................... 23 81 F F1..................................................................................................................................................... 4 Filtros............................................................................................................................................ 77 FNUAP............................................................................................................................................. 6 Fonte.............................................................................................................................................. 77 Forma hierárquica............................................................................................................................ 7 Formato Chillán ................................................................................................................. 27, 29, 31 Definição para registro múltiplo ................................................................................................. 27 Definição para registro simples.................................................................................................. 29 Descrição de seções ............................................................................................................... 27 Importar um dicionário IMPS 4.1 ............................................................................................... 31 FORMATO DO ARQUIVO DE ENTRADA ................................................................................... 23 Formato do arquivo de entrada ............................................................................................... 23, 24 FORMATO MÚLTIPLO.................................................................................................................. 24 Formato Redatam............................................................................................................................ 4 FORMATO ÚNICO ........................................................................................................................ 23 Formatos aceitos para o arquivo de entrada................................................................................. 27 FREQÜÊNCIAS DE CAMPOS ...................................................................................................... 74 Freqüências de variáveis............................................................................................................... 41 G Geração ......................................................................................................................................... 32 GERAR NOMES DE ELEMENTOS .............................................................................................. 39 Gerar uma base............................................................................................................................. 37 Grupo............................................................................................................................................. 71 Guia Simples de Criação de Bases de Dados .............................................................................. 43 I Identificação............................................................................................................................... 8, 10 Identificação de Arquivos........................................................................................................... 38 identificador ................................................................................................................................... 71 Identificar ....................................................................................................................................... 10 Idioma ............................................................................................................................................ 77 Importar um dicionário ................................................................................................................... 15 Importar un dicionário IMPS 4.1 .................................................................................................... 31 Impressão ...................................................................................................................................... 77 IMPS .................................................................................................................................. 27, 68, 70 IMPS4.1 ......................................................................................................................................... 31 Índices ........................................................................................................................................... 20 ÍNDICES ........................................................................................................................................ 13 inferiores .......................................................................................................................................... 9 INTEGER....................................................................................................................................... 71 ISSA................................................................................................................................... 27, 68, 71 J JANELA DE PROPRIEDADES DO ARQUIVO DE ENTRADA..................................................... 70 JANELA DE PROPRIEDADES DOS CAMPOS DE ENTRADA ................................................... 73 JANELA DO ESQUEMA DE BASE ............................................................................................... 70 L Layout do arquivo de entrada........................................................................................................ 20 Load Scheme Definition ................................................................................................................ 75 LOTUS........................................................................................................................................... 23 LSD ................................................................................................................................................ 75 82 M MAIS DE UM RAMO ..................................................................................................................... 14 Manutenção da estrutura............................................................................................................... 33 Membros individuais ........................................................................................................................ 9 MENU DE ARQUIVO .................................................................................................................... 67 MENU DE BASE DE DADOS........................................................................................................ 67 Menu de datos de origem.............................................................................................................. 68 Menu dinâmico --popup-- de campos............................................................................................ 69 Menu dinâmico --popup-- de entidades......................................................................................... 68 Menu dinâmico --popup-- de variáveis .......................................................................................... 69 MENU DO ARQUIVO DE ENTRADA............................................................................................ 68 MENU PRINCIPAL ........................................................................................................................ 66 Metadados ..................................................................................................................................... 15 Minúsculas..................................................................................................................................... 11 Missing............................................................................................................................... 12, 71, 73 MODIFICANDO AS PROPRIEDADES DE VARIÁVEIS ............................................................... 76 Multiidioma..................................................................................................................................... 77 múltiplo .......................................................................................................................................... 52 N Nações Unidas ................................................................................................................................ 1 Não se aplica ........................................................................................................................... 11, 12 NÃO SELECIONÁVEIS ................................................................................................................. 10 Não selecionável ....................................................................................................................... 8, 10 Nível................................................................................................................................................. 8 Nível da hierarquia ........................................................................................................................ 15 Nível geográfico............................................................................................................................... 7 Nível hierárquico.............................................................................................................................. 7 Nível zero......................................................................................................................................... 8 Nome da variável........................................................................................................................... 11 Nome do elemento ........................................................................................................................ 40 NSA ............................................................................................................................................... 12 Numeração automática ................................................................................................................. 38 Número Interno.............................................................................................................................. 13 O Omitido .......................................................................................................................................... 73 Opções gerais................................................................................................................................ 76 Opções para o tipo de fonte .......................................................................................................... 77 Organização hierárquica ........................................................................................................... 7, 12 P Parâmetros da Base ...................................................................................................................... 37 PARTIR DE UM ARQUIVO DE REGISTROS SIMPLES .............................................................. 43 ponteiros ........................................................................................................................................ 13 Ponteiros.................................................................................................................................. 17, 20 Conceito lógico dos arquivos de ponteiros ................................................................................ 17 Conteúdo físico dos arquivos..................................................................................................... 17 Tamanho lógico de 4 bytes........................................................................................................ 17 Português ...................................................................................................................................... 77 PREFERÊNCIAS DE FONTE ....................................................................................................... 77 PREFERÊNCIAS DE IDIOMA....................................................................................................... 77 PREFERÊNCIAS GERAIS ............................................................................................................ 76 PREPARAÇÃO DO ARQUIVO DE ENTRADA ............................................................................. 33 83 PROPRIEDADES DA VARIÁVEL ................................................................................................. 71 Ptr .................................................................................................................................................. 20 Q Qualitativa...................................................................................................................................... 11 Quantitativa.................................................................................................................................... 11 R Raiz.................................................................................................................................. 7, 8, 13, 15 Ramo ....................................................................................................................................... 68, 69 Colar ramo antes de .................................................................................................................. 68 Colar ramo embaixo................................................................................................................... 68 Cortar ramo ................................................................................................................................ 68 Ramo hierárquico .......................................................................................................................... 14 Ramos ......................................................................................................................................... 7, 8 Ramos da árvore ............................................................................................................................. 8 Rbf ................................................................................................................................................. 20 Referência ..................................................................................................................................... 76 REGISTRO SIMPLES ................................................................................................................... 29 Registros........................................................................................................................................ 18 Registros Múltiplos ..................................................................................................................... 27 RELAÇÕES ENTRE ENTIDADES ................................................................................................ 15 RELAÇÕES ENTRE WIP E DDF .................................................................................................. 22 Relatório do processo de geração........................................................................................... 37, 39 Respaldo da Base ......................................................................................................................... 42 Resultados não esperados......................................................................................................... 39 Resumo de Redatam+G4................................................................................................................ 4 RESUMO DO GUIA DE CRIAÇÃO DE BASES ............................................................................ 43 REVISAR CONSISTÊNCIA DO DICIONÁRIO .............................................................................. 40 REVISAR RELATÓRIO DO PROCESSO DE GERAÇÃO ............................................................ 39 S SAS................................................................................................................................................ 23 Segurança dos dados.................................................................................................................... 10 selecionável ................................................................................................................................... 10 simples........................................................................................................................................... 43 SPSS ............................................................................................................................................. 23 STRING ................................................................................................................................... 37, 71 T Tamanho da fonte.......................................................................................................................... 77 tamanho físico ............................................................................................................................... 40 tamanho lógico ............................................................................................................................ 41 Tecla F1........................................................................................................................................... 4 Tipo de registro.............................................................................................................................. 38 Tradução........................................................................................................................................ 77 Transposto..................................................................................................................................... 20 U Última base trabalhada.................................................................................................................. 76 USO ALTERNATIVO DO IMPS 4.1............................................................................................... 31 V Valor Omitido ................................................................................................................................. 73 84 VALORES FORA DE FAIXA E NÃO SE APLICA ......................................................................... 11 Valores mínimo e máximo ............................................................................................................. 74 Valores Mínimos e Máximos ......................................................................................................... 74 Variáveis .............................................................................................. 11, 13, 34, 35, 39, 41, 42, 69 Alias ........................................................................................................................................... 71 Arquivo de entrada..................................................................................................................... 72 Código entidade ......................................................................................................................... 69 Decimais .................................................................................................................................... 71 Deletar variable .......................................................................................................................... 69 Documentação ........................................................................................................................... 71 Faixas......................................................................................................................................... 72 Grupo ......................................................................................................................................... 73 Janela de propriedades da variable........................................................................................... 71 Não se aplica ............................................................................................................................. 72 Nome de variável ....................................................................................................................... 11 Nome entidade........................................................................................................................... 69 Número interno .......................................................................................................................... 13 Posição relativa.......................................................................................................................... 71 Propriedades........................................................................................................................ 69, 72 Renomear .................................................................................................................................. 69 Resultados não esperados ........................................................................................................ 39 Revisar freqüências ................................................................................................................... 41 Tamanho .................................................................................................................................... 72 Tipo ............................................................................................................................................ 72 Valor omitido .............................................................................................................................. 72 Valores Fora de faixa e Não se Aplica ...................................................................................... 11 Valores Missing ou Omitidos ..................................................................................................... 11 Verificar valores de freqüências de categorias.......................................................................... 69 Verificar valores máximos e mínimos ........................................................................................ 69 Variáveis: ................................................................................................................................. 11, 71 Verificar Consistência .................................................................................................................... 74 Versão R+G4 ................................................................................................................................... 4 Vetor .............................................................................................................................................. 20 W Waterloo .......................................................................................................................................... 6 wip ................................................................................................................................................. 33 Www.eclac.cl/celade/redatam ......................................................................................................... 5 X xBase..................................................................................................................... 27, 60, 68, 70, 71 Z zip .................................................................................................................................................. 42 85