BDG - BANCO DE DADOS DE GRADES UMA FERRAMENTA PARA DISPONIBILIZAR DADOS DE PREVISÃO DE MODELOS NUMÉRICOS DE TEMPO E CLIMA Antonio Carlos Fernandes da Silva 1 , Luciana Santos Machado Carvalho 2 , Denise Nantes de Souza 3 , José Waetan Bezerra Junior 4 RESUMO: O Banco de Dados de Grades (BDG) irá armazenar os dados gerados pelos Modelos Numéricos de Previsão de Tempo e Clima do CPTEC/INPE de uma forma organizada e de fácil acesso. Os dados do BDG serão disponibilizados através da internet para os usuários do CPTEC/INPE, para a comunidade científica e para qualquer pessoa/empresa interessada nos dados. Este projeto está sendo financiado pelo Programa PROTIM (Programa de Tecnologia da Informação em Meteorologia). ABSTRACT: The Grids Data Base (BDG) will be used to archive Numerical Models outputs at CPTEC/INPE. Data access will be provided using WEB facilities for all type of interested users, researches, enterprise organizations and isolateted users, This project is sponsored by Information Technology Program for Meteorological Applications (PROTIM). Palavras-Chave: Modelos Numéricos, Banco de Dados INTRODUÇÃO: O CPTEC - Centro de Previsão de Tempo e Estudos Climáticos, referência nacional na área de Meteorologia, tem como função realizar Previsões de Tempo Diárias e Previsões Climatológicas Mensais e Sazonais para o Brasil e também desenvolver Pesquisas Científicas na Área de Ciências Ambientais. As Previsões de Tempo e Clima são realizadas através de cálculos matemáticos feitos pelos Modelos de Previsão Numérica de Tempo. 1 Instituto Nacional de Pesquisas Espaciais – INPE, Centro de Previsão de Tempo e Estudos Climáticos – CPTEC, Cachoeira Paulista, São Paulo – Brasil, fone: (12) 3186 8491, e-mail: [email protected] 2 Instituto Nacional de Pesquisas Espaciais – INPE, Centro de Previsão de Tempo e Estudos Climáticos – CPTEC, Cachoeira Paulista, São Paulo – Brasil, fone: (12) 3186 8608, e-mail: [email protected] 3 Instituto Nacional de Pesquisas Espaciais – INPE, Centro de Previsão de Tempo e Estudos Climáticos – CPTEC, Cachoeira Paulista, São Paulo – Brasil, fone: (12) 3186 8618, e-mail: [email protected] 4 Instituto Nacional de Pesquisas Espaciais – INPE, Centro de Previsão de Tempo e Estudos Climáticos – CPTEC, Cachoeira Paulista, São Paulo – Brasil, fone: (12) 3186 8422, e-mail: [email protected] O CPTEC processa atualmente Modelos de previsão de tempo Global e Regional, Modelos de Clima, Modelo de Previsão por Ensemble, Modelo de Ondas, entre outros. Estes Modelos geram por dia um grande volume de dados, que são armazenados em diferentes tipos de mídias (fitas, discos, etc) por vários anos. Alguns destes dados são armazenados em fita por períodos indefinidos. Os dados gerados pelos modelos, além de serem utilizados para a elaboração da previsão do tempo e clima, são também utilizados nas avaliações dos Modelos de Previsão de Tempo, comparando os valores gerados com as observações, permitindo novos ajustes nos Modelos. Estes dados também são utilizados em pesquisas científicas nas áreas Meteorológica, Clima e de Meio Ambiente. Entretanto, a utilização desses dados não é simples. Devido à forma como são armazenados, não é possivel uma recuperação rápida e automática pelos usuários internos do CPTEC, e é ainda mais difícil para a comunidade científica externa. O objetivo deste projeto é armazenarmos estes dados de uma forma organizada e de fácil acesso, tanto para uso interno do Centro, como também para disponibilizar para as pessoas interessadas em trabalhar em estudos científicos. Para que isso seja possível, está sendo desenvolvido um Banco de Dados para armazenamento dos dados gerados pelos Modelos de Previsão de Tempo e Clima e uma interface para recuperação destes dados, através da Internet. Esta trabalho apresenta a solução dada para o desenvolvimento do BDG (Banco de Dados de Grades). O BANCO DE DADOS DE GRADES: O BDG está sendo desenvolvido utilizando o Sistema de Gerenciamento de Banco de Dados Oracle (SGBD). A estrutura computacional utilizada no BDG é composta de um cluster da Sun Microsystems de alta disponibilidade onde reside o SGBD Oracle e um sistema de armazenamento HSM (Hierarchical Storage Management) onde ficarão os arquivos de dados. O BDG será um repositório de dados, onde serão guardadas as saídas geradas pelos modelos numéricos de tempo e clima, bem como os arquivos necessários as rodadas dos modelos. Todo acesso ao BDG será através da WEB. As solicitações dos dados pelos usuários será feita através do preenchimento de um formulário que será submetido ao sistema. Os dados resultantes da solicitação ficarão disponíveis em uma área de FTP, para que o usuário possa fazer o download dos dados. Porém, se a solicitação gerar uma grande quantidade de bytes, os dados serão gravados em mídias como DVD/CD e serão encaminhados aos usuários. Os dados armazenados no BDG serão classificados em dados liberados e restritos. Qualquer usuário quando fizer sua solicitação terá conhecimento dos dados disponíveis no Banco, tanto os liberados quanto os restritos, mas para obter os dados restritos, o usuário necessitará de um credenciamento prévio que deverá ser aprovado pelo administrador do sistema. Após este procedimento os dados estarão liberados para o Usuário. A solução adotada para o BDG foi a criação de um banco de metadados, onde são armazenadas apenas as informações sobre as arquivos de dados gerados pelos modelos numéricos de tempo e clima. Os arquivos de dados ficarão armazenados em sistema de HSM (Hierarchical Storage Management), isto porque os arquivos de dados gerados pelos modelos são da ordem de gigabytes. O BDG nesta primeira etapa permitirá fazer recuperação dos arquivos de dados propriamente ditos. Em uma segunda etapa será permitido aos usuários definir recortes destes arquivos podendo especificar as variáveis e os níveis desejados. O BDG foi dividido em 5 processos: • Alimentação: O processo de alimentação consiste em gravar os dados das saídas dos modelos numéricos no Banco de Dados. Temos duas formas de alimentação do BDG a alimentação automática e a alimentação eventual. A alimentação automática fará parte da rotina operacional dos modelos e será efetuada após as rodadas dos modelos numéricos. A alimentação eventual é realizada quando se quer guardar algum outro tipo de arquivo. • Administração: Para tornar o BDG mais dinâmico, serão criadas tabelas onde será definida o menu de opções disponíveis no BDG, bem como os parâmetros para funcionamento do Banco. Este processo permitirá fazer manutenções nestes parâmetros sem a necessidade de refazer interfaces ou modificar programas. • Atendimento ao usuário: Será responsável pelo acompanhamento das solicitações dos dados pelos usuários, registrando no sistema cada etapa da geração das mídias e o seu envio para os usuários. • Usuário: Este processo fará o registro das solicitações feitas pelos usuários e permitirá através de opções de menu o acompanhamento de suas solicitações. Como por exemplo saber se as mídias já foram geradas ou se já foram postadas nos Correios, etc. • Gerenciamento: Este processo cuidará das informações que serão inseridas no Banco. Aqui serão cadastrados os dados de quais modelos estarão disponíveis, os períodos desses dados, informações sobre os modelos, etc. ARQUITETURA DO SISTEMA: Por motivo de segurança o CPTEC/INPE possui dois ambientes de rede um interno e outro externo. O servidor WEB está instalado no ambiente externo. É por este servidor que os usuários farão acesso ao BDG. O Servidor de Banco de Dados está instalado no ambiente interno. É neste servidor onde serão cadastrados os arquivos de dados, as informações sobre os Modelos Numéricos e todos os controles necessários ao funcionamento do BDG. A figura abaixo mostra a arquitetura adotada para o BDG Figura 1: Arquitetura do sistema COMENTÁRIOS FINAIS: O acesso aos dados das saídas dos modelos numéricos é uma necessidade para se fazer as avaliações dos Modelos Numéricos de Previsão de Tempo e Clima, comparando os valores gerados com as observações, permitindo os ajustes necessários nos Modelos, fazer estudos e pesquisa em previsão numérica de tempo, meio ambiente e climatologia. A comunidade internacional entende a importância do acesso livre aos dados ambientais de todos os países. Devido à escassez de dados no hemisfério sul as bases de dados especializadas nessa região adquirem uma importância adicional. Entendemos que a infra-estrutura instalada no CPTEC/INPE para aquisição, armazenamento e disseminação de dados faz parte do início de uma rede internacional de disponibilidade de dados, que hoje se constrói em diversos países que adotaram a política de dados livres. Por outro lado, consideramos que a informação gerada pelo governo é um recurso econômico de infra-estrutura valiosa. Muito tempo, esforço e dinheiro são necessários para a coleta e para a organização de dados públicos, mas o seu uso vai muito além dos interesses de quem os produziu. Ao adotar uma atitude mais livre, criamos para o país maiores possibilidades de gerar emprego e renda. Assim, defendemos a política de disseminar amplamente toda a informação disponível, pois entendemos que o importante, no caso de dados públicos, é o impacto global. AGRADECIMENTOS: Luiz Henrique Coura pela contribuição na aprendizagem da linguagem Java, Sérgio Henrique S. Ferreira e Waldênio Gambi de Almeida pela contribuição na elaboração deste trabalho. REFERÊNCIAS BIBLIOGRÁFICAS Horstman,Cay, Big. Java. Porto Alegre: Bookman, 2004. Horstman,Cay e Geary, David. Java Server Faces. Rio de Janeiro: AltaBookx, 2005. Melo, Ana Cristina. Desenvolvendo aplicações com UML 2.0. Rio de Janeiro: Brasport 2004 Cooper, James W. The Design Patterns Java Companion. Addison-Weslley 1998