EPIDEMIO – SISTEMA COMPUTACIONAL WEB INTEGRADO SOBRE EVENTOS
EPIDEMIOLÓGICOS
Claudia B. Rizzi1, Rogério Luis Rizzi1, Jorge Bidarra1, Guilherme Galante1, Reginaldo
Aparecido Zara1, Adair Santa Catarina11, Amarildo de Vicente1, Carlos José Maria Olguín11,
Clodis Boscarioli1, Huei Diana Lee2, Ivonei Freitas da Silva11, Márcio Seiji Oyamada2, Miguel
Angel Uribe Opazo1, Victor Francisco Araya Santander1, Wu Feng Chung2, Maria Fernanda
Azevedo Pompilho Leonel Ferreira3.
1
Centro de Ciências Exatas e Tecnológicas – UNIOESTE
2
Centro de Engenharias e Ciências Exatas – UNIOESTE
3
Secretaria Municipal de Saúde da Prefeitura Municipal de Cascavel
Palavras-chave: Computação aplicada, Epidemiologia computacional, Projeto EPIDEMIO.
Resumo:
O Encontro em Computação Aplicada (ECA) objetiva reunir pesquisadores da Ciência da
Computação, Matemática, Estatística, Física e demais interessados para realizar discussão sobre
a computação aplicada às diversas áreas do conhecimento, enfocando da área de epidemiologia
computacional. Especificamente, a edição 2008 do ECA visa fortalecer os estudos e pesquisas
que atualmente estão sendo desenvolvidos no âmbito do grupo multidisciplinar em computação
aplicada, da Universidade Estadual do Oeste do Paraná.
Esse é o segundo passo concreto dado na direção da formação e fortalecimento de um
grupo de pesquisa multidisciplinar em computação aplicada. O primeiro foi a produção de um
projeto em conjunto que foi submetido ao edital MCT/CNPq/CT-INFO 07/2007, cuja natureza
foi a “modelagem computacional de sistemas complexos artificiais, naturais e sócio-culturais e
da interação homem-natureza”. Tal projeto visa desenvolver e aplicar requisitos, métodos,
técnicas, algoritmos e produtos de software para construir, a partir de modelagens biofísica e
matemática de fenômenos epidemiológicos, um Sistema Computacional Web Integrado sobre
Fenômenos Epidemiológicos, designado de EPIDEMIO, para fins de estudos epidemiológicos e
ações de vigilância epidemiológica. Não obstante o projeto não ter sido aprovado pelo CNPq,
ele vem sendo desenvolvido pelos autores, como mostra os resumos expandidos e os trabalhos
em andamentos submetidos ao evento.
Essas duas ações concretas nasceram de um grande e principal objetivo comum aos
proponentes do EPIDEMIO e de outros mais pesquisadores. A de se instalar um Mestrado em
Computação Aplicada, inserido num programa de Pós-Graduação em Computação Aplicada na
UNIOESTE. A proposta está atualmente em análise no Comitê da Área Multidisciplinar /
Interdisciplinar da CAPES, e teve como origem os trabalhos de pesquisa e desenvolvimento
realizados no interior dos Cursos de Graduação de Informática, de Ciência da Computação e de
Matemática, e das áreas de Física e Estatística, bem como do Núcleo de Inovação Tecnológica
(NIT). Estes trabalhos, tratando problemas de diferentes naturezas, têm em comum o enfoque às
pesquisa aplicada e multidisciplinar. Essa situação foi, enfim, a grande motivadora do
estabelecimento de uma série de parcerias para a proposição do referido curso de pósgraduação.
O Anexo I é uma fiel reprodução do documento enviado ao CNPq e segue para o
conhecimento dos leitores.
Referências
R. L. Rizzi e et. al. Sistema Computacional Web Integrado sobre Eventos Epidemiológicos.
Projeto de Pesquisa enviado ao MCT/CNPq para atender o Edital MCT/CNPq/CT-HIDRO
07/2007. 2007. 38 p.
ECA – Encontro em Computação Aplicada. http://www.inf.unioeste.br/eca/.
ANEXO I
CONSELHO NACIONAL DE DESENVOLVIMENTO CIENTÍFICO E
TECNOLÓGICO – CNPQ EDITAL MCT/CNPQ/CT-INFO Nº. 07/2007
1. IDENTIFICAÇÃO
1.1 Título do Projeto
Sistema Computacional Web Integrado sobre Eventos Epidemiológicos
1.2 Coordenador do Projeto e e-mail
Rogério Luís Rizzi – [email protected]
1.3 Instituição Executora
Universidade Estadual do Oeste do Paraná – UNIOESTE.
A UNIOESTE oferece, a título de contra partida, recursos humanos, condições físicas
estruturais e de apoio à execução do projeto.
1.4 Palavras-chaves
Sistema computacional web integrado; Tratamento de dados georeferenciados; Sistema
baseado em conhecimento; Sistema de informações sobre saúde pública; Sistema de
alerta em vigilância epidemiológica; Modelo computacional paralelo para fenômenos
epidemiológicos.
1.5 Resumo
O presente projeto, cujo escopo é “fenômenos epidemiológicos” está em
consonância com o documento “Grandes Desafios da Computação no Brasil: 20062016” e com o objetivo “b” do edital MCT/CNPq/CT-INFO 07/2007 cuja natureza é a
“modelagem computacional de sistemas complexos artificiais, naturais e sócioculturais e da interação homem-natureza”. Fenômenos epidemiológicos são sistemas
complexos. Sistemas complexos são sistemas formados por muitas unidades simples,
interligadas e que se influenciam mutuamente. A complexidade desses sistemas é
conseqüência do entrelaçamento das influências mútuas dessas muitas unidades ou
elementos em função da evolução dinâmica do sistema.
O objetivo deste projeto é desenvolver e aplicar requisitos, métodos, técnicas,
algoritmos e produtos de software para construir, a partir de modelagens biofísica e
matemática de fenômenos epidemiológicos, um sistema complexo, o Sistema
Computacional Web Integrado sobre Fenômenos Epidemiológicos para fins de estudos
epidemiológicos e ações de vigilância epidemiológica.
O projeto será desenvolvido por equipe multidisciplinar, e se estrutura como uma
matriz composta por oito módulos sendo que cada módulo possui uma atribuição
técnica-gerencial, e uma temática definida. Os integrantes dos módulos trabalharão seus
objetivos internos sempre tendo em vista o conjunto total dos objetivos do Sistema
Epidemiológico. Para garantir a interação da equipe e que as discussões e resultados
alcançados localmente no interior dos módulos sejam de acesso coletivo, serão
utilizados via web, os recursos disponibilizados por um sistema de acompanhamento do
projeto. Durante a realização deste projeto serão implementados quatro grandes
sistemas, disponibilizados via web: o sistema de simulações; o sistema integrado de
informações epidemiológicas, o sistema de conhecimento e o sistema de interface.
O projeto é relevante, sobretudo devido a seus impactos e resultados na vigilância
epidemiológica e na modelagem computacional. Quanto à vigilância epidemiológica, o
sistema poderá analisar variações geográficas, temporais e sociais na distribuição de
casos de doenças epidemiológicas; identificar situações que requeiram a realização de
estudos e pesquisas específicas ou a adoção de medidas para ampliar o conhecimento
sobre situações epidemiológicas; subsidiar processos de planejamento, gestão e
avaliação de políticas públicas e ações de saúde; e disponibilizar em ambiente web,
informações à comunidade. Quanto à modelagem computacional, o projeto contribuirá
para obter conhecimentos sobre sistemas complexos, pois contempla aspectos inerentes
a esse tipo de modelo.
O projeto é importante e inovador, e seus resultados podem ser aplicados e
impactar significativamente em termos sócio-econômicos. É importante porque
disponibiliza, via web, a pessoas e entidades, sistemas computacionais baseados em
conhecimento sobre algumas doenças de notificação obrigatória, ao término de dois
anos. Esses sistemas poderão auxiliar profissionais e gestores da saúde na solução de
problemas. Também é importante porque suas interfaces serão projetadas com design e
mecanismos de consulta que facilitem a utilização do sistema. Ele é inovador porque
permitirá o registro de informações relativas a doenças incluindo as de notificação
obrigatória, via web. Este registro visa automatizar o processo atualmente manual,
demorado e sujeito à falhas, que fornece informações ao DATASUS, bem como reunir
outros dados e informações que permitam subsidiar pessoas e entidades que são capazes
de utilizá-las visando fundamentar ações de relevância à saúde coletiva.
1.6 Organização do Texto
Este texto está organizando conforme a seqüência dos tópicos relacionados no
edital: coerência com os objetivos do edital; identificação e caracterização do objetivo
do projeto; metodologia e estratégias de ação; objetivos e metas; cronograma físicofinanceiro; relevância e impacto dos resultados e referências bibliográficas.
2. COERÊNCIA COM OS OBJETIVOS DO EDITAL
O presente projeto está em consonância com o documento “Grandes Desafios da
Computação no Brasil: 2006-2016” (SBC, 2006) e, conseqüente e particularmente, com
o objetivo “b” do edital MCT/CNPq/CT-INFO 07/2007 cuja natureza é a “modelagem
computacional de sistemas complexos artificiais, naturais e sócio-culturais e da
interação homem-natureza”. Os principais fatores que justificam a coerência deste
projeto, cujo escopo é “fenômenos epidemiológicos”, bem como os objetivos do
referido edital, são explicitados a seguir.
Fenômenos epidemiológicos são essencialmente sistemas complexos e sistemas
complexos “são sistemas formados por muitas unidades simples, porém interligadas
entre si, de forma que uma influencia o comportamento das outras” (OLIVEIRA,
1999). A complexidade desses sistemas é, portanto, conseqüência do entrelaçamento
das influências mútuas dessas muitas unidades ou elementos em função da evolução
dinâmica do sistema.
Dentre os elementos motivadores da proposição do Sistema Computacional Web
Integrado sobre Fenômenos Epidemiológicos, doravante denominado Sistema
Epidemiológico, que se pretende desenvolver, está a preocupação com a saúde coletiva
de grupos de indivíduos que vivem em comunidades ou áreas. Influenciam no sistema,
dentre outros fatores, a freqüência e o padrão de eventos relacionados a doenças nesses
grupos. A freqüência inclui a quantidade desses eventos e as taxas ou riscos de doença.
O padrão de ocorrência dos eventos se refere à distribuição desses eventos segundo
elementos como o tempo, o lugar e o indivíduo. De posse da freqüência e distribuição
desses eventos, é possível comparar sua ocorrência em diferentes grupos populacionais
com diferentes características demográficas, genéticas, imunológicas, comportamentais,
de exposição ao ambiente e outros fatores e, desta maneira, implementar medidas de
prevenção e controle (CDC, 1992), (WALDMAN, 2007).
Essas informações são essenciais para que seja implementado o Sistema
Epidemiológico proposto, e, portanto, é necessário ter acesso às que existem e produzir
as inexistentes. Cabe ressaltar que há precariedade do registro dessas informações,
mesmo se tratando de doenças cujo registro é obrigatório. O trâmite dos acontecimentos
quando alguém chega a um posto de atendimento em saúde com sintomas de uma
doença de notificação obrigatória reforça essa precariedade. No posto, o atendente deve
preencher uma notificação, geralmente em uma folha de papel, escrita à mão, com
dados pessoais sobre o paciente e seus principais sintomas. Este formulário é
encaminhado ao Centro de Vigilância Epidemiológica mais próximo, que se
responsabiliza em repassar as informações ao DATASUS. Esse processo pode ser
demorado e sujeito à falhas. Em detrimento a este trâmite, certas doenças podem se
disseminar com rapidez, pondo em risco a saúde coletiva.
Ainda com relação ao desenvolvimento do Sistema Epidemiológico proposto, é
preciso considerar outras variáveis, como as relações sociais em jogo. Trata-se de
grupos populacionais cujos partícipes interagem mutuamente. Ora, grupos
populacionais são redes constituídas por agrupamentos de pessoas unidas por laços
familiares, profissionais, de amizade, atitudes, de preferências, etc., ou seja, com
características semelhantes. As conseqüências decorrentes do dinamismo das interações
e relações desses grupos associadas a determinadas condições (de clima, de região, entre
outras), interferem na saúde desses grupos, e devem ser consideradas no modelagem
computacional.
E em decorrência das dificuldades inerentes ao estudo de sistemas complexos,
uma abordagem apropriada é a criação de um complexo sistema computacional, que
requer para sua efetivação o desenvolvimento de modelos, algoritmos e ferramentas
específicas que atendam às características desses sistemas, e este certamente é um
desafio para a ciência da computação, como já apontado no documento da SBC. É
também um desafio para o presente projeto.
3. IDENTIFICAÇÃO E CARACTERIZAÇÃO DO OBJETIVO DO PROJETO
O uso de sistemas computacionais na saúde tem assumido um papel cada vez mais
relevante em nível mundial. Evidência disso é o fato de que políticas de saúde de países
como Inglaterra, Canadá, Espanha e Austrália estão definidas com base em informações
provenientes de sistemas computacionais abrangentes e de qualidade (NAFFAH
FILHO; CECÍLIO, 2006).
O Brasil compartilha desta postura. O Ministério da Saúde estabeleceu como um
de seus objetivos a definição de uma política nacional de informação em saúde,
concebendo-a como essencial para alcançar uma maior equidade, qualidade e
transparência dos serviços de saúde. O departamento de informática do Sistema Único
de Saúde (DATASUS), responsável por coletar, processar e disseminar informações
sobre saúde tem feito esforços significativos na gestão nacional em saúde, incluindo a
disponibilização de informações via Internet.
No estado do Paraná, a Secretaria de Saúde tem procurado sustentar uma política
de construção permanente de um modelo de saúde que cumpra a função social de
promoção, prevenção e atenção à saúde. Neste contexto, um de seus objetivos
estratégicos é desenvolver e disponibilizar informações em saúde através da
incorporação de tecnologias. São 22 Regionais de Saúde que constituem a instância
administrativa intermediária entre os municípios e o estado. Às Regionais de Saúde
cabe desenvolver as atitudes necessárias para apoiar os municípios de sua abrangência
influenciando na gestão e na busca contínua e crescente de eficiência.
Particularmente, é na 10ª Regional de Saúde cuja abrangência de atendimento é de
25 municípios, que está vinculado o município de Cascavel, parceiro neste projeto.
Cascavel é uma cidade situada no oeste do Paraná, com 2.016,3 km2, e
aproximadamente 300.000 habitantes. A Secretaria Municipal de Saúde de Cascavel
atua na gestão de Atenção Básica, que constitui um conjunto de ações, de caráter
individual e coletivo, situadas no primeiro nível de atenção dos sistemas de saúde,
voltada para promoção da saúde, prevenção de agravos, tratamento e reabilitação.
Cascavel possui 26 Unidades Básicas de Saúde, 09 Unidades Saúde da Família e
06 Unidades Especiais. O Município possui um Centro Regional de Especialidades, o
Hospital Universitário vinculado a UNIOESTE, que funciona através de um consórcio
intermunicipal de saúde do oeste do Paraná, atendendo aos 25 municípios que dele
participam através de cotas previamente estabelecidas. Cascavel possui 52,24% das
consultas ofertadas, sendo os 47,76% restantes divididos entre os outros 24 municípios.
Neste cenário mais particular de abrangência de Cascavel, a disponibilidade de
sistemas computacionais em saúde significa garantir os dados e as informações
necessárias para que os diferentes usuários, especialmente gestores, possam executar
ações adequadas de planejamento de serviços e atividades em saúde. Assim, a existência
de um sistema computacional como o proposto neste projeto, possibilita que os
principais postulados da saúde pública possam ser buscados: conhecer as condições de
saúde da população, avaliar mudanças em seu perfil, planejar e implementar programas
e informar à sociedade os fatores de risco que ameaçam a saúde.
Também é possível contribuir para a análise da disseminação de doenças infectocontagiosa ou de outras de interesse da saúde pública como aquelas que têm
importância no cenário epidemiológico da região de Cascavel como a dengue, AIDS e
raiva. Esta última doença é o objeto de enfoque sob o ponto de vista da simulação
computacional, no período dos dois anos previstos, que é primeira fase do projeto. Note
que se ocorrer, por motivos técnicos, a inconveniência ou inviabilidade de enfocar a
raiva, outra doença será escolhida como alvo para esta fase do projeto.
A raiva é uma doença que acomete mamíferos e que pode ser transmitida aos
seres humanos, sendo, portanto, uma zoonose. É causada por vírus mortal, tanto para os
seres humanos quanto para os animais. A transmissão ocorre quando o vírus existente
na saliva do animal infectado penetra no organismo, através da pele ou mucosas, por
mordedura, arranhadura ou lambedura. O morcego hematófago é um importante
transmissor da raiva porque pode infectar bovinos, eqüinos e morcegos de outras
espécies. Todos estes animais, uma vez infectados, podem transmitir a raiva, embora no
Brasil, o principal animal que a transmite ao homem é o cão.
A opção por esta doença se deve não apenas pelos dados fornecidos pela
Secretaria Municipal de Saúde de Cascavel, mas pela preocupação com sua contínua
evolução e avanço de casos. Em 1999, foram 521 casos; em 2000, 677 casos; em 2001,
621 casos; em 2002, 737 casos; em 2003, 640 casos; em 2004, 735 casos; em 2005, 823
casos; em 2006, 1110 casos. Ou seja, trata-se de uma epidemia cuja atuação dos
gestores ainda carece do apoio de subsídios e pesquisas na área.
Com relação ao que foi mencionado sobre os experimentos com o Sistema
Epidemiológico a ser desenvolvido serem direcionados para a cidade de Cascavel/PR,
cabe esclarecer que se trata de um estudo de caso, considerando a relação estabelecida
entre os proponentes deste projeto e a Secretaria Municipal de Saúde de Cascavel,
firmada principalmente por interesses comuns e pela proximidade. Porém, o que se
pretende realizar em fase posterior a proposta – dando continuidade a este projeto – é
estender o sistema de modo a contemplar as necessidades Estadual e Nacional.
Assim, a principal característica deste projeto é contribuir para o desenvolvimento
da computação através de estudos e pesquisas relativas a Fenômenos Epidemiológicos
pelo desenvolvimento de um sistema computacional complexo capaz de ser executado
em arquiteturas de memória compartilhada e distribuída. As funcionalidades previstas
neste projeto serão projetadas, desenvolvidas e implementadas através de oito módulos
sintetizados a seguir.
3.1 MÓDULO 1: MODELAGEM BIO-MATEMÁTICA
Os pesquisadores integrantes deste módulo têm por objetivo o desenvolvimento,
adaptação e parametrização de modelos matemáticos e estatísticos aos fenômenos
biológicos e epidemiológicos de interesse. Para isso faz-se uma contextualização
sintética a respeito das questões associadas a esses objetivos.
São várias as definições para Epidemiologia. Uma delas, abrangente e que enfoca
a saúde pública, é dada em (LAST, 1988): “epidemiologia é o estudo da freqüência, da
distribuição e dos determinantes dos estados ou eventos relacionados à saúde em
específicas populações e a aplicação desses estudos no controle dos problemas de
saúde”. Assim, a epidemiologia produz conhecimento sobre o processo saúde-doença
na população humana com a identificação de seus fatores determinantes.
Sob o aspecto individual, o percurso de uma doença é descrito pelo que se passa
entre o período em que o indivíduo começa a ter sintomas da doença e em que estes
acabam. Porém, do ponto de vista epidemiológico, em se tratando de doenças infectocontagiosas, é mais importante a distribuição espaço-temporal dos contatos tidos pelo
indivíduo infectado com outros indivíduos, e a forma como isso se repercute na
propagação da doença (GOMES, 2007).
Devido à relevância dessas questões e dada a importância que a Biologia está
tendo e continuará a ter para a humanidade nas próximas décadas (assim como teve a
Física nos séculos passados), é importante desenvolver a modelagem matemática e
computacional de fenômenos biológicos e, em particular, de fenômenos
epidemiológicos. Para fins epidemiológicos a modelagem tem dois objetivos claros. Um
diz respeito à simulação ou predição da disseminação da doença. O outro é relativo à
análise de procedimentos para prevenção, controle ou erradicação da doença.
A modelagem matemática e computacional de fenômenos epidemiológicos
consiste na efetiva construção de modelos computacionais. Ela inicia com a modelagem
lógica ou matemática do fenômeno, onde o modelo matemático é construído sob
hipóteses e considerações físicas, fisiológicas e biológicas. Ocorre que a interação entre
a Matemática, a Computação e a Biologia não é um acontecimento novo. As áreas da
Biomatemática ou Bioinformática já integram vários laboratórios ou departamentos de
muitos centros de pesquisa, nacional e mundial. Existe, inclusive, uma literatura técnica
especializada sobre a temática a exemplo de (KEENER; SNEYD, 2001), (MURRAY,
2002, 2003), (HOPPENSTEADT; PESKIN, 2004) e (EDELSTEIN-KESHET, 2005),
(YANG, 2001), (NOVAK; MAY, 2001) e (NOVAK, 2006).
Destaca-se que a modelagem matemática e computacional agrega conhecimentos,
procedimentos e técnicas que permitem construir um modelo computacional a partir do
problema ou fenômeno real, e isso significa que um modelo computacional fornece uma
aproximação da realidade. De fato, pois embora do ponto de vista individual a
sintomatologia, patologia e os mecanismos de transmissão da várias doenças infecciosas
são razoavelmente compreendidos, ainda existem fatores intra-indivíduos que devem ser
mais apropriadamente explicados. Também existem fatores supra-indivíduo que podem
complicar a modelagem como a biologia do agente infeccioso, as características do
hospedeiro e as características da doença em si, ou seja, a modelagem entre indivíduos
pode não contemplar as nuances necessárias à adequada modelagem.
Não obstante essas limitações, a Epidemiologia Matemática e Computacional
pode atender aos objetivos propostos, oferecendo aos diferentes usuários, distintos
cenários quanto à disseminação, prevenção, controle ou erradicação da doença. Pode-se
almejar, por exemplo, descrever a disseminação da doença e avaliar programas de
vacinação. E nesse caso é importante considerar aspectos como: tempo de geração de
uma infecção, capacidade de indução da imunidade por meio de vacina e capacidade de
transmissão da infecção.
Essas características e aspectos devem estar traduzidos no modelo que, do ponto
de vista matemático pode ter as características de ser determinístico ou estocástico;
contínuo ou discreto; linear ou não-linear; dinâmico ou estacionário. Cada um desses
atributos está profundamente associado ao fenômeno ou classe epidemiológica
modelada, e influencia fortemente na abordagem dada à solução do modelo.
Para melhor compreender considere-se que as doenças infecciosas podem ser de
transmissão direta ou não-direta. A transmissão direta consiste de infecções viróticas ou
bacterianas cuja disseminação ocorre diretamente, através de meio físico, entre os
indivíduos infectantes e suscetíveis, e se propagam a uma distância mediana através do
ar. A transmissão não-direta requer um agente transmissor ou contato físico íntimo,
podendo se propagar a grandes distâncias.
Para a transmissão direta pode-se utilizar, preferencialmente, modelo
determinístico do tipo compartimental. Tais modelos surgem quando se considera o
momento ou estado em que os indivíduos se encontram no desenvolvimento da doença
nos períodos latente e infeccioso. Neste caso, os indivíduos de uma comunidade
fechada, que não admite migração, podem ser subdivididos em classes imunes,
suscetíveis, infecciosos, latentes, e removidos. Então, constroem-se os conhecidos
modelos compartimentais SIS, SIR, SEIR, MSEIR, entre outros (GOMES, 2007),
discutidos no módulo 5 (Métodos e Estratégias de Solução). O modelo computacional a
ser especificado e implementado contemplará especificamente a doença da raiva, pelas
justificativas já postas na seção de identificação e caracterização do objetivo do projeto.
3.2 MÓDULO 2: TRATAMENTO DE DADOS GEOREFERENCIADOS
O mapeamento de eventos infecto-contagiosos é necessário para os Centros de
Vigilância Epidemiológica, pois o conhecimento do padrão geográfico da ocorrência e
da disseminação da doença pode fornecer informações sobre sua etiologia e
fisiopatologia. Além disso, as informações obtidas são importantes para efeitos de
registro e atualização dos bancos de dados local, regional ou nacional, como o
DATASUS (COSTA, 2007), (FELIPE, et al, 2007). Para atender a essas necessidades
em saúde pública emprega-se o Geoprocessamento e a Estatística Espacial de Áreas.
O Geoprocessamento é um conjunto de técnicas e métodos para a coleta,
tratamento, manipulação e apresentação de informações espaço-temporal. Mais
especificamente, se utiliza Sistemas de Informação Geográfica (SIG), que podem tratar
dados de expressão espacial estruturando-os adequadamente de maneira a otimizar a
manipulação integrada de seus três componentes essenciais – posição, topologia e
atributos – na execução de análises e aplicações gráficas (COSTA, 2007).
A estatística espacial de áreas estuda os métodos de análise espacial cuja
localização está associada a áreas delimitadas por polígonos. Esse caso ocorre com
muita freqüência quando se lida com eventos agregados por municípios, bairros ou
setores censitários dos quais não se dispõe da localização exata dos eventos, mas de um
valor por área. Dados de área envolvem elementos que associam o mapa geográfico a
uma base de dados (ASSUNÇÃO, 2001). Este mapa geográfico é dividido por áreas
onde cada uma delas possui uma ou mais variáveis aleatórias que representam um valor
para toda área e não apenas o valor de um ponto específico (este ponto seria, por
exemplo, o centróide da área). Neste caso, não se conhece a localização exata do evento,
mas sim um valor agregado por área.
O objetivo da análise espacial de área é verificar a existência de um padrão
espacial nos valores observados. A forma usual de apresentação dos dados agregados
por áreas é através de mapas coloridos com o padrão espacial do fenômeno. Quando
esse padrão espacial é observado, se faz necessário verificar se é aleatório ou apresenta
uma agregação definida, ou ainda, se esta distribuição pode ser associada a causas
mensuráveis. Quando são utilizadas técnicas de estatística espacial para análise de dados
de áreas, estas são apresentadas em forma de índices, gráficos de espalhamento e mapas.
Esta coleção de técnicas permite descrever e visualizar distribuições espaciais,
identificar situações atípicas (outliers), descobrir padrões de associação espacial,
agrupamento de valores semelhantes (clusters) e sugerir regimes espaciais ou outra
forma de heterogeneidade espacial (ANSELIN; BAO, 1997). Entende-se por outliers
espaciais, dados cuja localização pode exercer uma forte influência na hora de realizar
estimações. Para que sua presença não atrapalhe a análise é necessário verificar quais
dados são outliers a fim de distribuir seus efeitos. Já o cluster ou agrupamento espacial
pode ser definido como um agregado de ocorrências no espaço ou a ocorrência de
valores semelhantes em áreas próximas (CAMARA et al. 2004).
Os SIG comportam diferentes tipos de dados e aplicações como, por exemplo, o
monitoramento ou controle de epidemias, promovendo a integração de dados coletados
de fontes heterogêneas empregando mapas georeferenciados. Essa metodologia
possibilita avaliações sobre a evolução dos eventos infecto-contagiosos. De fato,
incorporando as informações sobre fenômenos de desenvolvimento espaço-temporal e a
dependência evolutiva dos dados, o uso dessa tecnologia tem fornecido contribuições
relevantes aos estudos de distribuição da ocorrência de doenças. Permite estimar
associações e interações entre indivíduos sadios e infectados, bem como melhor
compreender processos de disseminação das doenças, possibilitando a detecção de
potenciais fatores de risco (SZWARCWALD, et al, 2001).
Tudo isso vem ao encontro da principal preocupação da Epidemiologia, que é a
saúde coletiva de grupos de indivíduos que vivem em comunidades ou áreas, pois a
nesse caso a ela interessa a freqüência e o padrão de eventos relacionados a doenças na
população. Um outro elemento de preocupação da epidemiologia, é a busca pelo
entendimento da causa e de fatores que influenciam na ocorrência de eventos, que
também pode ser tratado com o emprego de SIG. De posse da freqüência e distribuição
desses eventos, pode-se comparar sua ocorrência em diferentes grupos populacionais
com diferentes características demográficas, genéticas, imunológicas, comportamentais,
de exposição ao ambiente e outros fatores e, desta maneira, implementar medidas de
prevenção e controle.
3.3 MÓDULO 3: SELEÇÃO DE CARACTERÍSTICAS E MINERAÇÃO DE DADOS
Os integrantes deste módulo têm dois objetivos principais, em momentos distintos
do projeto. Em um primeiro momento, o objetivo primário será conhecer os dados de
epidemiologia existentes, buscando correlações entre as variáveis, selecionando as que
sejam mais discriminantes no conjunto de dados (feature selection), de forma a reduzir
sua dimensionalidade. Em um segundo momento, serão desenvolvidas e adaptadas
técnicas de mineração de dados para visualização e descoberta de padrões em bases de
dados epidemiológicas, de forma a conceber hipóteses e predições que agreguem
conhecimento sobre as epidemiologias abarcadas neste projeto.
Para atingir esses objetivos será preciso considerar que a grande necessidade de
informações que auxiliem no planejamento e na tomada de decisão requer o uso
eficiente de armazenamento em banco de dados e de técnicas de análise
computadorizadas. Como na primeira fase do projeto não se prevê grandes volumes de
dados, pretende-se trabalhar em um arcabouço para mineração de dados, realizando
experimentos que ajudem os especialistas de domínio na compreensão dos fenômenos
epidemiológicos ocorridos.
Uma das características fundamentais da abordagem de banco de dados é fornecer
algum nível de abstração de dados, pela omissão de detalhes de armazenamento que não
são necessários para a maioria dos usuários. O modelo de dados é a principal ferramenta
que fornece esta abstração. Um modelo de dados é um conjunto de conceitos que podem
ser usados para descrever a estrutura de uma base de dados. Por estrutura de uma base
de dados entende-se os tipos de dados, relacionamentos e restrições pertinentes aos
dados, visando um armazenamento eficiente. Muitos modelos de dados também
definem um conjunto de operações para especificar como recuperar e modificar a base
de dados.
Para além da modelagem para armazenamento eficiente, há que se ter uma
eficiente recuperação de informação. Esta recuperação pode se viabilizar através de
linguagem de consultas como SQL (Structured Query Language) (ELSMARI;
NAVATHE, 2005), por meio de relatórios estáticos e gráficos OLAP (On-line
Analytical Processing) (HARRISON, 1998) e pela manipulação, via interface, de
sentenças em linguagem natural, que traduzidas ao sistema retornam as solicitações dos
usuários. Os dados existentes ou gerados podem ultrapassar em muito a capacidade dos
analistas em realizar consultas e análises. Além disso, as estruturas geradas (tabelas,
dimensões e cubos) podem ser numerosas, inviabilizando uma análise manual da
informação.
Outra forma de auxiliar os analistas na compreensão de seus dados é
disponibilizar ferramentas inteligentes capazes de buscar automaticamente padrões,
comportamentos e tendências existentes nos dados, por meio da mineração de dados
(Data Mining – DM) (HAN; KRAMBER, 2000) e visualização de informação (KEIM,
2002), que objetivam descobrir conhecimentos ocultos em bases de dados. Dessa forma,
a utilização de conceitos de DM fornece novas oportunidades para aprender fatos a
partir de bancos de dados existentes.
Note-se que diferentes massas de dados oriundas da medicina, economia,
astronomia, geologia, epidemiologia, entre outras áreas, podem ser alvo de aplicação do
DM (CARVALHO, 2001), haja vista o objetivo ser de descobrir, de forma automática
ou semi-automática, o conhecimento que está "oculto" nas grandes quantidades de
dados armazenados em bancos de dados.
Considerando que essas bases de dados podem ser muito grandes, seja em
quantidade de registros armazenados, como em variáveis que as descrevem (atributos),
um processo de seleção de características, como descrito em (LEE, 2005) faz-se
necessário para reduzir esforços computacionais e tempo de resposta. Para além desse
fato, a qualidade das informações contidas nessas bases de dados é imprescindível para
o bom resultado de um algoritmo de mineração de dados, sendo, em muitos casos,
necessária uma etapa anterior, que é o pré-processamento, para tratamento e adequação
dos dados para uma análise efetiva (BOSCARIOLI, 2005).
Há várias tarefas de mineração de dados, como classificação, predição, incluindo
a classificação e a regressão, a associação e a análise de agrupamento de dados
(DUNHAM, 2002). Cada tarefa pode ser considerada como um tipo de problema, que
objetiva um determinado tipo de conhecimento. Diversos métodos distintos, como redes
neurais, indução de árvores de decisão, sistemas baseados em regras e algoritmos
estatísticos, tanto isoladamente quanto em combinação, podem ser aplicados ao
problema.
Faz-se necessário dar significado a uma quantidade cada vez maior de
informações contidas nas bases de dados. Antes de realizar qualquer análise, o objetivo
é qualificar e armazenar os dados a serem trabalhados e encontrar novas formas de
visualizá-los de maneira mais natural e transparente para os usuários. Assim, a
visualização de dados assume um papel importante já que, em vários momentos existe,
a necessidade de interação entre o processo de descoberta e o ser humano. Pode-se citar
como exemplo a análise prévia dos dados que fazem parte do processo, onde são
realizadas algumas consultas usando ferramentas de análise ou mesmo de visualização
de dados, podendo-se também recorrer a diferentes formas, como gráficos, relatórios,
ícones e figuras. Portanto, embora a gestão de saúde pública no Brasil tenha obtido
avanços significativos e haja disponibilidade de informações sobre doenças na Internet,
ainda é incipiente a elaboração de sistemas analíticos para tomada de decisão em saúde.
De acordo com (NAFFAH FILHO; CECÍLIO, 2006), há a necessidade de
sistemas que disponibilizem informações de saúde, e não apenas dados, entendendo
dado como uma expressão estática da informação que, ao contrário, é obtida através de
complexo processo de correção, agregação, organização e análise.
3.4 MÓDULO 4: ENGENHARIA DE SOFTWARE
O objetivo deste módulo é efetuar a engenharia de software para o sistema
computacional a ser desenvolvido neste projeto. Entende-se sistema como um conjunto
de elementos inter relacionados que interagem na constituição e função dos mecanismos
computacionais a serem utilizados, direta ou indiretamente, no contexto de fenômenos
epidemiológicos. Sendo assim, este sistema é entendido como um sistema complexo.
Produzir sistemas computacionais complexos, a exemplo do que acontece quando
do desenvolvimento de sistemas computacionais tradicionais, também requer
engenharia de software. A questão que se coloca, no entanto, é como melhor conduzir
essa engenharia considerando que, até o momento, não existe na literatura processos já
consolidados que abranjam simultaneamente a modelagem computacional, o tratamento
de grandes volumes de dados, a utilização via web, bem como o processamento paralelo
e distribuído, como se pretende com o presente projeto.
A literatura referente ao desenvolvimento de sistemas complexos ainda está
fragmentada dificultando o trabalho e o avanço direcionado. Exemplo dessa
fragmentação, apenas a título de citar dois aspectos importantes, são metodologias como
a Sempa (LUKSCH ET AL., 1997) e a tradicional de Foster (FOSTER, 2007), no que se
refere ao processamento paralelo e distribuído, e os processos de engenharia de
requisitos já tradicionais de Kotonya e Somerville (KOTONYA; SOMERVILLE,
1997). Ou seja, existem metodologias e processos na literatura, porém, não são
integrados, consolidados ou genéricos o suficiente para atenderem a características e
particularidades de sistemas complexos.
Além disso, há ainda dois agravantes no desenvolvimento deste projeto: a
interação entre uma equipe multidisciplinar evidenciando necessidades, concepções e
metodologias de trabalho diferentes, e o fato de estar-se concebendo um projeto que
apresenta demandas específicas tanto em termos de ferramentas para apoiar a
engenharia de software quanto da especificação e utilização de ferramentas e métodos,
ainda não bem difundidos e utilizados conjuntamente.
Especificamente, a engenharia de requisitos se dedica ao descobrimento,
documentação e gerenciamento de requisitos que em síntese, são os fenômenos que
ocorrem no ambiente ou domínio da aplicação. Esses requisitos variam desde aqueles
mais elementares ao sistema, passando pelos relativos a restrições de desempenho,
padrões, linguagem para implementação, chegando a propriedades como sigilo e
funcionalidades oriundas da interface. Um processo adequado de engenharia de
requisitos é fundamental na construção de softwares que atendam com maior adequação
e qualidade as necessidades e expectativas identificadas.
Neste sentido, e considerando a natureza do sistema a ser implementado, há que
se reconhecer a importância de não inserir erros em seus requisitos e,
conseqüentemente, nas demais etapas de seu desenvolvimento. Gerar requisitos
inconsistentes, incompletos, ou ainda, que não satisfaçam as reais necessidades é fatal
para qualquer sistema computacional. Portanto, a escolha e/ou adaptação de
metodologias, técnicas e ferramentas a serem utilizadas no desenvolvimento e aplicação
do sistema certamente contribuirá para a geração de softwares mais próximos à
realidade epidemiológica com a qual se quer trabalhar.
Portanto, neste módulo se pretende desenvolver a engenharia de software
necessária ao sistema a ser construído, empregando e/ou adaptando técnicas e
ferramentas tradicionais ou não no processo de desenvolvimento de software, visando
subsidiar toda a equipe envolvida neste projeto. Pretende-se também definir todos os
padrões de software para o sistema, bem como refletir e discutir questões que
contribuam para fazer avançar a concepção atual sobre construção de sistemas
computacionais complexos (SBC, 2006).
3.5 MÓDULO 5: MÉTODOS E ESTRATÉGIAS DE SOLUÇÃO
Os integrantes deste módulo têm por objetivo especificar, projetar e desenvolver
as abordagens computacionais a serem adotadas para solução dos modelos
epidemiológicos, especialmente quanto à simulação da disseminação de determinadas
doenças.
Note-se que os métodos, estratégias e abordagens de solução discutidos neste
módulo devem estar associados aos modelos matemáticos especificados no Módulo 1
(Modelagem Matemática), sendo que esses modelos podem ter características de serem
determinístico ou estocástico; contínuo ou discreto; linear ou não-linear; dinâmico ou
estacionário. Essas características estão associadas a determinado fenômeno
epidemiológico, e induz quase naturalmente as escolhas a serem feitas.
A classe de modelos determinísticos abrange os conhecidos modelos
compartimentais do tipo SIS, SIR, SEIR, MSEIR, entre outros, que geralmente são
utilizados para diferentes classes epidemiológicas. De fato, a classe M (imunes) referese aos indivíduos com imunidade passiva. Esse tipo de imunidade acontece quando
alguns anticorpos são transferidos pela mãe através da placenta. Dessa forma, o recémnascido possui imunidade temporária a algum tipo de infecção. Após o desaparecimento
desses anticorpos, o indivíduo é movido para a classe dos suscetíveis (S). Crianças que
nascem sem a presença de anticorpos automaticamente pertencem à classe S. A classe S
inclui todos os indivíduos que podem contrair a infecção. Um contato adequado entre
um indivíduo suscetível e um indivíduo infectado faz com que o suscetível mova-se
para a classe dos expostos (E). A classe E inclui os indivíduos que estão na fase de
latência, ou seja, já foram infectados pelo micro-organismo, mas que ainda não são
capazes de transmiti-lo a outros indivíduos. Após o período de latência, o indivíduo
entra na classe dos infectados (I), e ser torna capaz de transmitir a doença a outros
indivíduos. Quando o período infeccioso termina, o indivíduo entra na classe dos
recuperados ou removidos (R). A classe R inclui todos os indivíduos que se
recuperaram da infecção (ou foram removidos) e adquirem imunidade, mesmo que
temporária, à doença (GOMES, 2007).
Solução Determinística
A modelagem para as classes epidemiológicas que geram os modelos do tipo
compartimental podem ser representados por sistemas de equações diferenciais.
Modelos determinísticos podem ser resolvidos quando discretizados e solucionados por
métodos numéricos apropriados como, por exemplo, os de Runge-Kutta, quando a
abordagem é explícita. Para abordagens implícitas ou semi-implícitas empregam-se
métodos iterativos estacionários ou não estacionários, como o SOR ou o gradiente
conjugado ou GRMES, respectivamente. A análise das características do esquema
numérico obtido a partir das equações discretizadas conduz à adequada escolha por esta
ou aquela estratégia de solução.
Solução Heurística ou Probabilística
Os mesmos sistemas de equações diferenciais evolutivas que podem ser
resolvidos por abordagens numérico-deterministas podem, também, ser resolvidos,
usando heurísticas e processos estocásticos como, por exemplo, os discutidos a seguir.
Autômatos Celulares
Os Autômatos Celulares consistem de simulações discretas no tempo, espaço e no
estado do sistema. Esses modelos consistem em considerar cada posição (ou região) do
domínio espacial como sendo uma célula, à qual é atribuído um estado. O estado de
cada célula é modificado de acordo com o seu estado e o de suas vizinhas na etapa de
tempo anterior, através de uma série de regras simples que tentam imitar as leis físicas
ou biológicas que regem o sistema (PEIXOTO; BARROS, 2004).
Nesta abordagem, as variáveis de estado do sistema, assim como o tempo, são
discretas. O sistema é representado espacialmente através de um reticulado de células
que interagem obedecendo a algumas regras de mudança de estado. A dinâmica do
sistema como um todo depende desta interação local entre as células. Cada célula
representa um indivíduo, que pode estar em um compartimento do tipo M, S, E, I ou R.
A chance de que um indivíduo suscetível se torne infectado vai depender do
número de contatos que ele estabelece com outros indivíduos no intervalo de tempo
adotado e também da probabilidade de que cada contato resulte em transmissão Pode
depende também do tipo da doença e de como ela se propaga. A chance com que cada
indivíduo se recupere da doença é também levada em conta.
Redes Complexas
Muitos modelos epidemiológicos assumem que os contatos entre os indivíduos
das diversas classes são homogêneos, sem levar em consideração aspectos espaciais e
que os contatos são feitos através de interações individuais. Dessa forma, estes modelos
podem obter resultados que não condizem com a realidade. Uma das formas utilizadas
para a modelagem dos contatos é o uso de redes complexas. Essas redes podem ser
representadas em grafos onde os vértices são as pessoas e as arestas representam os
possíveis contatos pelos quais as doenças se propagam.
A utilização de redes complexas na dinâmica de epidemias tem sido estudada
recentemente de maneira geral em diversos tipos de redes, tal como as Redes de Mundo
Pequeno (Small-World) e Redes de Escala Livre (Scale-Free Network).
O conceito de redes de Mundo Pequeno foi introduzido no contexto de redes
sociais e baseia-se na observação de que existe na natureza uma variedade de sistemas
cujos elementos estão relativamente próximos uns dos outros, apesar do tamanho
significativamente grande destes sistemas (KOEHLER, 2004). O objetivo do modelo de
Redes de Mundo Pequeno é descrever apropriadamente a pequena distância entre os
elementos e ao mesmo tempo obter um alto índice de aglomeração. Estas duas
características, conhecidas como efeito Mundo Pequeno, são observadas em vários
sistemas sociais e podem ser interpretadas como resultado dos padrões de interação
entre os indivíduos destes sistemas, independentemente das limitações geográficas.
Em termos epidemiológicos, Redes de Mundo Pequeno implicam que o nível de
infecciosidade requerido para a doença depende da alta sensibilidade da conexão
topológica da população. A alta clusterização nessas redes implica que a doença
propaga-se localmente de maneira muito rápida enquanto que o curto caminho da rede
permite que a doença atinja grandes distâncias no grafo.
Já o modelo para Redes de Escala Livre mais utilizado atualmente é o modelo de
Barabási-Albert (BA). Neste modelo as redes apresentam uma ordem na dinâmica de
estruturação, com características bem específicas. Uma das principais características,
denominada conexão preferencial, é a tendência de um novo vértice se conectar a um
vértice da rede que tem um grau elevado de conexões. Essa característica implica em
redes com poucos vértices altamente conectados, denominados hubs, e muitos vértices
com poucas conexões. Desta maneira, não faz sentido falar de escala ou número médio
de arestas (PASTOR-SATORRAS; VESPIGNANI, 2001).
A proposição básica do modelo é a de que as redes não são construídas de uma só
vez, mas sim ao longo do tempo, e que apesar do processo de construção ter
ingredientes aleatórios, obedece também a certas regras. Mais precisamente, consideram
que à medida que a rede cresce e que novos nodos são acrescentados, estes vão se ligar
preferencialmente aos nodos com maior grau. Este cenário é plausível para muitas redes
com grande número de nodos. Assim, se tratamento for dado aos indivíduos mais ativos
(mais conectados) numa rede de contatos, é possível prevenir melhor a epidemia.
Agentes
Modelos baseados em agentes podem ser utilizados para simular fenômenos reais
através da construção de agentes computacionais individuais com propriedades
específicas e simular interações entre eles. Um agente apresenta um comportamento que
é conseqüência de suas percepções sobre o ambiente e de suas interações com outros
agentes. Das interações entre muitos agentes podem emergir fenômenos globais
incluindo comportamentos coletivos. Assim, empregam-se agentes computacionais para
compreender o impacto dos comportamentos individuais sobre os fenômenos coletivos
nos casos em que não é possível compreendê-los de maneira dedutiva ou analítica.
Basicamente existem três abordagens multiagente aos sistemas complexos:
analítica quando a ênfase está em cada um dos elementos (economia neoclássica,
propriedade, indivíduo, entre outras); holística ou sistêmica quando a ênfase está no
comportamento global do sistema (macro-economia, modelos com compartimentos,
modelos estatísticos); construtivismo a ênfase está na articulação entre os
comportamentos individuais dos elementos e o comportamento global do sistema
(BOMEL, 2007).
Apesar de os modelos baseados em agentes não serem recentes, é ainda recente
sua utilização na modelagem de sistemas complexos e simulações. Nesses casos, a
modelagem de um ambiente como um todo (macro) é feita definindo os níveis mais
detalhados (micro) das relações entre os agentes com propriedades específicas (SUN,
CHENG). Com o uso de agentes computacionais pode-se buscar compreender as
estruturas complexas das interações sociais.
3.6 MÓDULO 6: SOLUÇÃO PARALELA E DISTRIBUÍDA
Com a atual multidisciplinariedade em diversas áreas de pesquisa, torna-se cada
vez mais freqüente a necessidade e a importância de utilizar a simulação computacional
aplicada a fenômenos naturais, industriais, sociais, entre outros, uma vez que a esses
sistemas complexos estão associados dados e informações que requerem a modelagem
computacional para sua melhor compreensão, com vistas a estabelecer ações de
interesses.
Mas para a consecução da simulação computacional, primeiramente esses
fenômenos devem ser modelados em linguagem matemática, e os modelos matemáticos
decorrentes não possuem, em geral, solução na forma explícita. É necessário, pois, obter
aproximações utilizando métodos que geram expressões discretas que, então, são
resolvidas através de abordagens numérico-computacionais.
Além disso, muitas das aplicações de interesse científico, tecnológico, econômico
ou social manipulam grande quantidade de dados e requerem um alto poder de
processamento para obter soluções acuradas e rápidas, demandando a construção de um
modelo computacional paralelo. Um dos objetivos do presente projeto é projetar e
implementar uma modelagem computacional que viabilize explorar o paralelismo em
arquiteturas de memória compartilhada e distribuída.
Sinteticamente, pode-se conceituar processamento paralelo e distribuído como o
processamento de informações com ênfase na exploração de eventos concorrentes no
processo computacional, implicando na divisão de uma determinada aplicação, de
maneira que as partes possam ser executadas concorrentemente, por vários elementos de
processamento (CODENOTTI; LEONCINI, 1992).
Note-se que a construção efetiva de um modelo computacional paralelo para
simular tais fenômenos abrange várias etapas, que vão desde a definição do modelo
matemático até a análise e a validação dos resultados. Ou seja, aplicações realísticas
devem considerar, especialmente e quando forem aplicáveis: os modelos matemáticos
que descrevem os fenômenos; a malha numérica; os métodos de discretização e funções
interpolantes para construir os esquemas numéricos; o particionamento de malha; as
estratégias e técnicas de paralelização para a paralelização ou decomposição do
problema; os métodos de solução; o problema de mapeamento e balanceamento da
carga. Essas questões devem ser levadas em conta quando do projeto do modelo
computacional paralelo, sobretudo se é um cluster a arquitetura computacional onde
código implementado será executado.
Conceitualmente, um cluster – particularmente um cluster de PCs – é uma coleção
de computadores chamados de nodos, os quais são utilizados para obtenção de alto
desempenho. Estas máquinas são fisicamente interconectadas por uma rede local de alto
desempenho (BUYYA, 1999). A combinação de baixo custo de aquisição e de
manutenção desses sistemas, por causa da utilização de componentes de propósito geral,
aliada às opções de redes de baixa latência tem impulsionado seu emprego em
simulações computacionais que requerem alto desempenho, visto que eles têm se
mostrado uma opção acessível e eficiente.
Os nodos de um Cluster de PCs podem trabalhar como se fossem um único e
integrado sistema, e podem ter um ou mais processadores. Quando há mais de um
processador por nodo, a arquitetura é dita multiprocessada e, neste caso, deve-se
explorar o paralelismo intra e inter-nodal. No paralelismo inter-nodal, a memória é
distribuída e os processos comunicam-se por troca de mensagens. No paralelismo intranodal, a memória é compartilhada e o paralelismo é explorado usando threads ou
processos escalonados pelo sistema operacional.
A UNIOESTE dispõe de um cluster de 18 nodos monoprocessados Pentium 4 3.0
GHz, com 1 GB de memória, 1MB de memória cache e HD de 80 GB, interconectados
por rede Gigabit-Ethernet, utilizando sistema operacional Linux. Neste cluster, a
exploração do paralelismo é feita através de troca de mensagens, utilizando a biblioteca
MPICH, do padrão MPI.
Um dos objetivos deste projeto é montar um mini-cluster empregando
processadores multicore, de modo a atender as necessidades de memória e de
processamento requeridas pelo modelo computacional a ser desenvolvido. A tecnologia
multicore (múltiplos núcleos) consiste em colocar duas ou mais unidades de execução
no interior de um chip. Uma arquitetura multicore é geralmente um sistema de
multiprocessadores simétricos (SMP) construído em um único circuito VLSI (Very
Large Scale Integration) (INTEL MULTICORE, 2007). O sistema operacional trata
esses núcleos como se cada um fosse um processador diferente, com seus próprios
recursos de execução. Com isso pode-se melhorar o paralelismo no nível de threads,
especialmente às aplicações que não conseguem se beneficiar dos processadores
superescalares atuais por não possuírem um bom paralelismo no nível de instruções.
Adotando processadores multicore para os nodos do cluster, obtém-se uma
arquitetura tanto de memória distribuída (entre os nodos) quanto compartilhada (entre
os núcleos dos processadores). Pode-se, então, explorar o paralelismo intra-nodal e o
inter-nodal escrevendo o código computacional utilizando o padrão MPI.
Mas como o padrão MPI é portável, ele pode ser utilizado em clusters
multiprocessados, além do monoprocessado. Porém, embora a troca de mensagens seja
necessária para a comunicação entre os nodos, ela não é a forma mais indicada de
comunicação em arquiteturas com memória compartilhada. Um modelo de exploração
de threads como OpenMP ou Pthreads, pode oferecer uma estratégia mais eficiente de
paralelização neste caso. Assim, a combinação do uso de threads e troca de mensagem
em uma mesma aplicação pode fornecer uma forma de paralelização mais eficiente que
utilizar apenas MPI.
3.7 MÓDULO 7: VISUALIZAÇÃO CIENTÍFICA
Os integrantes desse módulo têm por objetivo definir as ferramentas de software e
implementar algoritmos necessários para a visualização científica dos resultados obtidos
no projeto.
A primeira definição de Visualização Científica surgiu como uma forma de
comunicação que transcende as aplicações e os limites tecnológicos (MCCORMICK,
DEFANTI, BROWN, 1987). Nesta época percebeu-se a necessidade de associar os
métodos de computação gráfica às simulações realizadas em supercomputadores.
A Visualização Científica caracteriza-se pela aplicação de métodos de
computação gráfica para projetar um conjunto de dados multidimensionais num plano
de visualização bidimensional, objetivando facilitar o entendimento das estruturas
presentes nestes dados.
As técnicas de visualização científica devem explorar a capacidade do ser humano
de perceber padrões, exceções, tendências e relacionamento através do uso de diversos
atributos visuais (forma, cor, posicionamento, tamanho, etc.) que produzam gráficos
facilmente interpretáveis. Também deve possibilitar a navegação interativa na tela,
permitindo aproximação, rotação, reposicionamento e varreduras sobre a área exibida.
Essas características combinadas aumentam a capacidade de interpretação do usuário,
permitindo que ele ganhe uma visão aperfeiçoada sobre os dados (SANTOS, 2001 apud
DUARTE et al.).
Atualmente as técnicas de visualização científica têm sido desenvolvidas para
proporcionar uma melhor compreensão de dados tridimensionais oriundos de processos
de amostragem, simulações e modelagem computacionais. Neste contexto o tempo pode
ser considerado uma das dimensões envolvidas no processo; explorando a relação
espaço-tempo podemos compreender o comportamento dinâmico das estruturas
presentes nos dados.
As mais diversas áreas de conhecimento utilizam-se destas técnicas como a
medicina, geociências, sensoriamento remoto, meteorologia, química, astrofísica,
engenharias entre outras. No contexto deste projeto técnicas de Visualização Científica
serão empregadas para auxiliar na compreensão da estrutura do fenômeno
epidemiológico, numa perspectiva das interações existentes entre os elementos
envolvidos no processo de disseminação da raiva.
Para cumprir esta meta diferentes técnicas de Visualização Científica serão
estudadas; as que forem julgadas mais adequadas aos propósitos do projeto serão então
empregadas. Empregadas no sentido de que, prioritariamente, serão utilizados Sistemas
de Visualização Científica já existentes como o VisIt (VISIT) e o Vis5d+ (VIS5D), por
exemplo. Outros poderão ser utilizados desde que sejam gratuitos, livres e de código
aberto, como os aqui citados.
Para visualizar e manipular dados georeferenciados será utilizada a ferramenta
TerraView. O TerraView é um aplicativo, livre e de código aberto, desenvolvido pela
Divisão de Processamento de Imagens do Instituto Nacional de Pesquisas Espaciais
(DPI/INPE). Este aplicativo é construído sobre a biblioteca de geoprocessamento
TerraLib e tem como objetivo apresentar à comunidade um fácil visualizador de dados
geográficos com recursos de consulta e análise destes dados, manipulando dados
vetoriais (pontos, linhas e polígonos) e matriciais (grades e imagens), ambos
armazenados em SGBD relacionais ou geo-relacionais de mercado, incluindo ACCESS,
PostgreSQL, MySQL e Oracle (TERRAVIEW).
3.8 MÓDULO 8: SISTEMAS WEB
Com as possibilidades oferecidas pela Internet, surgiram (e continuam a surgir)
demandas por aplicações em rede, os web sites, que tendem a apresentar cada vez mais
funcionalidades de facilidades. Em resposta a essas demandas, diversas ferramentas de
trabalho e acesso às informações disponíveis começaram a ser desenvolvidas, não
apenas com objetivo de dinamizar o fluxo de informações, mas também de facilitar a
vida dos usuários. Os WebApps, definidos por Pressman (PRESSMAN, 2006) como
sistemas que vão de uma simples página web ao fornecimento de serviços completos, e
em especial esses últimos, são hoje um dos grandes temas de interesse da computação.
As aplicações web possuem algumas características que, diferentemente dos
sistemas computacionais tradicionais, fazem delas sistemas bastante peculiares. Suh
(SUH, 1999), ao discorrer sobre essas características, aponta algumas que merecem
destaque. Em primeiro lugar, não é possível especificar prévia e completamente
aplicações web, como nos sistemas computacionais tradicionais, porque tanto sua
estrutura quanto funcionalidade tendem a se modificar principalmente depois que o
sistema é colocado em uso. Em aplicações web, os dados não se restringem apenas a
textos; incluem figuras, áudios e vídeos, cujo tratamento exige procedimentos mais
especializados do que aqueles usados para textos. Também, em geral, requerem
segurança e garantia de serviço e da privacidade das informações que manipulam. Se
por um lado os usuários dos sistemas convencionais são pessoas treinadas, os de web,
no geral, não são. Dentre eles, tanto pode haver os que detêm larga experiência com
computadores, quanto aqueles com pouca ou quase nenhuma habilidade.
Essa complexa matriz de conteúdo e funcionalidade produzida por aplicações
baseadas na web requer um tratamento computacional que seja ao mesmo tempo
eficiente e sistematizado. Para tanto, a investigação e a implementação de métodos e
técnicas computacionais que assegurem a qualidade, confiabilidade, usabilidade e
adaptabilidade ao sistema, são imprescindíveis.
Nesse projeto, um WebApps será projetado, implementado e disponibilizado, e
consistirá de dois módulos distintos. O primeiro deles, o Sistema Web de
Acompanhamento do Projeto (SWAP) conterá mecanismos de interação e comunicação
entre a equipe multidisciplinar envolvida neste trabalho, de maneira a facilitar o
acompanhamento do desenvolvimento do mesmo em todas as suas etapas de execução.
Dentre as ferramentas a serem disponibilizadas no SWAP, citam-se, por exemplo,
páginas wiki para documentação dos sistemas e especificação de padrões, fórum de
discussão, mecanismos que propiciem a escrita colaborativa de textos e a identificação
de agendas, cronogramas e lista de atividades. No SWAP serão disponibilizados
relatórios técnicos parciais, relatórios de acompanhamento de atividades de bolsistas,
sínteses sobre reuniões técnicas, sínteses sobre visita e contribuições de pesquisadores
convidados, resultados de seminários de avaliação, entre outros.
O segundo módulo, denominado de Sistema Web de Acesso a Informações
Epidemiológicas (SWAIE), estará voltado para o atendimento ao usuário e agrega os
quatro grandes sistemas que serão implementados e disponibilizados via web: o sistema
de simulações; o sistema integrado de informações epidemiológicas, o sistema de
conhecimento e o sistema de interface. O SWAIE contempla dois aspectos principais:
dados e conhecimento produzidos e utilizados no projeto e a interface de acesso a eles.
Com relação ao primeiro aspecto (dados e conhecimento produzidos e utilizados
no projeto), cabe assinalar que Sistema Epidemiológico a ser construído manipulará
dados estruturados e não estruturados. Com relação aos dados estruturados, será
construído um Sistema Web Integrado de Informações Epidemiológicas (SWIIE)
através do qual as entidades ligadas à Secretaria de Saúde, introduzirão os dados de
doenças de notificação obrigatória, hoje gerados manualmente e enviados a secretaria de
vigilância sanitária mais próxima (que os repassa ao DATASUS). A partir da
identificação dos requisitos (realizada no módulo 4, Engenharia de Software) o SWIIE
será implementado e disponibilizado. Ainda neste primeiro aspecto, serão construídos e
disponibilizados recursos para o acesso, utilização e visualização do sistema de
simulações.
Com relação o trabalho com dados não estruturados, a equipe deste módulo
pretende disponibilizar para a comunidade acadêmica e não acadêmica, o conhecimento
utilizado e gerado durante a execução deste projeto, em particular, aqueles referentes a
doenças de informação obrigatória. Esta disponibilidade requer que a forma de acesso a
essas informações, por diferentes públicos (por exemplo, pacientes, cidadãos,
profissionais em saúde e gestores) com diferentes necessidades e expectativas, seja
organizada de maneira a melhor atendê-los. Neste contexto, concebe-se que um Sistema
de Conhecimento (SC) representa uma solução interessante.
O que diferencia SCs de sistemas de informações tradicionais é que os SCs
conseguem responder a demandas que não têm uma solução algorítmica clara. Os SCs
são utilizados quando as tarefas a serem resolvidas necessitam de um alto grau de
conhecimento ou que o espaço de solução é tão grande que se torna inviável procurar
por todas as soluções possíveis (RUSSELL; NORVIG, 2004). Um dos principais
desafios na construção de um SC é a passagem dos modelos no nível do conhecimento,
que são livres dos detalhes de implementação e geralmente estão em um nível bastante
elevado de abstração, para um modelo que possa ser processado por um computador e
entendido ou utilizado por um usuário.
Os métodos, técnicas e ferramentas utilizadas nos SCs requerem que sejam
consideradas características também diferentes daquelas utilizadas em sistemas de
informações tradicionais. Questões como formas de representação de conhecimento,
raciocínio e incertezas devem e serão consideradas quando da implementação do SC
proposto. Assim, será desenvolvido um SC que agrega informações decorrentes de
sistemas especialistas (nos primeiros dois anos) sobre determinadas doenças de
notificação obrigatória. O SC poderá auxiliar profissionais em saúde na tomada de
decisões, solução de problemas e transmissão de conhecimento específico;
Com relação à interface, que constitui o segundo aspecto do SWAIE, as questões
que mais interessam a essa implementação dizem respeito à tentativa de encontrar uma
forma mais adequada e que requeira desse usuário “menos esforço”, seja com relação à
manipulação do sistema, ou relativamente à interpretação das informações retornadas.
Embora as soluções comumente adotadas sejam feitas com base em menus, aqui
se estará seguindo uma outra tendência: o uso de comandos de consulta escritos em
linguagem natural. Conforme Norman (NORMAN, 2003), não é suficiente que um
projeto seja construído apenas para funcionar ou apresentar funcionalidades que
revelem a sua capacidade para cumprir as tarefas para as quais foi projetado. Não é
aceitável deixar a cargo do usuário toda a responsabilidade de aprender como o sistema
funciona e, menos ainda, como interpretar os dados que lhes são apresentados como
saída.
O desenvolvimento de front-ends por meio de linguagem natural (LN), cada vez
mais, vem assumindo uma posição de destaque em processamentos que envolvem
grandes massas de dados sejam estruturadas ou não. Como, no entanto, comandos em
linguagem natural trazem consigo uma série de inconvenientes, especialmente para a
sua computação, tais como as ocorrências de ambigüidades sintáticas e lexicais, a
linguagem com a qual se pretende trabalhar, inspirada na proposta apresentada por
Popowich e outros (POPOWICH; HALL; FASS, 1996), pelo menos nessa primeira
etapa, terá um vocabulário reduzido e com as sentenças fixas e bem determinadas.
4. METODOLOGIA E ESTRATÉGIAS DE AÇÃO
Elemento importante para o sucesso deste projeto é sua estruturação gerencial. O
envolvimento da equipe multidisciplinar requer mecanismos e estratégias de ação que
dêem sustentação ao um desenho administrativo-organizacional para o adequado
desenvolvimento do projeto.
Este projeto se estrutura como uma matriz composta por oito módulos sendo que
cada módulo possui uma atribuição técnica-gerencial, e uma temática definida. Assim
sendo, a dinâmica das ações realizadas será concebida dentro de três estruturas
organizacionais básicas: a Comissão Técnico-Científica (CTC), a Comissão Executiva
(CE), e a Comissão Modular (CM), que se reunirão periodicamente.
O CTC será formado pelos coordenadores de cada módulo e terá como atribuições
principais orientar e monitorar o cumprimento dos objetivos e metas estabelecidos para
o projeto. O CE será formado por todos os proponentes do projeto (elencados nos itens
4.1 e 4.2), o bolsista para Desenvolvimento Tecnológico Industrial (DTI) e os bolsistas
de Iniciação Tecnológica Industrial (ITI) ingressantes no projeto através do
financiamento proveniente deste edital, vinculados a programas de iniciação científica
ou não, e alunos desses mesmos cursos em desenvolvimento de seus Trabalhos de
Conclusão de Curso (TCC). O CM será formado pelos integrantes de cada módulo, ou
seja, o coordenador e seus colaboradores.
Os integrantes de cada um dos oito módulos trabalharão seus objetivos internos
sempre tendo em vista o conjunto total dos objetivos do Sistema Epidemiológico. Para
garantir a interação da equipe e que as discussões e resultados alcançados localmente no
interior dos módulos sejam de acesso coletivo, serão utilizados via Web, os recursos
disponibilizados pelo denominado “Sistema Web de Acompanhamento do Projeto”
(SWAP). O SWAP disponibilizará mecanismos de interação e comunicação entre toda a
equipe, facilitando a administração de todo o projeto de maneira assíncrona. Ficarão
disponibilizadas no SWAP as referências bibliográficas importantes ao projeto, bem
como as produzidas, os padrões definidos, cronogramas de atividades, indicações de
responsabilidades, e outras informações relevantes.
Especificamente, os integrantes do módulo 4 (Engenharia de Software) terão entre
suas atribuições a responsabilidade de definir padrões, critérios de qualidade e garantir a
integração e documentação necessárias ao sistema como um todo. Aos integrantes do
módulo 6 (Implementação Paralela e Distribuída) caberá definir, acompanhar e dar
suporte ao uso de plataformas computacionais envolvidas e orientar na especificação do
mini-cluster que se pretende construir.
Com os recursos de capital provenientes deste projeto, será montado o
Laboratório de Sistemas Complexos (COMPLEX) O COMPLEX será o principal
laboratório de trabalho da equipe e nele os CEs desempenharão grande parte de suas
atividades.
Em linhas gerais, o projeto será conduzido seguindo as seguintes etapas: 1)
integração da equipe 2) especificação geral do sistema, 3) desenvolvimento do sistema,
4) avaliações e testes, e 5) produção bibliográfica.
Para alcançar essas etapas, a metodologia geral foi concebida tendo em vista as
atividades a serem desenvolvidas e o perfil dos participantes. As próximas três seções
identificam os participantes, caracterizam seus perfis e situam os grupos de pesquisa
envolvidos. Em seguida são apresentadas as atividades que serão executadas em cada
um dos oito módulos, identificando a estratégia de ação, os participantes e o conjunto de
ações. Por fim são feitos comentários sobre as relações entre os módulos.
4.1 Participantes
•
Adair Santa Catarina
•
Amarildo de Vicente
•
Aníbal Mantovani Diniz
•
Claudia Brandelero Rizzi
•
Clodis Boscarioli
•
Guilherme Galante
•
Huei Diana Lee
•
Ivonei Freitas da Silva
•
Jorge Bidarra
•
Luiz Antonio Rodrigues
•
Márcio Seiji Oyamada
•
Maria Fernanda Azevedo Pompilio Leonel Ferreira
•
Miguel Angel Uribe Opazo
•
Reginaldo Aparecido Zara
•
Rogério Luis Rizzi, Coordenador do Projeto
•
Victor Francisco Araya Santander
Exceto a participante Maria Fernanda Azevedo Pompilio Leonel Ferreira, todos os
demais são docentes da Universidade Estadual do Oeste do Paraná - UNIOESTE.
4.2 Perfil dos participantes
•
Adair Santa Catarina possui graduação em Engenharia Agrícola e em Informática
pela UNIOESTE. Fez mestrado em Engenharia Agrícola pela UNIOESTE.
Atualmente conclui seu doutorado em Computação Aplicada pelo Instituto Nacional
de Pesquisas Espaciais (INPE), e sua tese versa sobre uma arquitetura para
algoritmos genéticos com representação explícita de relacionamentos espaciais para
modelagem de fenômenos sociais e ambientais. Anteriormente, desenvolveu um
sistema automatizado para detecção de faces humanas baseado na Distância de
Hausdorff Modificada, um algoritmo genético para criação de modelos (Model
Breeder), e fez modelagem de distribuição de espécies.
•
Amarildo de Vicente possui graduação em Matemática pela Universidade Estadual
de Maringá, mestrado e doutorado em Engenharia de Produção pela Universidade
Federal de Santa Catarina. Tem experiência na área de Matemática, com ênfase em
Matemática Aplicada. Atua principalmente em Algoritmos Heurísticos e
Programação Matemática.
•
Aníbal Mantovani Diniz possui graduação em Engenharia Elétrica pela
Universidade do Estado de Santa Catarina e em Informática pela UNIOESTE e
mestrado em Ciências da Computação pela Universidade Federal de Santa Catarina.
Tem experiência em metodologia e técnicas da computação. Atua principalmente
em sistemas distribuídos, replicação, tolerância a falhas e J2EE.
•
Claudia Brandelero Rizzi possui graduação em Processamento de Dados pela
Universidade Estadual de Ponta Grossa, mestrado em Ciência da Computação pela
Universidade Federal do Rio Grande do Sul (UFRGS) e doutorado em Informática
na Educação também pela UFRGS. Trabalhou entre 1989 e 1994 em empresa na
área de gerenciamento e desenvolvimento de software. Atualmente é coordenadora
do projeto SISO, um Sistema Odontológico para Clínicas Universitárias, financiado
pelo Sistema Único de Saúde (SUS). Atua principalmente em Informática na
Educação e Inteligência Artificial.
•
Clodis Boscarioli é Bacharel em Informática pela universidade Estadual de Ponta
Grossa e mestrado em Informática pela Universidade Federal do Paraná. Atualmente
faz doutorado na Escola Politécnica da Universidade de São Paulo. Tem atuado em
ensino e pesquisas na área de Banco de Dados e em temas relacionados a mineração
de dados e interação humano-computador.
•
Guilherme Galante é graduado em Informática pela Universidade Estadual do Oeste
do Paraná e mestre em Ciências da Computação pela Universidade Federal do Rio
Grande do Sul. Trabalhou de 2001 até 2006 nos projetos Hidra e UnHidra (Modelo
Computacional Paralelo e Tridimensional para a Hidrodinâmica e o Transporte
Escalar de Substâncias) na paralelização de métodos numéricos para a solução de
sistemas de equações, utilizando decomposição de domínios e técnicas multigrid.
Suas áreas de interesse são: computação aplicada e processamento de alto
desempenho. Atualmente trabalha no projeto de pesquisa intitulado "Epidemiologia
Matemática e Computacional", no qual estuda modelos epidemiológicos em redes
de escala livre.
•
Huei Diana Lee possui graduação em Ciência da Computação pela Universidade
Estadual Paulista Júlio de Mesquita Filho, e mestrado e doutorado em Ciência da
Computação e Matemática Computacional pela Universidade de São Paulo.
Atualmente participa de quatro projetos de pesquisa na computação com ênfase em
inteligência artificial. Atua nas áreas da comutação aplicada à medicina,
aprendizado do máquina, bioinformática e biomecânica. Coordena o Laboratório de
Bioinformática – LABI da UNIOESTE, no qual são desenvolvidos diversos projetos
em parcerias com a Universidade de São Paulo em São Carlos, a Faculdade de
Ciências Médicas da Universidade Estadual de Campinas e a Itaipu Binacional.
•
Ivonei Freitas da Silva possui graduação em Informática pela Universidade Estadual
do Oeste do Paraná e mestrado em Ciência da Computação pela Universidade
Federal de Santa Catarina. Trabalhou entre 1998 e 2002 em empresa pública federal
– SERPRO (Serviço Federal de Processamento de Dados) na área de suporte à Infraestrutura de Tecnologia da Informação. Desenvolveu produto de software através de
projeto de iniciação cientifica. Colaborou no projeto de informatização de
bibliotecas da UNIOESTE. Coordenou projeto de informatização do Hospital
Universitário de Cascavel. Atualmente é professor na área de Engenharia de
Software onde orienta trabalhos de desenvolvimento de sistemas com qualidade
através de padrões de projetos e aplicação de testes.
•
Jorge Bidarra possui graduação em Informática e mestrado em Engenharia de
Sistemas e Computação pela Universidade Federal do Rio de Janeiro. Possui
doutorado em Lingüística pela Universidade Estadual de Campinas. Tem
experiência na área de Ciência da Computação, com ênfase em Processamento da
Linguagem Natural, atuando principalmente nos seguintes temas: lingüística
computacional, inteligência artificial, léxico eletrônico. Também desenvolve
pesquisas na área de agentes computacionais, em particular aplicados a sistemas de
controle automático inteligente e tecnologias assistivas. Atualmente, responde pela
coordenação geral do Núcleo de Inovações Tecnológicas (NIT) da UNIOESTE.
•
Luiz Antonio Rodrigues é graduado em Informática pela Universidade Estadual do
Oeste do Paraná e Mestre em Ciência da Computação pela Universidade Federal do
Rio Grande do Sul. Trabalhou na Companhia de Informática do Paraná (CELEPAR)
na administração de ambientes distribuídos. Atualmente trabalha com redes de
computadores, tolerância a falhas, sistemas distribuídos.
•
Márcio Seiji Oyamada possui graduação em Ciência da Computação pela
Universidade Estadual de Maringá e na mesma área pela Universidade Federal do
Rio Grande do Sul (UFRGS). Atualmente conclui seu doutorado em Ciência da
Computação também pela UFRGS. Tem experiência na área de Ciência da
Computação, com ênfase em arquitetura de sistemas de computação, atuando em
simulação de sistemas eletrônicos embarcados, arquitetura de computadores e
estimativa de desempenho de software.
•
Maria Fernanda Azevedo Pompilio Leonel Ferreira possui graduação em Medicina
pela Universidade de Taubaté, graduação em Comunicação Social pela Faculdade
Assis Gurgacz e Especialização em Saúde Pública pela Faculdade de Saúde Pública
da Universidade de São Paulo. É médica da Divisão de Vigilância Epidemiológica
da Prefeitura Municipal de Cascavel – PR, desde 1989.
•
Miguel Angel Uribe Opazo possui graduação em Estatística - Universidad Nacional
Mayor de San Marcos Lima-Perú, mestrado em Estatística pela Universidade
Estadual de Campinas e doutorado em Estatística pela Universidade de São Paulo.
Tem experiência na área Métodos Estatísticos e Geoestatística, atuando
principalmente em estudo de estatística espacial, controle estatístico de qualidade e
estatística experimental.
•
Reginaldo Aparecido Zara possui graduação em Física pela Universidade Estadual
de Maringá, mestrado e doutorado em Física pela Universidade de São Paulo. Tem
experiência na área de Física, com ênfase em equação de estado, equilíbrio de fases
e transições de fase, atuando principalmente em redes complexas e bioinformática.
•
Rogério Luís Rizzi possui graduação em Licenciatura em Matemática e graduação
em Licenciatura em Ciências com Habilitação em Matemática pela Universidade
Estadual do Oeste do Paraná. Possui mestrado em Matemática pela Universidade
Federal do Rio de Janeiro e doutorado em Ciências da Computação pela
Universidade Federal do Rio Grande do Sul. Tem experiência na área de
Matemática Aplicada e suas áreas de interesse são: Modelagem Matemática e
Computacional da Hidrodinâmica e do Transporte de Substâncias em Corpos de
água; Métodos Numéricos para Equações Diferenciais; Dinâmica de Fluidos
Computacional; Leis de Conservação Escalar; Biomatemática e Bioinformática.
•
Victor Francisco Araya Santander possui graduação em Ciência da Computação
pela Universidade Estadual de Maringá, mestrado em Ciências da Computação e
Matemática Computacional pela Universidade de São Paulo e doutorado na mesma
área pela Universidade Federal de Pernambuco. Tem experiência na área em
Engenharia de Software e atua principalmente com cenários, engenharia de
requisitos, e modelagem organizacional.
4.3 Grupos de Pesquisa Envolvidos
•
GIA – Grupo de Inteligência Aplicada: Líder: Profº Jorge Bidarra;
•
LES – Laboratório de Engenharia de Software: Líder: Profº Victor Francisco Araya
Santander;
•
Computação Aplicada a Medicina e Biologia: Líder: Profª Huei Diana Lee;
•
Matemática e Estatística Aplicadas: Líder: Profº Amarildo de Vicente;
•
Física Computacional: Líder: Profº Reginaldo Aparecido Zara;
•
GGEA - Grupo de Geoestatística Aplicada: Líder: Profº Miguel Angel Uribe Opazo.
4.4 Estratégias de Ação dos Oito Módulos
Estratégia de ação 1: Modelagem Bio-Matemática
a) Coordenadores e colaboradores: Amarildo de Vicente, Maria Fernanda Azevedo
Pompilio Leonel Ferreira, Reginaldo Aparecido Zara, Rogério Luís Rizzi,
Guilherme Galante, e alunos de iniciação científica ou tecnológica;
b) Conjunto de ações:
•
Análise de modelos bio-matemáticos já desenvolvidos, para os casos de
interesse;
•
Análise e adequação dos parâmetros e dados necessários e suficientes ao
processo de modelagem;
•
Conformação e parametrização desses modelos;
•
Discretização de tais modelos;
•
Construção de esquemas numéricos e de solução apropriados;
•
Testes numérico-computacionais;
•
Verificação, calibração e validação de modelos implementados, sob os enfoques
numérico, computacional e bio-matemático.
Estratégia de ação 2: Tratamento de Dados Georeferenciados
a) Coordenadores e colaboradores: Miguel Angel Uribe Opazo, Rogério Luis Rizzi,
Amarildo de Vicente, e alunos de iniciação científica ou tecnológica;
b) Conjunto de ações:
•
Análise dos dados interesse, sob os aspectos técnico e epidemiológico;
•
Coleta, tratamento, manipulação e apresentação de parâmetros, dados e
informações espaço-temporal necessários a atender os objetivos específicos
números 1, 2, 3 e 4 detalhados no item 3 da proposta;
•
Interação com o módulo 3, da seleção de características e mineração de dados.
Estratégia de ação 3: Seleção de Características e Mineração de Dados
a) Coordenadores e colaboradores: Clodis Boscarioli, Huei Diana Lee, e alunos de
iniciação científica ou tecnológica;
b) Conjunto de ações:
• Compreensão das bases de dados epidemiológicas disponíveis;
• Definição de objetivos de análise e correlação;
• Seleção e implementação de técnicas de mineração de dados que se adeqüem às
bases de dados e aos objetivos da análise;
• Seleção e implementação de recursos de visualização de informação que
permitam a interpretação dos dados gerados, por usuários finais da aplicação;
• Análise dos dados por várias técnicas, fazendo inferências que permitam
tomadas de decisões, avaliação e monitoramento de ações em saúde.
Estratégia de ação 4: Engenharia de Software
a) Coordenadores e colaboradores: Claudia Brandelero Rizzi, Ivonei Freitas da Silva,
Guilherme Galante, Maria Fernanda Azevedo Pompilio Leonel Ferreira, Victor
Francisco Araya Santander, e alunos de iniciação científica ou tecnológica;
b) Conjunto de ações:
•
Integração de toda a equipe do projeto com Secretaria Municipal de Saúde
(Vigilância em Saúde) da Prefeitura Municipal de Cascavel;
•
Estudar métodos de extração de requisitos que capturem variáveis relativas à
modelagem computacional de fenômenos epidemiológicos;
•
Especificar os Requisitos de Software do Sistema Web de Acompanhamento de
Projeto (SWAP);
•
Especificar os Requisitos do Sistema Web Integrado de Informações
Epidemiológicas (SWIIE);
•
Apoio (à equipe do módulo 8) na especificação dos Requisitos de Software do
Sistema de Conhecimento;
•
Apoio (à equipe do módulo 8) na especificação dos Requisitos de Software do
Sistema de Interface;
•
Definir padrões para interfaces entre os módulos e usuários;
•
Contribuir para as discussões sobre abordagens técnicas para a solução de
modelos epidemiológicos como SIS, SIR, SEIR, MSEIR, entre outros;
•
Estudo e definição de metodologias para paralelização de algoritmos para cada
abordagem;
•
Avaliação de metodologias para paralelização de algoritmos;
•
Aplicação de testes e acompanhamento a implementação dos softwares;
•
Estudo sobre o impacto, em engenharia de software, resultante da necessidade
de colaboração entre cientistas da computação e cientistas de outros domínios.
Estratégia de ação 5: Métodos e Estratégias de Solução
a) Coordenadores e colaboradores: Adair Santa Catarina, Amarildo de Vicente, Aníbal
Mantovani Diniz, Claudia Brandelero Rizzi, Clodis Boscarioli, Guilherme Galante,
Huei Diana Lee, Ivonei Freitas da Silva, Jorge Bidarra, Luiz Antonio Rodrigues,
Márcio S. Oyamada, Miguel Angel Uribe Opazo, Reginaldo Aparecido Zara,
Rogério Luís Rizzi, Victor Francisco Araya Santander, e alunos de iniciação
científica ou tecnológica;
b) Conjunto de ações:
• Avaliação de técnicas, métodos e estratégias já disponível na literatura técnica,
de modo a balizar as decisões quanto às abordagens que devem ser definidas
para a solução dos modelos;
•
Análise e especificação de estratégias de soluções considerando-se os modelos
matemáticos desenvolvidos e os dados disponibilizados;
•
Desenvolvimento e construção de estratégias específicas para solução
determinística, probabilística ou heurística para os modelos discretos;
• Desenvolvimento de estratégias específicas para os modelos epidemiológicos;
• Implementação das estratégias e métodos de solução;
•
Testes numérico-computacionais;
•
Verificação, calibração e validação de modelos implementados, enfocando as
estratégias de solução adotadas.
Estratégia de ação 6: Solução Paralela e Distribuída
a) Coordenadores e colaboradores: Guilherme Galante, Luiz Antonio Rodrigues,
Márcio Seiji Oyamada, Rogério Luís Rizzi, e alunos de iniciação científica ou
tecnológica;
b) Conjunto de ações:
•
Avaliação dos modelos propostos para a paralelização, de modo a escolher a
melhor forma de paralelizar a aplicação;
•
Revisão de métodos, algoritmos e interfaces com outros módulos do sistema
(entrada/saída de dados, interfaces de usuário e visualização de dados, por
exemplo);
•
Propor modelos para a paralelização das aplicações;
• Desenvolvimento de estratégias de paralelização específica para os modelos
epidemiológicos;
• Implementação das aplicações;
•
Testes numérico-computacionais;
•
Verificação, calibração e validação de modelos implementados, sob os enfoques
das estratégias de solução em paralelo.
Estratégia de ação 7: Visualização Científica
a) Coordenadores e colaboradores: Adair Santa Catarina, Guilherme Galante, Rogério
Luis Rizzi, e alunos de iniciação científica ou tecnológica;
b) Conjunto de ações:
• Testar os sistemas de visualização científica VisIt e Vis5d+;
• Estudar a estrutura de um banco de dados espaciais TerraLib;
• Instalar, compilar e testar o aplicativo TerraView;
• Auxiliar na definição da estrutura das bases de dados espaciais;
• Implementar as alterações necessárias no aplicativo TerraView para interagir
com o SWAIE;
• Integrar os sistemas de visualização científica aos dados provenientes das
aplicações implementadas.
Estratégia de ação 8: Sistemas Web
a) Coordenadores e colaboradores: Claudia Brandelero Rizzi, Adair Santa Catarina,
Aníbal Mantovani Diniz, Ivonei Freitas da Silva, Clodis Boscarioli, Jorge Bidarra,
Maria Fernanda Azevedo Pompilio Leonel Ferreira, Victor Francisco Araya
Santander e alunos de iniciação científica ou tecnológica;
c) conjunto de ações:
•
Colaboração com a equipe do módulo 4 (Engenharia de Software) na
especificação de requisitos dos sistemas Web, o SWAIE;
•
Prototipação do Software do Sistema Web de Acompanhamento de Projeto
(SWAP);
•
Adequações ao SWAP;
•
Coordenação (junto à equipe do módulo 4) da especificação dos Requisitos de
Software do Sistema Web Integrado de Informações Epidemiológicas (SWIIE);
•
Prototipação do SWIIE;
•
Coordenação (junto à equipe do módulo 4) da especificação dos Requisitos de
Software do Sistema de Conhecimento (SC);
•
Prototipação do SC;
•
Coordenação (junto à equipe do módulo 4) da especificação dos Requisitos da
Interface;
•
Definição da linguagem de comandos de acesso ao sistema;
•
Prototipação do sistema de interface;
•
Adequações aos Sistemas.
4.5 Relações entre os módulos e cronograma de execução
Inicialmente a equipe da modelagem bio-matemática (M1) estará trabalhando com
a modelagem da doença raiva (e a seguir, AIDS e Dengue). As equipes de tratamento de
dados georeferenciados (M2) e seleção de características (M3) estarão empenhadas no
entendimento das bases de dados já existentes (em particular o DATASUS) e na
modelagem das bases de dados necessárias ao Sistema Web Integrado de Informações
Epidemiológicas.
O conjunto de informações produzidas pelos módulos M1, M2 e M3, contribuirão
para que a equipe de engenharia de software (M4) especifique padrões e os requisitos
dos cinco principais sistemas a serem desenvolvidos: 1) Sistema Web de
Acompanhamento do Projeto (SWAP); 2) Sistema de Simulações; 3) Sistema Web
Integrado de Informações Epidemiológicas (SWIIE); 4) Sistema de Conhecimento; e 5)
Sistema de Interface.
Toda a equipe estará empenhada nas discussões sobre a escolha dos métodos e
estratégias de solução das simulações (M5) que serão implementadas de maneira
paralela e distribuída (M6), cujos resultados poderão ser visualizados (M7). Os
resultados das simulações serão analisados e serão sistematizados de maneira a facilitar
a compreensão dos gestores em saúde, principal público alvo deste serviço.
Além das análises sobre as simulações, minerações de dados feitas na base do
DATASUS (M3) e outras informações decorrentes do conhecimento relativo à
Epidemiologia e em particular de doenças de informação obrigatória (sistemas de
conhecimento), serão disponibilizadas via Web (M8).
Assim, os oito módulos (M1 a M8) interagirão, de modo geral e sintético, da
seguinte maneira, ilustrada na figura 1 a seguir.
Figura 1: Diagrama de Inter-relacionamento dos Módulos do Projeto
O cronograma de execução das atividades é mostrado na figura 2 apresentada a
seguir.
Atividades / meses
Integração inicial da equipe
Especificação geral do Sistema e definições de
padrões
Modelagem bio-matemática
3
6
9
12 15 18 21 24
Especificação e implementação dos métodos e
estratégias de solução
Solução paralela e distribuída para as simulações
Sistema Web de Acompanhamento de Projeto
(SWAP)
Sistema Web Integrado
Epidemiológicas (SWIIE)
de
Informações
Sistema de Conhecimento
Sistema de Interface
Avaliações e testes
Produção bibliográfica
Figura 2: Cronograma geral do Projeto
5. OBJETIVOS E METAS
Objetivos: Desenvolver e aplicar requisitos, métodos, técnicas, algoritmos e produtos
de software para produzir, a partir de modelagens biofísica e matemática de fenômenos
epidemiológicos, envolvendo bases de dados provenientes do sistema de informações
em saúde, software para fins de estudos epidemiológicos e ações de vigilância visando
efetuar contribuições no âmbito da computação e da saúde pública.
Metas: Implementar o Sistema Epidemiológico atingindo as seguintes metas:
1) O registro de informações relativas a determinadas doenças de notificação
obrigatória. Esse registro é feito pelas Unidades Básicas de Saúde, hospitais e
laboratórios de análise clínica, entre outras unidades de coleta das informações.
Essas informações, digitadas em formulário eletrônico disponível pelo sistema web
serão armazenadas no servidor web agregado ao mini-cluster, instalado no Centro
de Vigilância Epidemiológica facilitando o repasse ao banco de dados do
DATASUS;
2) A disponibilização de informações à sociedade, via sistema web, relativas às
doenças de notificação obrigatória, e outras informações relevantes aos gestores da
saúde pública. A disponibilização de determinadas informações pode ser de acesso
restrito aos profissionais da saúde, saúde pública e gestores, que poderão utilizar
outros atributos do sistema para o tratamento espaço-temporal das informações
disponíveis;
3) A disponibilização via web, aos profissionais e gestores em saúde, de sistemas
computacionais baseados em conhecimento (sistemas especialistas) sobre
determinadas doenças de notificação obrigatória. Esses sistemas poderão auxiliar
esses profissionais na tomada de decisões, solução de problemas e transmissão de
conhecimento específico;
4) A simulação computacional de determinados eventos epidemiológicos para sua
melhor compreensão, com vistas a estabelecer ações de interesses, bem como
simular a propagação de determinadas doenças. O sistema computacional pode
disponibilizar aos usuários distintos cenários quanto à disseminação, prevenção ou
controle da doença, considerando aspectos como o tempo de geração e a capacidade
de transmissão da infecção. A raiva (ou outra doença, se for o caso) será o enfoque
nesta fase do projeto;
5) Interfaces com design e mecanismos de consulta que facilitem a utilização de
sistemas computacionais tanto com relação à manipulação do sistema e
interpretação das informações retornadas quanto da visualização das mesmas.
Objetivos específicos: O desenvolvimento do Sistema Epidemiológico implicará em um
trabalho coletivo, de uma equipe multidisciplinar, envolvendo o alcance dos seguintes
objetivos específicos:
1) A especificação e/ou adaptação de modelos matemáticos de fenômenos
epidemiológicos, em particular, da raiva (ou outra doença como Dengue e AIDS);
2) A produção e o tratamento de dados georeferenciados;
3) A engenharia de software do sistema (que não é trivial visto a atual inexistência de
metodologias já consolidadas para sistemas complexos);
4) O tratamento de grandes volumes de dados;
5) O desenvolvimento de um Sistema Web Integrado de Informações Epidemiológicas
para a cidade de Cascavel, passível de ser estendido, em uma segunda fase do
projeto, para o estado e a união;
6) A especificação e implementação paralela e distribuída do software de simulação;
7) O desenvolvimento de um hardware específico, denominado mini-cluster;
8) O desenvolvimento de um sistema de conhecimento constituído por sistemas
especialistas de determinadas doenças de notificação obrigatória;
9) O desenvolvimento de mecanismos de consulta apropriados aos usuários (uso de
linguagem natural) com preocupação particular com a visualização de dados e com
a interface;
10) A disponibilização do Sistema Web para Acompanhamento do Projeto cujo
objetivo é facilitar a interação da equipe e a administração do projeto;
Para atingir os objetivos e metas propostas, as atividades a serem desenvolvidas
foram detalhadas e especificadas, considerando a experiência e qualificação da equipe.
As atividades estão listadas no conjunto de ações de cada uma das estratégias 1, 2, 3, 4,
5, 6, 7 e 8, no item Metodologia e Estratégias de Ação.
6. CRONOGRAMA FÍSICO-FINANCEIRO,
DETALHAMENTO DOS EQUIPAMENTOS
AS
JUSTIFICATIVAS
E
Nesta seção apresenta-se o cronograma físico-financeiro do projeto juntamente
com as respectivas justificativas, e o detalhamento dos equipamentos solicitados.
6.1 Cronograma Físico-Financeiro
O cronograma físico-financeiro para o desenvolvimento do projeto é mostrado na
tabela 1, apresentada a seguir.
Tabela 1: Cronograma físico-financeiro
1º
semestre
2º
semestre
3º
semestre
4º
semestre
Total
Passagens
2.000,00
2.000,00
4.000,00
8.000,00
Diárias
2.000,00
2.000,00
4.000,00
8.000,00
Serviços técnicos 2.000,00
de terceiros
2.000,00
2.000,00
4.000,00
8.000,00
Material
Consumo
1.000,00
2.000,00
2.585,00
6.585,00
Custeio
de 1.000,00
Total de Custeio
30.585,00
Capital
Equipamentos
de Dados
P. 44.230,00
Ap.e Eletrônicos
5.940,00
M.Bibliográfico
5.000,00
26.981,00
71.211,00
5.940,00
5.000,00
5.000,00
15.000,00
Total de Capital
92.151,00
Bolsas (13)
DTI (1)
6.275,34
6.275,34
6.275,34
6.275,34
25.101,36
ITI (12)
21.600,00
21.600,00
21.600,00
21.600,00
86.400,00
Total de Bolsas
111.501,36
Total Geral
234.237,36
6.2 Justificativas dos Itens Solicitados
Os itens solicitados compreendem elementos de Custeio, Capital e Bolsas. Todos
eles estão diretamente relacionados ao objeto e às atividades propostas neste projeto.
Suas justificativas são as seguintes:
Quanto ao Custeio, as passagens e diárias serão utilizadas para o deslocamento de
integrantes deste projeto para participarem de eventos e atividades e/ou visitas técnicas
pertinentes ao projeto a centros de pesquisa (a exemplo do LNCC e Unicamp). Além
disso, espera-se subsidiar a estada de pesquisadores visitantes convidados para que
participem de atividades técnicas junto ao grupo, na UNIOESTE. O material de
consumo previsto refere-se à compra de itens como resmas de papel e torner para a
impressora. Quanto aos serviços técnicos de terceiros, eles se limitarão a serviços de
instalações e adaptações necessárias ao adequado funcionamento e segurança dos
equipamentos.
Quanto ao Capital, estão previstas as aquisições de computadores, aparelhos de
condicionamento de ar e material bibliográfico. Quanto aos computadores solicitados,
cuja configuração está detalhada na próxima seção, eles são fundamentais para a
consecução do projeto, e em sua quase totalidade, constituirão o Laboratório de
Sistemas Complexos (COMPLEX) que se pretende montar na UNIOESTE do campus
de Cascavel. Foram solicitados dois servidores web, um para atender o COMPLEX em
suas necessidades gerais e outro para atender às demandas por parte do Sistema Web de
Acesso a Informações Epidemiológicas (SWAIE) que estará agregado ao mini-cluster.
Os componentes solicitados no item 2 do detalhamento dos equipamentos
solicitados serão utilizados para a construção do mini-cluster. É neste mini-cluster que
serão feitos os processamentos necessários para atender as demandas dos sistemas de
simulação e dos demais sistemas web que serão construídos. O mini-cluster será
instalado no rack também solicitado. Os treze computadores e o switch serão instalados
no COMPLEX e serão utilizados pela equipe proponente e os bolsistas. Foi também
solicitada uma impressora a laser para atender as demandas do COMPLEX. Os dois
condicionadores de ar solicitados atenderão o COMPLEX e a instalação onde ficará o
mini-cluster, respectivamente. O material bibliográfico solicitado ficará disponibilizado
no COMPLEX para consulta. Cabe dizer que outras necessidades do COMPLEX com
relação a mobiliário, obras de reforma, manutenção, comunicação e higiene serão
atendidas pela UNIOESTE enquanto contra partida.
Quando às bolsas, foram solicitadas treze de longa duração, sendo uma de
Desenvolvimento Tecnológico Industrial (DTI) e doze de Iniciação Tecnológica
Industrial (ITI). A bolsa de DTI se justifica visto que os integrantes deste projeto
entenderam que este bolsista seria o responsável pela realização de algumas atividades
operacionais, logísticas e técnicas demandadas pelo projeto. A ele caberá também
facilitar a integração da equipe de bolsistas. Ele estará subordinado diretamente ao
coordenador geral do projeto. A necessidade dos doze bolsistas ITI se justifica visto que
eles estarão alocados estrategicamente em cada um dos oito módulos descritos na seção
três. Pretende-se efetuar a seguinte distribuição: 2 bolsistas para a Modelagem BioMatemática (M1), 1 bolsista para Tratamento de dados Georeferenciados (M2), 1
bolsista para Seleção de Características (M3), 1 bolsista para Engenharia de Software
(M4), 2 bolsistas para a construção Paralela e Distribuída (M6) dos Métodos e
Estratégias de Solução (M5) construídos; 1 bolsista para Visualização Científica (M7),
1 bolsista para Mineração de Dados (M3), e 3 bolsistas para atuar nos Sistemas Web
que se pretende desenvolver (M8). Todos os bolsistas ITI estarão sob orientação e
acompanhamento por parte dos pesquisadores associados a cada um dos oito módulos.
6.3 Detalhamento dos Equipamentos Solicitados
A seguir são apresentados os detalhes dos equipamentos solicitados.
1.
Servidor Web: Quad Core Q6600, Placa Mãe Intel DOXQ35MPE Memória 4GB
DDR, HD 400 GB, Vídeo G-Force 128 PCI Express, Fonte 500W, Conjunto
mouse, teclado, gabinete, Gravador DVD;
2.
Minicluster (componentes para montar cluster com nodos multiprocessados): Quad
Core Q6600, Placa Mãe Intel DOXQ35MPE Memória 4GB DDR, HD 400 GB,
Vídeo G-Force 128 PCI Express, Fonte 500W, Conjunto mouse, teclado, gabinete,
Gravador DVD;
3.
Switch 24 portas + 2 Gigabit DLINK DES 1026G;
4.
Rack para o mini-cluster: Rack 19” 40Ux77mm, Kit de fixação porca e parafuso,
Kit de ventilação com 4 ventiladores, Bandeja fixa 700;
5.
Computadores: Dual Core E4440, Placa Mãe Intel 945GNL, Memória 2GB DDR,
HD 400 GB Vídeo G-Force 128 PCI Express, Fonte 500W, Conjunto mouse,
teclado, gabinete, Gravador DVD, Monitor LCD 17";
6.
Impressora P2014 Laser Jet Monocromática – HP;
7.
Condicionador de ar 30.000 BTUs Consul CCF30.
7. RELEVÂNCIA E IMPACTO DOS RESULTADOS
Este projeto é relevante, principalmente devido a seus impactos e resultados em
três grandes áreas: na vigilância epidemiológica, na modelagem computacional de
sistemas complexos e em aspectos acadêmicos no contexto da UNIOESTE.
Com relação aos impactos e resultados relativos à vigilância epidemiológica, o
presente projeto possibilitará:
a)
Analisar variações geográficas, temporais e sociais na distribuição de casos de
doenças epidemiológicas, como parte do conjunto de ações de vigilância
epidemiológica para prevenção e controle da doença;
b) Identificar situações que requeiram a realização de estudos e pesquisas específicas
ou a adoção de medidas para ampliar o conhecimento sobre situações
epidemiológicas em Cascavel, no Paraná e no Brasil;
c)
Subsidiar processos de planejamento, gestão e avaliação de políticas públicas e
ações de saúde direcionadas complementarmente aos processos que já estão sendo
desenvolvidos e oferecidos pelo Sistema de Informação de Agravos de Notificação
(SINAN), vinculado à Secretaria de Vigilância em Saúde do Governo Federal;
d) Disponibilizar em ambiente web, o Sistema Web de Acesso a Informações
Epidemiológicas, atentando para aspectos de usabilidade e mecanismos
facilitadores para obtenção de informações.
Com relação a contribuições sobre modelagem computacional de sistemas
complexos, no âmbito da Computational Science, o presente projeto contribuirá para,
mais especificamente:
a)
Obter conhecimentos sobre desenvolvimento de sistemas complexos e assim
capacitar institucionalmente a equipe tornando-a competente em modelagem
computacional e processamento paralelo na área da epidemiologia, e assim poder:
• Realizar atividades de consultoria, transferência de tecnologia e fornecimento de
sistemas de informação em epidemiologia, além de oferecer cursos de formação
e qualificação na área;
• Dar suporte às agências de saúde pública para implantar e/ou melhorar a coleta
de dados georeferenciados, gerência e manutenção de bases de dados de saúde
georeferenciadas;
• Dar suporte no desenvolvimento de mini-clusters;
b) Criar, avaliar, modificar, compor, gerenciar e explorar modelos computacionais
voltados a fenômenos epidemiológicos;
c)
Discutir sobre formas diferentes de projetar e implementar sistemas, considerando
demandas em termos de complexidade, grandes volumes de dados, uso da web, e
atendimento a diferentes usuários finais;
d) Discutir métodos de extração de requisitos que capturem variáveis relativas a
modelos computacionais e interações sociais e sua respectiva documentação;
e)
Discutir sobre metodologias e técnicas que atendam necessidades inerentes a
sistemas complexos e sua execução em ambiente paralelo e distribuído;
f)
Discutir sobre estruturas de armazenamento para atender demandas específicas de
sistemas complexos;
g) Discutir sobre estruturas de visualização científica em atendimento a demandas
específicas de sistemas complexos;
h) Utilizar processamento paralelo e distribuído com recursos heterogêneos de
hardware e software;
i)
Propor e desenvolver interface com design e mecanismos de consulta que facilitem
a utilização de sistemas computacionais tanto com relação à manipulação do
sistema quanto à interpretação das informações retornadas;
j)
Definir, utilizar e disponibilizar sistema web para administração
desenvolvimento colaborativo de projeto por equipe multidisciplinar.
de
Com relação aos impactos e resultados acadêmicos no contexto dos grupos de
pesquisa envolvidos no projeto, bem como da UNIOESTE:
a)
Fortalecer a equipe proponente de mestrado multidisciplinar em computação
aplicada;
b) Aumentar a produção bibliográfica da equipe através da submissão dos resultados
do projeto em conferências e periódicos;
c)
Possibilitar o trabalho multidisciplinar envolvendo alunos e professores de
graduação e pós-graduação, focados em problemas comuns (ambientes de
aprendizado experimental e colaborativo);
d) Contribuir para a promoção de maior interação entre disciplinas ofertadas e
trabalhos propostos pelos cursos Informática e de Matemática (Física e Estatística)
da UNIOESTE;
e)
Intensificar as interações entre a equipe deste projeto e outros grupos e
pesquisadores com interesses afins;
f)
Melhorar os recursos bibliográficos atualmente disponíveis para desenvolvimento
de pesquisas no Laboratório de Computação de Alto Desempenho – LCAD e no
Laboratório de Eletrônica Digital – LED.
Para finalizar, cabe mencionar ainda sobre dois aspectos importantes, a questão do
mérito deste projeto e trabalhos futuros dele decorrentes.
Com relação ao mérito deste trabalho a equipe proponente entende que ele é
desafiador, importante e inovador; seus resultados podem ser aplicados e pode impactar
significativamente em termos sócio-econômicos.
É desafiador porque, do ponto de vista computacional, contempla aspectos
inerentes à modelagem computacional de sistemas complexos, como aqueles
explicitados no item 3 Identificação e Caracterização do Objetivo do Projeto. Ele
também é desafiador porque a equipe construirá um mini-cluster para atender a
demandas de processamento paralelo e distribuído. Neste caso, poderão participar do
projeto, docentes do Curso de Engenharia Elétrica, que também é oferecido pela
UNIOESTE. Note-se que, por priorizar a utilização de produtos de software livre, está
em consonância com os anseios dos Governos quanto à minimização de custos e
socialização de resultados.
É importante porque disponibilizará via web, a pessoas e entidades ligadas à
saúde, sistemas computacionais baseados em conhecimento, a exemplo de sistemas
especialistas sobre doenças de notificação obrigatória. Esses sistemas poderão auxiliar
esses profissionais na solução de problemas referentes a essas doenças, sem a presença
física obrigatória de especialistas no local em que os mesmos se apresentem. Também é
importante porque suas interfaces serão projetadas com design e mecanismos de
consulta que facilitem a utilização dos sistemas computacionais, a interpretação das
informações retornadas e a visualização das mesmas.
Ele é inovador porque permitirá o registro de informações relativas a doenças
incluindo as de notificação obrigatória, via web. Este registro visa automatizar o
processo atualmente manual, demorado e sujeito à falhas, que fornece informações ao
DATASUS, bem como reunir outros dados e informações que permitam subsidiar
pessoas e entidades que são capazes de utilizá-las visando fundamentar ações de
relevância à saúde coletiva.
Além disso, seus resultados poderão ser utilizados imediata e diretamente pela
comunidade envolvida, em especial, profissionais em saúde, gestores e pesquisadores da
área. Isso significa melhoria direta da qualidade da saúde da comunidade de
Cascavel/PR.
E, a execução deste projeto contribuirá significativamente para o progresso e a
qualidade da formação de alunos de graduação e pós-graduação vinculados à
UNIOESTE, bem como da produção bibliográfica da equipe proponente.
Com relação a trabalhos futuros, em uma segunda fase deste projeto que
dependerá da continuidade do apoio dado, se pretende simular outros tipos de doenças.
Será possível também trabalhar com modelos “intra-indivíduos”, se for o caso, e neste
sentido, pretende-se agregar à atual equipe alguns profissionais de áreas como biologia
e medicina. Também se pretende estender o protótipo do Sistema Epidemiológico
desenvolvido de forma a ampliá-lo para atender o Estado do Paraná e a União,
agregando, modificando ou adequando certas funcionalidades.
8 REFERÊNCIAS BIBLIOGRÁFICAS
ANSELIN, L.; BAO, S. Exploratory Spatial Data Analysis Linking SpaceStat and
ArcView. In: Fischer, M. M. & Getis. A. Recent developments in spatial analysis.
New York: Springer, p. 35-59. 1997.
ARDIS, M. A., et al. A framework for evaluating specification methods for reactive
systems. IEEE Transactions on Software Engineering, v. 22, n. 6, p. 378-389. 1996.
ASSUNÇÃO, R. M. Estatística Espacial com Aplicações em Epidemiologia, Economia,
Sociologia. 7a Escola de Modelos de Regressão, São Carlos, SP. 2001.
BARABÁSI, A.; BONABEAU, E. Redes sem escala. In: Scientific American. SIAM,
junho/2003, n.13.
BEN, S. Designing the User Interface: Strategies for Effective Human-Computer
Interaction. Don Mills, ON: Addison-Wesley, 1992;
BERMAN, F., FOX, G., HEY, A. J. G., HEY, T. Grid Computing: Making the Global
Infrastructure a Reality. John Wiley & Sons, Inc. 2003.
BOMEL, P. Sistemas Multi-agentes e gestão de recursos renováveis. In: Simpósio
Brasileiro de Sensoriamento Remoto. Florianópolis: SBSR, 2007.
BOSCARIOLI, C. Pré-processamento de Dados para Descoberta de Conhecimento em
Banco de Dados: Uma Visão Geral. In: Unicentro. (Org.). Anais do III CONGED Congresso de Tecnologias para Gestão de Dados e Metadados do Cone Sul.
Guarapuava: Unicentro. 2005, v. I, p. 101-120.
BUYYA, R. High Performance Cluster Computing: Architecture and Systems. Prentice
Hall. v.1. 1999.
CÂMARA, G.; MONTEIRO, A. M.; DRUK, S.; CARVALHO, M. Sá. Análise espacial
e geoprocessamento. In: DRUCK, S.; CARVALHO, M. Sá; CÂMARA, G.;
MONTEIRO, A. M. Análise espacial de dados geográficos. Planaltina, DF:
Embrapa Cerrados, 2004, 209 p.
CARVALHO, L. A. V. Data Mining. A mineração de Dados no Marketing, Medicina,
Economia, Engenharia e Administração. 1 Ed. São Paulo: Érica. 2001.
CDC - Centers for Disease Control. Principles of Epidemiology. An Introduction to
Applied Epidemiology and Biostatistics. Atlanta, 2ª ed., 1992.
CODENOTTI, B.; LEONCINI, M.. Introduction to Parallel Processing International
Computer Science Series). Addison-Wesley Longman Publishing Co., Inc. 1992.
CODENOTTI, B.; LEONCINI, M. Introduction to Parallel Processing (International
Computer Science Series). Addison-Wesley Longman Publishing Co., Inc. 1992.
DATASUS. Disponível em: http://w3.datasus.gov.br/datasus.
DUARTE, I.; ALMEIDA, M.; NETO, M. M. Uma Ferramenta para Mineração Visual
de Dados utilizando LifeLines. In: Sétima Escola Regional de Computação BahiaSergipe. Vitória da Conquista – BA. 2007.
DUNHAM, M. H. Data Mining: Introductory and Advanced Topics. Prentice-Hall.
2002.
EDELSTEIN-KESHET, L. Mathematical Models in Biology. Classics in Applied
Mathematics. SIAM. 2005. 586 p.
ELSMARI, R.; NAVATHE, S. B. Sistemas de Banco de Dados. 4ª Edição. Pearson
Addison Wesley. 2005
FOSTER, I. Designing and Building Parallel Programs (Online). Disponível em
http://www-unix.mcs.anl.gov/dbpp/, consultado em 08/10/2007.
GALVÃO, C.; CIRNE FILHO, W.; BRASILEIRO, F.; BRASILEIRO, E., ARAÚJO, E.
Computação em grid aplicada à análise de sistemas de abastecimento de água. In:
Seminário Hispano-Brasileiro sobre Sistemas de Abastecimento Urbano de Água IV SEREA, João Pessoa. 2004.
GOMES, M. C. Notas de Aulas em: Dinâmica Populacional, Modelos Biomatemáticos,
Epidemiologia de Doenças Transmissíveis, e Introdução às Redes. Disponível em
<http://correio.fc.ul.pt/%7Emcg/index.html>. 2007.
HAN, J.; KAMBER, M. Data Mining: Concepts and Techniques. The Morgan
Kaufmann Series in Data Management Systems, Jim Gray. 1ª Edição. ISBN 155860-489-8. 2000.
HARRISON, T. H. Intranet Data Warehouse. 1a. Ed. São Paulo: Berkeley Brasil. 1998.
HETHCOTE, H. W. The mathematics of infectious diseases. SIAM Rev. Philadelphia,
PA, USA, v.42, n.4, p.599–653. 2000.
HOPPENSTEADT, F. C., PESKIN, C. S. Modeling and Simulation in Medicine and the
Life Sciences. Springer-Verlag. 2004. 376 p.
IEEE Std. 610.12-1990. IEEE Standard Glossary of Software Engineering Terminology.
The Institute of Electrical and Electronics Engineers: New York. 1990.
INTEL
MULTICORE.
Acessado
em
outubro
http://www.intel.com/multi-core/index.htm.
2007.
disponível
em
JOST, G. et al .Comparing the OpenMP, MPI, and Hybrid Programming Paradigm on
an SMP Cluster. Acessado em outubro 2007. Disponível em: <http://www.rz.rwthaachen.de/computing/events/2003/ewomp03/omptalks/Tuesday/Session7/T06p.pdf
>.
KEENER, J., SNEYD, J. Mathematical Physiology. Springer-Verlag. 2001. 792 p.
KEIM, D. A. Information Visualization and Visual Data Mining. In: IEEE Transactions
On Visualization And Computer Graphics. Piscataway – USA: IEEE Educational
Activities Department, 2002, p. 1 – 8.
KOEHLER, E. Simulação de epidemias e estratégias de imunização em redes
complexas. Trabalho de Conclusão de Curso (Graduação em Bacharelado Em
Informática), Universidade Estadual do Oeste do Paraná. 2004.
KOTONYA, G., SOMERVILLE, I. Requirements Engineering: Processes and
Techniques, John Wiley & Sons. 1997
LAST, J. A Dictionary of Epidemiology. Oxford University Press, 1988. 141 p.
LEE, H. D. Seleção de Atributos Importantes para a Extração de Conhecimento de
Bases de Dados. Tese de Doutorado. Instituto de Ciências Matemáticas e de
Computação (ICMC). Universidade de São Paulo, São Carlos/SP, 2005.
LEWIS, B.; BERG D. Multithreaded Programing with Pthreads. Sun Mycrosystems
Press. Mountain View. 1998.
LUKSCH, P.; MAIER, U.; RATHMAYER, S.; WEIDMANN, M. SEMPA, Software
Engineering for Parallel Sicentific Computing. In: IEEE Concurrency, pg 64-72,
1997.
MCCORMICK, B. H.; DEFANTI, T. A.; BROWN, M. D. Visualization in scientific
computing – a synopsis. IEEE Computer Graphics & Applications, 7, 61-70. 1987.
MURRAY, J. D. Mathematical Biology I: An Introduction. Springer-Verlag. 2002. 551
p.
MURRAY, J. D. Mathematical Biology II: Springer-Verlag. 2003. 736 p.
NAFFAH FILHO, M.; CECÍLIO, M. A. M. A Política Estadual de informação de
Saúde:
um
debate
necessário.
Disponível
em:
http://portal.saude.sp.gov.br/resources/
profissional/documentos_tecnicos/estudos_analises/politica_estadual_de_informaca
o%5Bmichel_e_monica%5D.pdf, consultado em 08/10/2007.
NORMAN, K. L. The design of electronic educational envirorments: issues and
principles in human-computer interaction. In: Congresso Internacional de
Ergonomia e Usabilidade. Design de Interfaces e Interação Humano-Computador,
2, 2003. Anais. RJ.
NOVAK, M. A. Evolutionary Dynamics: Exploring the Equations of Life. Belknap
Press. 2006. 384 p.
NOVAK, M. A., MAY, R. Virus Dynamics: Mathematical Principles of Immunology
and Virology. Oxford University Press. 2001. 256 p.
OLIVEIRA, P. M. C. Autômatos Celulares. In: Complexidade e Caos. Rio de Janeiro:
Editora UFRJ/COPEA, 1999.
OPENMP: Simple, Portable, Scalable SMP Programming. Acessado em outubro 2007.
Disponível em: <http://www.openmp.org/>.
PACHECO, P. S. Parallel Programing with MPI. Morgan Kaufmann Publishers Inc.
Boston. 1997.
PASTOR-SATORRAS R.; VESPIGNANI A. Epidemic spreading in scale-free
networks. Phys Rev Lett, 86, 3200-3203. 2001.
PEIXOTO M. S.; BARROS L.C. Um Estudo de Autômatos Celulares para o
Espalhamento Geográfico de Epidemias com Parâmetro Fuzzy. TEMA Tend. Mat.
Apl. Comput., 5, No. 1, 125-133. 2004.
PFLEEGER, S. L. Engenharia de Software: Teoria e Prática. Prentice Hall. 2ª. Edição.
2004.
POPOWICH, F.; Hall, G. and Fass, D. Natural Language Edit Controls: Constrained
Natural Language Devices in User Interfaces. ICTAI, maio 1996.
PRESSMAN, R. S. Engenharia de Software. 6. ed. São Paulo: McGraw-Hill. 2006.
RUSSELL, S.; NORVIG, P. Inteligência Artificial. Rio de Janeiro: Campus, 2004.
Saúde:
um
debate
necessário.
Disponível
em:
http://portal.saude.sp.gov.br/resources/profissional/documentos_tecnicos/estudos_a
nalises/politica_estadual_de_informacao%5Bmichel_e_monica%5D.pdf
SBC–Sociedade Brasileira de Computação. Grandes Desafios da Pesquisa em
Computação no Brasil–2006-2016. São Paulo: Sociedade Brasileira de
Computação. 2006.
SINAN.
Disponível
em
http://dtr2004.saude.gov.br/sinanweb/index.php?name
=SinanNet, consultado em: 05/10/2007.
SMITH, B.; BJORSTAD, P.; GROPP, W. Domain Decomposition: Parallel Multilevel
Methods for Elliptic Partial Differential Equations. Cambridge: Cambridge
University Pres, 1996.
SMITH, L.; BULL M. Development of mixed mode MPI /OpenMP applications.
Scientific Programming IOS Press. 83–98. Acessado em outubro 2007. Disponível
em: <http://www.ukhec.ac.uk/publications/reports/spr00078.pdf>.
SUH, W. Web Engineering: Principles and Techniques. Idea Group Publishing. 1999.
SUN, Y.; CHENG L. A Survey on Agent-Based Modelling and Equation-based
Modelling. Department of Computer Science. Georgia State University. Atlanta.
Disponível em: www.cs.gsu.edu/~csclicx/Csc8350/model.pdf.
TERRAVIEW: principal: DPI/INPE. Disponível em: http://www.dpi.inpe.br/terra view.
VIS5D+ Home Page. Disponível em: http://vis5d.sourceforge.net/.
VISIT Visualization Tool. Disponível em: http://www.llnl.gov/visit.
VTK Home Page. Disponível em: http://www.vtk.org/index.php.
WALDMAN, E. A. Vigilância em Saúde Pública. Disponível em: http://dtr2004.
saude.gov.br/dab/saude_cidadania/ed_07/index.html, consultado em: 05/10/2007.
WRITELY. Google Textos e Planilhas. Disponível em http://www.google.com/googled-s/intl/pt-BR/tour2.html, consultado em 06/10/2007.
YANG, H. M. Epidemiologia Matemática: Estudo dos Efeitos da vacinação em
Doenças de Transmissão Direta. Editora da UNICAMP. 2001. 239 p.
Download

EPIDEMIO – SISTEMA COMPUTACIONAL WEB INTEGRADO